Тема : Корреляционный и регрессионный анализ.
Задача 3.По заданной выборке ( , ) найти:
1) коэффициент корреляции;
2) уравнения линейной регрессии на и на ;
3) построить корреляционное поле и графики прямых регрессии.
-115 | -90 | -48 | -91 | -84 | |||||
-44 | -55 | -115 | -26 | -107 | |||||
-84 | -83 | -54 | -71 | -64 | |||||
-51 | -64 | -109 | -38 | -64 | |||||
-106 | -43 | -74 | -85 | -71 | |||||
-60 | -37 | -118 | -87 | -28 | |||||
-31 | -109 | -64 | -35 | -35 | |||||
-56 | -54 | -67 | -68 | -102 | |||||
-46 | -79 | -80 | -87 | -105 |
Решение.
Линейное уравнение регрессии является наиболее простой моделью корреляционной связи. Уравнения линий регрессии можно найти по формулам:
на : ;(1)
на : .(2)
Следует иметь в виду, что это две различные прямые. Первая прямая получается в результате решения задачи о минимизации суммы квадратов отклонений по вертикали, а вторая – при решении задачи о минимизации суммы квадратов отклонений по горизонтали.
В уравнении (1) коэффициент , который называется коэффициентом регрессии на на, показывает, на сколько единиц в среднем изменяется переменная при увеличении переменной на одну единицу.
В уравнении (2) коэффициент , который называется коэффициентом регрессии на , показывает, на сколько единиц в среднем изменяется переменная при увеличении переменной на одну единицу.
При прямолинейной форме связи показатель тесноты связи определяется по формуле коэффициента линейной корреляции:
.
Качественная оценка значения коэффициента линейной корреляции осуществляется на основе шкалы Чеддока:
Значения показателя тесноты связи | 0,1-0,3 | 0,3-0,5 | 0,5-0,7 | 0,7-0,9 | 0,9-0,99 |
Характеристика силы связи | Слабая | Умеренная | Заметная | Высокая | Весьма высокая |
Чем ближе к единице, тем сильнее связь между признаками.
Для вычисления коэффициента линейной корреляции для факторного ( ) и результативного ( ) признаков, а также коэффициентов уравнения регрессии, составим расчетную таблицу:
№ | |||||
-115 | -2645 | ||||
-44 | -396 | ||||
-84 | -1512 | ||||
-51 | -561 | ||||
-106 | -2332 | ||||
-60 | -780 | ||||
-31 | -217 | ||||
-56 | -672 | ||||
-46 | -460 | ||||
-90 | -1620 | ||||
-55 | -660 | ||||
-83 | -1494 | ||||
-64 | -896 | ||||
-43 | -387 | ||||
-37 | -296 | ||||
-109 | -2398 | ||||
-54 | -648 | ||||
-79 | -1264 | ||||
-48 | -480 | ||||
-115 | -2760 | ||||
-54 | -594 | ||||
-109 | -2398 | ||||
-74 | -1184 | ||||
-118 | -2832 | ||||
-64 | -832 | ||||
-67 | -938 | ||||
-80 | -1360 | ||||
-91 | -1729 | ||||
-26 | -156 | ||||
-71 | -1065 | ||||
-38 | -304 | ||||
-85 | -1445 | ||||
-87 | -1566 | ||||
-35 | -280 | ||||
-68 | -952 | ||||
-87 | -1566 | ||||
-84 | -1512 | ||||
-107 | -2354 | ||||
-64 | -832 | ||||
-64 | -896 | ||||
-71 | -1065 | ||||
-28 | -168 | ||||
-35 | -280 | ||||
-102 | -2142 | ||||
-105 | -2310 | ||||
∑ | -3184 | -53238 |
Вычислим средние значения:
;
;
;
;
.
Выборочная дисперсия и среднеквадратическое отклонение переменной :
; ;
Выборочная дисперсия и среднеквадратическое отклонение переменной :
; .
Вычислим коэффициент корреляции:
=
Коэффициент корреляции –0,998. Абсолютное значение коэффициента корреляции близко к единице. Это дает возможность на основании шкалы Чеддока сделать вывод о том, что связь между факторным и результативным признаками весьма высокая. Отрицательное значение коэффициента свидетельствует о том, что связь обратная.
Найдем уравнение линии регрессии на :
-70,76; 14,82; –0,998; 5,174; 26,03.
Подставляем полученные значения в уравнение:
.Отсюда
(это означает, что при увеличении переменной на одну единицу переменная в среднем увеличивается на –5,0209 единиц, т.е. уменьшается на 5,0209 единиц).
Уравнение линии регрессии на :
. Отсюда
= –0,1984 +0,7831 (это означает, что при увеличении переменной на одну единицу переменная в среднем уменьшается на 0,1984 единиц).
Строим корреляционное поле. Для этого на координатной плоскости отмечаем все заданные пары чисел ( , ) (всего 45 точек). На этом же графике строим полученные линии регрессии.
Прямые регрессии на и на пересекаются в точке с координатами , в нашем примере (14,82; -70,76).
V. ВАРИАНТЫ КОНТРОЛЬНЫХ ЗАДАНИЙ
Теория вероятностей
Задание:
1. Переписать текст задачи, заменяя все параметры их значениями для решаемого варианта.
2. Вычисления произвести, по возможности, точно.
3. Построить требуемые графики.
Задача 1. Бросают две монеты. Найти вероятность того, что:
1) на обеих монетах появится «герб»,
2) хотя бы на одной монете появится «герб»;
3) ни на одной монете не появится «герб»;
Бросают три монеты. Найти вероятность того, что:
4) на всех монетах появится «герб»;
5) хотя бы на одной монете появится «герб»;
6) только на двух монетах появится «герб»;
7) только на одной монете появится «герб»;
8) ни на одной монете не появится «герб».
Бросают четыре монеты. Найти вероятность того, что:
9) на всех монетах появится «герб»;
10) хотя бы на одной монете появится «герб»;
11) только на одной монете появится «герб»;
12) только на двух монетах появится «герб»;
13) только на трех монетах появится «герб»;
14) ни на одной монете не появится «герб».
Бросают игральную кость. Найти вероятность того, что на верхней грани появится:
15) четное число очков;
16) «1» или «6».
Бросают две игральные кости. Найти вероятность того, что на верхних гранях появятся следующие числа очков:
17) только четные;
18) одно четное, другое нечетное;
19) сумма которых четна;
20) сумма которых нечетна;
21) сумма которых больше, чем их произведение;
22) сумма которых меньше шести;
23) сумма которых больше восьми.
Бросают три игральные кости. Найти вероятность того, что на верхних гранях появятся следующие числа очков:
24) только четные;
25) одно четное, остальные нечетные;
26) сумма которых четна;
27) сумма которых нечетна;
28) которые все одинаковы;
29) которые все различны;
30) сумма которых делится на четыре.
Задача 2. Слово составлено из карточек, на каждой из которых написана одна буква. Затем карточки смешивают и вынимают без возврата по одной. Найти вероятность того, что буквы вынимаются в порядке заданного слова.
Слова по вариантам:
1.КИБЕРНЕТИКА | 2.ПОДПРОГРАММА |
3.ПРОГРАММА | 4.ПРОЦЕДУРА |
5.ПРОГРАММИСТ | 6.СЕРДЕЧНИК |
7.ПОЛУПРОВОДНИК | 8.ПРИСВАИВАНИЕ |
9.ПРОГРАММИРОВАНИЕ | 10.ПРОЦЕССОР |
11.УСЛОВИЕ | 12.ИНТЕГРАЛ |
13.ДИСКЕТА | 14.ПАМЯТЬ |
15.СТАТИСТИКА | 16.КАЛЬКУЛЯТОР |
17.СОБЫТИЕ | 18.УСТРОЙСТВО |
19.ВЫЧИСЛИТЕЛЬ | 20.ПЕРФОЛЕНТА |
21.СЛУЧАЙНОСТЬ | 22.ПЕРФОКАРТА |
23.ВЕРОЯТНОСТЬ | 24.МАГНИТ |
25.АЛГОРИТМ | 26.ОПЕРАЦИЯ |
27.БЛОК-СХЕМА | 28.ТРАНЗИСТОР |
29.АРИФМЕТИКА | 30.ТЕЛЕГРАММА |
Задача 3. Как и в предыдущей задаче, найти соответствующую вероятность случая, когда заданным словом является ваша фамилия и ваше имя.
Задача 4. В урне содержится черных и белых шаров. Случайным образом вынимают шаров. Найти вероятность того, что среди них имеется:
а) белых шаров;
б) меньше, чем белых шаров;
в) хотя бы один белый шар.
Значения параметров , , и по вариантам приведены в таблице:
Вариант | Вариант | ||||||||
Задача 5. Устройство состоит из трех независимых элементов, работающих в течение времени безотказно соответственно с вероятностями , и . Найти вероятность того, что за время выйдет из строя:
а) только один элемент;
б) хотя бы один элемент.
Значения параметров вычислить по следующим формулам:
*)
.
Задача 6. В первой урне белых и черных шаров, а во второй урне белых и черных шаров. Из первой урны вынимают случайным образом шаров, а из второй — шаров. Найти вероятность того, что среди вынутых шаров:
а) все шары одного цвета;
б) только три белых шара;
в) хотя бы один белый шар.
Значения параметров , , , , и по вариантам приведены в таблице:
Вариант | Вариант | ||||||||||||
Задача 7. В урне содержится черных и белых шаров, к ним добавляют белых шаров. После этого из урны случайным образом вынимают шаров. Найти вероятность того, что все вынутые шары белые, предполагая, что все возможные предположения о первоначальном содержании урны равновозможны.
Значения параметров , и по вариантам приведены в таблице:
Вариант | Вариант | ||||||
Задача 8. В одной урне белых и черных шаров, а в другой — белых и черных шаров. Из первой урны случайным образом вынимают шаров и опускают во вторую урну. После этого из второй урны также случайно вынимают шаров. Найти вероятность того, что все шары, вынутые из второй урны, белые.
Значения параметров , , , , и по вариантам приведены в таблице:
Вариант | Вариант | ||||||||||||
Задача 9. В пирамиде стоят винтовок, из них с оптическим прицелом. Стрелок, стреляя из винтовки с оптическим прицелом, может поразить мишень с вероятностью , а стреляя из винтовки без оптического прицела, — с вероятностью . Найти вероятность того, что стрелок поразит мишень, стреляя из случайно взятой винтовки.
Значения параметров вычислить по следующим формулам:
,
,
Задача 10. В монтажном цехе к устройству присоединяется электродвигатель. Электродвигатели поставляются тремя заводами-изготовителями. На складе имеются электродвигатели этих заводов соответственно в количестве , и штук, которые могут безотказно работать до конца гарантийного срока с вероятностями соответственно , и . Рабочий берет случайно один электродвигатель и монтирует его к устройству. Найти вероятности того, что смонтированный и работающий безотказно до конца гарантийного срока электродвигатель поставлен соответственно первым, вторым или третьим заводом-изготовителем.
Значения параметров вычислить по следующим формулам:
,
, , .
Задача 11.В каждом изнезависимых испытаний событие происходит с постоянной вероятностью . Вычислить все вероятности , где – частота события .
Значения параметров и вычислить по следующим формулам:
.
Задача 12.В каждом изнезависимых испытаний событие происходит с постоянной вероятностью . Найти вероятность того, что событие происходит:
а) точно раз;
б) меньше, чем и больше, чем раз;
в) больше, чем раз.
Значения параметров и , и вычислить по следующим формулам:
; ;
; .
Задача 13.На телефонной станции неправильное соединение происходит с вероятностью . Найти вероятность того, что среди соединений имеет место:
а) точно неправильных соединений;
б) меньше, чем неправильных соединений;
в) больше, чем неправильных соединений.
Значения параметров и , , и вычислить по следующим формулам:
, , ;
, ;
, .
Задача 14.Случайная величина задана функцией распределения:
Найти плотность распределения , построить графики функций и . Вычислить для ее математическое ожидание М(Х), дисперсию D(X), моду и медиану .
Значение параметра вычислить по формуле:
.
Задача 15.Задана случайная величина . Найти вероятность того, что эта случайная величина принимает значение:
а) в интервале ;
б) меньшее ;
в) большее ;
г) отличающееся от своего среднего значения по абсолютной величине не больше, чем на .
Значения параметров , , , и вычислить по формулам:
, , ,
, , .
Математическая статистика
ЗАДАНИЕ 1.
Для заданной выборки:
4) построить дискретный ряд распределения, составить таблицу частот;
5) построить полигон частот, кумуляту;
6) вычислить среднее значение , дисперсию и среднеквадратическое отклонение .
Вариант 1
Объем выборки: 69
Вариант 2
Объем выборки: 66
Вариант 3
Объем выборки: 82
Вариант 4
Объем выборки: 70
Вариант 5
Объем выборки: 81
Вариант 6
Объем выборки: 73
Вариант 7
Объем выборки: 64
Вариант 8
Объем выборки: 80
Вариант 9
Объем выборки: 79
Вариант 10
Объем выборки: 88
Вариант 11
Объем выборки: 86
Вариант 12
Объем выборки: 89
Вариант 13
Объем выборки: 71
Вариант 14