Задание 2. ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ
1. По результатам задания 1 по виду гистограммы и полигона частостей, а также по значению выборочных коэффициентов асимметрии и эксцесса сделать предварительный выбор закона распределения
СВ Х и У.
2. Найти точечные оценки параметров нормального распределения, записать для него функцию плотности вероятности f(x) (f(y)) и функцию распределения F(x) (F(y)).
3. Найти теоретические частоты нормального распределения. Проверить согласие эмпирической функции распределения с теоретической, используя критерий согласия Пирсона для СВ Х и У. Построить эмпирические и теоретические кривые распределения.
Т а б л и ц а 7. Вычисление числовых характеристик СВ У
Интервалы наблюденных значений СВ У | Середины интервалов yi | Частоты mi | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() |
0,39–0,61 | 0,50 | – 0,429 | – 6,006 | 2,5760 | – 1,1051 | 0,4732 | ||
0,61–0,83 | 0,72 | 18,72 | – 0,209 | – 5,434 | 1,1362 | – 0,2374 | 0,0494 | |
0,83–1,05 | 0,94 | 27,26 | 0,011 | 0,319 | 0,0029 | 0,0000 | 0,0000 | |
1,05–1,27 | 1,16 | 20,88 | 0,231 | 4,158 | 0,9612 | 0,2214 | 0,0504 | |
1,27–1,49 | 1,38 | 12,42 | 0,451 | 4,059 | 1,8306 | 0,8253 | 0,3726 | |
1,49–1,71 | 1,60 | 4,8 | 0,671 | 2,013 | 1,3506 | 0,9060 | 0,6078 | |
1,71–1,93 | 1,82 | 1,82 | 0,891 | 0,891 | 0,7939 | 0,7074 | 0,6303 | |
Сумма | 92,9 | 8,6514 | 1,3176 | 2,1837 |
4. Найти доверительный интервал для оценки математического ожидания нормального распределения (доверительную вероятность принять 1-a=0,95).
Решение типового варианта
Методику выполнения этого задания покажем на результатах задания 1.
1. По виду гистограммы и полигона частостей (напоминают нормальную кривую), а также по значению выборочных коэффициентов асимметрии и эксцесса (Аs(X)=0,749, , они близки к нулю), предполагая, что СВ Х – стоимость основных производственных фондов изменяется под влиянием большого числа факторов, примерно равнозначных по силе влияния, можно выдвинуть гипотезу о том, что закон распределения СВ Х является нормальным.
2. Плотность вероятности нормального закона распределения имеет вид , или
Точечными оценками параметров а и s нормального закона распределения служат средняя выборочная и среднее выборочное квадратическое отклонение
, вычисленные ранее, т.е.
,
=0,251. Следовательно, плотность вероятности предполагаемого нормального закона распределения имеет вид
, или
.
Функция распределения предполагаемого нормального закона
.
Используя нормированную функцию Лапласа , функцию распределения нормального закона записывают в виде
, в нашем случае эта функция есть
, ее называют теоретической функцией распределения.
3. Проведем проверку гипотезы о нормальном законе распределения СВ Х, используя критерий согласия Пирсона . Для удобства вычислений интервалы наблюденных значений нормируют, т.е. выражают их в единицах среднего квадратического отклонения
:
, причем наименьшее значение ui полагают равным
, а наибольшее –
, эта замена производится для того, чтобы сумма теоретических частот была равной объему выборки. Далее вычисляют вероятность попадания СВ Х, распределенной по нормальному закону с параметрами
и
, в частичные интервалы
по формуле
После того как будут найдены находим теоретические частоты для каждого частичного интервала по формуле
, где
– теоретическая частота i-го интервала. Между теоретическими и эмпирическими частотами могут быть расхождения. Замену эмпирических частот теоретическими называют выравниванием частот статистического ряда.
Составим табл. 8 для вычисления теоретических частот СВ Х.
Для примера вычислений найдем вероятность того , что СВ Х попадет в первый частичный интервал , эта вероятность равна
. Аналогично находим
и т.д. Для вычисления значений функции Ф
использовано приложение 1. После этого вычисляют теоретические частоты
, например,
и т.д. Сумма теоретических частот должно быть равна объему выборки, т.е.
. Далее находим значение выборочной статистики
или это есть наблюдаемое значение критерия
. Затем по таблицам квантилей распределения
, по уровню значимости
=0,05 и числу степеней свободы
(где k – число частичных интервалов, r – число параметров предполагаемого закона распределения СВ X) находят критическое значение
, удовлетворяющее условию
. При использовании критерия
необходимо, чтобы в каждом частичном интервале было не менее 5 элементов. Если же число элементов менее 5, рекомендуется соседние интервалы объединять в один (как это сделано в табл.9). Уменьшенное число частичных интервалов учитывается при нахождении числа степеней свободы
.
Составим табл. 9 для вычисления .
Т а б л и ц а 9. Вычисление выборочной статистики CВ Х
Интервалы наблюдаемых значе- ний СВ Х | Эмпирические частоты ![]() | Теоретические частоты ![]() | ![]() | ![]() | ![]() |
0,465–0,675 0,675–0,885 0,885–1,095 1,095–1,305 1,305–1,515 1,515–1,725 1,725–1,935 | 3 17 | 4,75 20,33 15,58 30,07 29,55 15,40 4,06 20,05 0,59 | – 1,33 7,93 – 3,55 – 3,05 | 1,7689 62,8849 12,6025 9,3025 | 0,0870 2,0913 0,4264 0,4640 |
Сумма | ![]() |
Т а б л и ц а 8. Вычисление теоретических частот СВ Х
Интервалы наблюденных значений СВ Х | Частоты mi | Начало интервала ![]() | Конец интервала ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | Теоретические частоты ![]() |
0,465–0,675 | 0,465 | 0,675 | – ![]() | – 1,67 | – 0,5 | –0,4525 | 0,0475 | 4,75 | |
0,675–0,885 | 0,675 | 0,885 | – 1,67 | – 0,83 | – 0,4525 | –0,2967 | 0,1558 | 15,58 | |
0,885–1,095 | 0,885 | 1,095 | – 0,83 | 0,01 | – 0,2967 | –0,0040 | 0,3007 | 30,07 | |
1,095–1,305 | 1,095 | 1,305 | 0,01 | 0,84 | 0,0040 | 0,2995 | 0,2955 | 29,55 | |
1,305–1,515 | 1,305 | 1,515 | 0,84 | 1,68 | 0,2995 | 0,4535 | 0,1540 | 15,40 | |
1,515–1,725 | 1,515 | 1,725 | 1,68 | 2,52 | 0,4535 | 0,4941 | 0,0406 | 4,06 | |
1,725–1,935 | 1,725 | 1,935 | 2,52 | + ![]() | 0,4941 | 0,5 | 0,0059 | 0,59 | |
Сумма |
Число степеней свободы По таблице квантилей
(приложение 2) по уровню значимости
и числу степеней свободы
находим критическое значение
Так как
то нет оснований для отклонения гипотезы о нормальном законе распределения СВХ. Другими словами расхождения между эмпирическими и теоретическими частотами являются незначительными, т.е. случайными и предположение о распределении СВ Х по нормальному закону вполне согласуется с эмпирическим распределением выборки.
На рис.5 построены нормальная кривая по найденным теоретическим частотам и полигон эмпирических (наблюдаемых) частот.
4. Доверительный интервал для оценки математического ожидания случайной величины Х, распределенной по нормальному закону, (при n 30) находят по формуле
где квантили нормального распределения находят по таблицам функции Лапласа (приложение 1) из условия
– доверительная вероятность, в нашем случае
или
и
Точность оценки математического ожидания (предельная погрешность) есть
. Вычислим предельную погрешность
Искомый доверительный интервал, накрывающий математическое ожидания СВ Х, равен
Рис. 5.
Смысл полученного результата таков: если будет произведено достаточно большое число выборок по 100 значений СВ Х – стоимости основных производственных фондов, то в 95% из них доверительный интервал накроет математическое ожидание СВ Х и только в 5% случаев математическое ожидание может выйти за границы доверительного интервала.
Аналогичным образом выполним это задание для СВ У – стоимость валовой продукции (у. е /га).
1. По виду гистограммы и полигона частостей, а также по значению выборочных коэффициентов асимметрии и эксцесса ( выдвигаем гипотезу о том, что закон распределения СВ У является нормальным.
2. Плотность вероятности предполагаемого нормального закона распределения имеет вид
Функция распределения нормального закона для СВ У есть .
3. Вычислим теоретические частоты нормального распределения СВ У для проверки согласия эмпирической функции распределения с теоретической (табл.10).
Далее составим табл. 11 для нахождения выборочной статистики СВ У.
Число степеней свободы . По таблице (приложение 2 ) по уровню значимости
находим критическое значение
. Так, как
, то нет оснований для отклонения гипотезы о нормальном законе распределения СВ У.
На рис. 6 построены эмпирическая и теоретическая кривые распределения.
4. Для нахождения доверительного интервала для оценки математического ожидания СВ У вычислим предельную погрешность , тогда доверительный интервал равен
или
.
Рис. 6.
Т а б л и ц а 11. Вычисление выборочной статистики СВ У
Интервалы наблюдаемых значе- ний СВ У | Эмпирические частоты ![]() | Теоретические частоты ![]() | ![]() | ![]() | ![]() |
0,39–0,61 0,61–0,83 0,83–1,05 1,05–1,27 1,27–1,49 1,49–1,71 1,71–1,93 | 3 13 | 14,01 22,68 29,22 21,79 9,49 2,42 12,3 0,39 | – 0,1 3,32 – 0,22 – 3,79 0,7 | 0,01 11,0224 0,0484 14,3641 0,49 | 0,0007 0,4860 0,0017 0,6592 0,0398 |
Cумма | ![]() |
Задание 3. КОРРЕЛЯЦИЯ
1. По результатам задания 1 составить корреляционную таблицу.
2. Найти условные средние , построить точки
,
и по характеру их расположения подобрать вид функций регрессии.
3. Найти выборочный коэффициент корреляции и сделать вывод о силе корреляционной связи.
4. Найти доверительный интервал, накрывающий коэффициент корреляции генеральной совокупности с заданной доверительной вероятностью
.
5. Найти уравнения линий регрессии х на у и у на х и построить их.
Решение типового варианта
Методику выполнения этого задания покажем на примере статистических данных табл.1, где СВ Х – стоимость основных производст-
венных фондов (у. е /га), СВ У – стоимость валовой продукции (у.е/га).
1. Для составления корреляционной таблицы воспользуемся разбиением СВ Х и У на частичные интервалы (табл. 2 и 5). Сделаем подсчет частот системы СВ Х и У, рассматривая каждую пару значений табл.1. Например, первая пара (0,73; 0,60) попадает во вторую строку и первый столбец табл.8 и отмечается черточкой. Вторая пара значений (0,82; 0,61) попадает также во вторую строку и первый столбец, причем, значение 0,61 совпадает с концами интервалов 0,39–0,61 и 0,61–0,83; будем относить это число к тому интервалу, где наблюдается совпадение с правым концом, т.е. к интервалу 0,39–0,61. Третья пара (0,89; 0,95) – третья строка и третий столбец. Таким образом просматриваем все 100 пар значений системы СВ Х и У. В результате получим табл. 12.
Т а б л и ц а 12 .Подсчет частот системы СВ Х и У
У Х ![]() | 0,39–0,61 | 0,61–0,83 | 0,83–1,05 | 1,05–1,27 | 1,27–1,49 | 1,49–1,71 | 1,71–1,93 | ![]() |
0,465–0,675 | I | |||||||
0,675–0,885 | IIIIIIII | IIIIII | III | I | ||||
0,885–1,095 | IIIIII | IIIIIIIII IIIIII | IIIIIIIII IIII | III | I | |||
1,095–1,305 | IIII | IIIIIIIIII | IIIIIIIII | II | I | |||
1,305–1,515 | II | III | IIII | II | ||||
1,515–1,725 | II | I | ||||||
1,725–1,935 | I | II | ||||||
![]() |
Для дальнейших расчетов нужны будут середины интервалов, которые запишем под частичными интервалами.
Т а б л и ц а 10. Вычисление теоретических частот СВ У
Интервалы наблюденных значений СВ У | Частоты mi | Начало ин- тервала ![]() | Конец интер-вала ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | Теоретичес кие час- тоты ![]() |
0,39–0,61 | 0,39 | 0,61 | – ![]() | – 1,8 | –0,5 | –0,3599 | 0,1401 | 14,01 | |
0,61–0,83 | 0,61 | 0,83 | – 1,08 | – 0,34 | –0,3599 | –0,1331 | 0,2268 | 22,68 | |
0,83–1,05 | 0,83 | 1,05 | – 0,34 | 0,41 | –0,1331 | 0,1591 | 0,2922 | 29,22 | |
1,05–1,27 | 1,05 | 1,27 | 0,41 | 1,16 | 0,1591 | 0,3770 | 0,2179 | 21,79 | |
1,27–1,49 | 1,27 | 1,49 | 1,16 | 1,91 | 0,3770 | 0,4719 | 0,0949 | 9,49 | |
1,49–1,71 | 1,49 | 1,71 | 1,91 | 2,66 | 0,4719 | 0,4961 | 0,0242 | 2,42 | |
1,71–1,93 | 1,71 | 1,93 | 2,66 | + ![]() | 0,4961 | 0,5 | 0,0039 | 0,39 | |
Сумма |
В столбце табл.13 записаны суммы частот по строкам, а в строке
– суммы частот по столбцам.
, где n – объем выборки.
2. Находим условные средние по формуле
;
;
;
Т а б л и ц а 13. Корреляционная таблица системы СВ Х и У
У Х ![]() | 0,39– 0,61 0,50 | 0,61– 0,83 0,72 | 0,83– 1,05 0,94 | 1,05– 1,27 1,16 | 1,27– 1,491,38 | 1,49– 1,71 1,60 | 1,71–1,93 1,82 | ![]() |
0,465–0,675 0,57 | ||||||||
0,675–0,885 0,78 | ||||||||
0,885–1,095 0,99 | ||||||||
1,095–1,305 1,20 | ||||||||
1,305–1,515 1,41 | ||||||||
1,515–1,725 1,62 | ||||||||
1,725–1,935 1,83 | ||||||||
![]() |
;
;
;
;
.
Результаты вычислений заносим в табл. 14.
Т а б л и ц а 14 . Условные средние
![]() | 0,50 | 0,72 | 0,94 | 1,16 | 1,38 | 1,60 | 1,82 |
![]() | 0,87 | 0,96 | 1,10 | 1,25 | 1,36 | 1,34 | 1,62 |
Каждая пара значений представляет координаты точки. Построив эти точки в системе координат xoy, по их расположению делаем вывод о виде функции регрессии. Из чертежа видно, что расположение точек близко к прямой линии, поэтому можно считать, что зависимость х на у является линейной.
Аналогично находим условные средние по формуле
;
;
;
;
;
;
;
.
Результаты вычислений поместим в табл.15.
Т а б л и ц а 15. Условные средние
![]() | 0,57 | 0,78 | 0,99 | 1,20 | 1,41 | 1,62 | 1,83 |
![]() | 0,72 | 0,68 | 0,81 | 1,04 | 1,28 | 1,58 | 1,09 |
Точки построим на предыдущем чертеже и по их расположению делаем вывод о линейной зависимости у на х. Значит линии регрессии представляют собой прямые (рис.7).
3. Выборочный коэффициент корреляции находим по формуле
,
где из расчетов задания 1 известно, что ,
,
,
.
Остается найти . Воспользуемся корреляционной табл.13 и формулой
Рис. 7.
Выборочный коэффициент корреляции
По знаку и величине коэффициента корреляции делаем вывод о связи между СВ X и У: прямая линейная корреляционная зависимость, средняя связь.
Квадрат коэффициента корреляции называется коэффициентом детерминации, который показывает процент влияния СВ X на СВ У.
В нашем случае коэффициент детерминации равен
.
Вывод: примерно 42% составляет влияние стоимости основных производственных фондов на стоимость валовой продукции. Остальные 58% обусловлены влиянием других факторов.
4. Доверительный интервал для коэффициента корреляции генеральной совокупности с заданной доверительной вероятностью
находится по формуле
где
находится, используя функцию Лапласа:
, т.е. 0,95=Ф(t0,95). По значению функции Лапласа 0,95, по приложению 1 находим значение t0,95 = 1,96.
Подставим имеющиеся данные в формулу доверительного интервала: имеем
.
В результате вычислений получим доверительный интервал .
Вывод: если рассматривать большое число выборок системы СВ Х и У и для каждой из них найти коэффициент корреляции , то примерно в 95% из них доверительный интервал накроет коэффициент корреляции генеральной совокупности и только в 5% случаев
может выйти за границы этого интервала.
5. Найдем линейные уравнения функций регрессии. Уравнение регрессии у на х имеет вид: Подставляем имеющиеся данные:
имеем
преобразуя, получим
Аналогично составим уравнение регрессии x на y.
Построим эти прямые на чертеже (рис.7), учитывая, что они проходят через точку