Лабораторная работа 1.2 Оценка параметров и определение закона распределения
Пример.Исследуется случайная величина ‒ число правонарушений в течение одних суток в некотором городе N. Получены данные за первые 150 суток года.
Цель работы. Требуется провести первичную статистическую обработку данных, проверить гипотезу о виде распределения случайной величины с помощью критерия согласия Пирсона. Расчетные соотношения. Данная задача решается с помощью статистических процедур Анализа данных и статистических функций библиотеки встроенных функций MS Excel. Приведем алгоритм решения задачи.
1. Ввод данных. В диапазон ячеек А1:АN ввести выборочные значения .
2. Построение вариационного ряда. Скопировать содержимое ячеек А1:АN в ячейки В1:ВN. Упорядочить выборочные значения, используя кнопку сортировки по возрастанию.
3. Построение статистического ряда выборки. В ячейки С1:СК ввести k различных выборочных значений. В меню Данные выделить строку Анализданных, выделить процедуру Гистограмма. В поле Входной интервал диалогового окна Гистограмма ввести ссылку на диапазон А1:АN. В поле Интервал карманов ввести ссылку на диапазон С1:СК. Активизировать поле Выходной интервал и ввести в это поле ссылку – левая верхняя ячейка, в которую будет введена таблица результатов решений. Установить флажок Вывод графика. Составить табл. 1.3 статистического ряда по следующему образцу:
Таблица 1.3
xi различные выборочные значения | ni частота выборочного значения xi | относительная частота выборочного значения xi | Накопленная относительная частота |
Первые столбцы заполнить копированием. Относительные и накопленные частоты вычислить с использованием формул.
4. Построение полигонов относительных и накопленных относительных частот.
Скопировать первый и третий столбцы табл. 1.3. Выделить их. Используя меню Вставка, применить к выделенным числам средство диаграммы Точечная. Полученный график есть полигон относительных частот. Если эти же действия проделать с первым и четвертым столбцами табл. 1.3, то получим полигон накопленных частот ‒ сглаженный график эмпирической функции распределения.
5. Определение выборочных характеристик. В меню Данные выделить подменю Анализ данных, выделить процедуру Описательная статистика, в поле ввода Входной интервал ввести ссылку на диапазон ячеек, содержащий статистические данные А1:АN. Установить флажок Итоговая статистика. Активизировать поле Выходной интервал, ввести в это поле ссылку – левая верхняя ячейка, в которую будет введена таблица результатов решений.
6. Проверка гипотезы о виде распределения случайной величины с помощью критерия согласия Пирсона. Заполнить табл. 1.4.
Таблица 1.4
xi различные выборочные значения | ni частота выборочного значения xi | Pi Теоретическая вероятность выборочного значения xi | Теоретическая частота выборочного значения xi |
Первые столбцы заполнить копированием, а оставшиеся ‒ вычисленными по формулам значениями. Если проверяется гипотеза о распределении Пуассона, то теоретические вероятности вычислить с помощью функции ПУАССОН(xi , ,0). - выборочное среднее, оно определяется в пункте 5, 0 – параметр, показывающий, что вычисляется вероятность того, что случайная величина, распределенная по закону Пуассона, принимает значение . Если проверяется гипотеза о биномиальном распределении случайной величины, то теоретические вероятности вычислить с помощью функции БИНОМРАСП(xi,N,P,0) , при этом вероятность успеха P в одном испытании определить по формуле где ‒ выборочное среднее. В случае других распределений воспользоваться справкой о статистических функциях библиотеки встроенных функций MS Excel.
Значение
является наблюдаемым значением случайной величины Число степеней свободы этой случайной величины равно r= k-2 при проверке гипотезы о распределении Пуассона и r= k-3, если проверяется гипотеза о биномиальном распределении. Критическое значение случайной величины определить с помощью функции =ХИ2ОБР(ɑ,r) , где ɑ ‒ уровень значимости. Полученное наблюдаемое значение сравнить с .
Если < , то гипотеза о виде распределения принимается при уровне значимости ɑ. Если > то гипотеза отвергается с уровнем значимости ɑ.
Решение. По предложенному алгоритму проведем первичную статистическую обработку данных. Согласно пункту 3 алгоритма находим k=11 различных выборочных значений
0 1 2 3 4 5 6 7 8 9 10
С помощью пакета Анализ данных получаем статистический ряд выборки и его графическое представление (рис. 1.3).
Рисунок 1.3.
Построенная гистограмма позволяет сделать предположение о виде распределения случайной величины X. В результате заполнения табл. 1.3 получим табл. 1.5, в третьем столбце которой, представлены относительные, а в четвертом – накопленные относительные частоты выборочных значений.
Таблица 1.5
xi | ni | ni/N | ni*/N | |
0,006667 | 0,006667 | |||
0,04 | 0,046667 | |||
0,106667 | 0,153333 | |||
0,146667 | 0,3 | |||
0,13 | 0,43 | |||
0,253333 | 0,733333 | |||
0,126667 | 0,36 | |||
0,036667 | 0,946667 | |||
0,04 | 0,936667 | |||
0,006667 | 0,993333 | |||
0,006667 |
Ряд1 |
Согласно пункту 4 алгоритма получим полигоны относительных и накопленных частот (рис. 1.4, 1.5).
Ряд1 |
Рисунок 1.5.
Согласно пункту 5 алгоритма получаем выборочные характеристики (табл. 1.6).
Таблица 1.6
Среднее | 4,493333 | |
Стандартная ошибка | 0,150637 | |
Медиана | ||
Мода | ||
Стандартное отклонение | 1,345534 | |
Дисперсия выборки | 3,405996 | |
Эксцесс | -0,12004 | |
Асимметричность | 0,130329 | |
Интервал | ||
Минимум | ||
Максимум | ||
Сумма | ||
Счет |
Проверим гипотезу о распределении случайной величины по закону Пуассона. В качестве точечной оценки параметра распределения выбираем выборочное среднее λ= = 4,49. В результате заполнения табл. 1.4 получим табл. 1.7. Наблюдаемое значение случайной величины х2 = 9,261528. Оно получено суммированием чисел последнего столбца табл. 1.6. Критическое значение X 2 =ХИ2ОБР ( а, r) = 16,91898, где а = 0,05 , r = k-2 = 11 - 2 = 9 . Так как < ,то гипотеза о распределении по закону Пуассона при уровне значимости а = 0,05 не противоречит опытным данным.
Таблица 1.7
xi | ni | Р' | ni' | ХИ2 | |
0,011133 | 1,677501 | 0,273626 | |||
0,05025 | 7,53756 | 0,313644 | |||
0,112396 | 16,93439 | 0,051557 | |||
0,169093 | 25,36393 | 0,446146 | |||
0,139943 | 23,49213 | 0,073142 | |||
0,170699 | 25,6049 | 6,00035 | |||
0,127335 | 19,17521 | 0,001601 | |||
0,032053 | 12,30365 | 0,033331 | |||
0,046039 | 6,913355 | 0,120667 | |||
0,02301 | 3,451554 | 1,741273 | |||
0,010339 | 1,550397 | 0,195635 | |||
9,261523 | |||||