Оценивание, проверка статистических гипотез. Методические указания.
I. Из генеральной совокупности X сделана выборка объема n = 200. Требуется на основании этой выборки сделать аргументированное заключение о законе распределения генеральной совокупности и её основных числовых характеристиках. Для этого необходимо:
а) найти статистический ряд с числом интервалов, равным, например, 12;
б) построить гистограмму;
в) найти статистическую функцию распределения и построить ее график;
г) найти точечные оценки математического ожидания и дисперсии;
д) найти доверительный интервал для математического ожидания с заданной надёжностью (доверительной вероятностью);
е) на основании критерия согласия (Пирсона) проверить гипотезу о нормальном законе распределения генеральной совокупности.
II. По данным таблицы - группированной выборки двумерного вектора (X,Y), требуется найти выборочное уравнение прямой – линии линейной регрессии Y на X.
Каждому студенту преподаватель выдает для обработки выборку объема
n = 200 из таблицы нормально распределенных случайных чисел и группированную выборку двумерного вектора в виде таблицы.
Рассмотрим каждый этап выполнения работы.
1. Составление статистического ряда, гистограммы и нахождение точечных оценок математического ожидания и дисперсии.
В заданной выборке находим наименьший а и наибольший b элементы. Частное округляем до десятых, и полученное число берем в качестве шага разбиения h. Вводим отрезок ,длина которого 12 h , причем числа и подобраны так, чтобы ; и, кроме того, чтобы и имели не более двух знаков после запятой для простоты дальнейших вычислений.
Отрезок разбиваем точкам , x1, x2,…, x12 = , на 12 равных частичных интервалов затем определяем частоты ni, то есть число элементов выборки, попавших в каждый из частичных интервалов Δi и относительные частоты , i= 1, …,12.
Примечание. Если некоторые элементы выборки не попали на отрезок , то их условимся относить к ближайшему крайнему интервалу. Числа, совпадающие с границами частичных интервалов, условимся относить к левому интервалу. В качестве членов статистического ряда берем числа, являющиеся серединами частичных интервалов:
Результаты оформляются в виде таблицы (табл. 1).
Таблица 1
Номера интервалов | … | Примечания | ||||
Границы Интервалов | … | |||||
… | ||||||
… | ||||||
… |
Пример. Пусть нам дана следующая выборка
-0,669 0,392 -0,337 0,369 -1.694 | 0,035 0,106 0,199 -1,990 0,710 | -2,077 1,430 -0,160 -1,190 -0,655 | 1,077 -0,204 0,625 0,666 -0,546 | 0,525 -0,326 -0,891 -1,614 1,654 | -0,154 0,825 -1,464 0,082 0,134 | -0,537 1,214 1,353 -0,184 -0,529 | -1,036 0,091 0,466 -1,324 -0,915 | 0,882 -0,032 1,000 0,741 -0,898 | -0,402 -1,264 1,511 -0,264 0,799 |
0,985 -1,063 0,033 0,597 -1.601 | 0,340 -0,594 -1,527 0,362 -0,570 | 0,276 -1,526 1,422 -3,760 0,133 | 0,911 -0,787 0,308 1,159 -0,660 | -0,170 0,873 0,845 0,874 1,485 | -0 ,551 -0,405 -0,151 -0,794 0, 682 | -0,036 1,469 1,642 -0,358 0,104 | 0,679 -0,318 0,033 0,162 1,215 | -0,432 0,922 -0,838 0,064 0,686 | 0,678 0,522 -0,872 1,594 0,676 |
-0266 0,901 -1,433 1,327 -0,248 | -1,309 1,531 -1,008 0,703 0,788 | 0,597 -0,889 -0,990 -1,724 0,577 | 0,989 -1,019 0,090 -0,709 0,122 | 0,934 0,084 0,940 -1,100 -0,536 | 1,079 1,531 0,207 -1,346 0,293 | -0,999 0,638 -2,243 0,183 -0,126 | 0,015 1,297 -0,039 -0,163 1,627 | -0,094 -0,139 0,276 1,212 0,658 | -1,920 -0,157 -0,551 -0,452 1,348 |
-0,401 0,344 0,441 0,824 1,385 | -0,679 0,324 -0,372 0,040 1,320 | 0,921 0,686 -1,336 -1,734 -0,509 | 0,476 -1,487 0,062 0,261 -0,381 | 1,121 -0,136 1,506 0,054 -1,671 | -0,864 0,803 -0,315 -0,379 -0,524 | -0,656 -0,745 1,207 -0,961 1,298 | -0,220 0,932 0,838 -2,716 -1,248 | -1,566 -0,833 -0,304 0,823 0,346 | -0,144 -0,946 0,128 -0,112 -0,805 |
Составляем статистический ряд с 12 интервалами. Наименьший элемент выборки a =-3,760, наибольший b=1,654. Частное = = 0,451.
Округляя, получаем h=0,5.
12 h= 12. 0,5 = 6. Поэтому удобно взять
Составляем табл.2.
Построим гистограмму (рис. 1). Гистограмма представляет собой ступенчатую фигуру, составленную из прямоугольников, основания которых - частичные интервалыΔi = ; расположенные на оси абсцисс, высоты пропорциональны, а площади равны соответствующим частотам (см. пособие с. 122-126). В нашем примере все эти данные берем из таблицы 2 .
Гистограмма Рис. 1
Далее строим эмпирическую функцию распределения (см. пособие с. 86-89). Она имеет вид где - число элементов выборки, меньших х; здесь х - любое вещественное число. График эмпирической функции распределения представляет собой ступенчатую линию, определенную на всей числовой оси (рис.2). Значения этой функции заключены в промежутке [0,1]. Из таблицы 2 находим
Отсюда график эмпирической функции распределения имеет вид
|