Лементы математической статистики

В.Е. Гмурман. Глава 15, § 1-8; глава 16, § 1-4, § 8-10, § 14-16. Глава 19,

§ 1-7, § 23.

Рассмотрим характеристики случайных величин на основе опытных данных.

Определение: Генеральной совокупностью называется множество всех однородных объектов, подлежащих изучению.

Определение: Выборочной совокупностью (выборкой) называется совокупность случайно отобранных однородных объектов.

Определение: Объемом совокупности называется число объектов этой совокупности.

Определение: Последовательность наблюденных значений случайного признака Х генеральной совокупности, расположенных в порядке возрастания, называется вариационным рядом:

х1, х2,……,хn, (22)

а сами значения называются вариантами, то есть хi – варианта, i=1,2,……,n.

Пусть n – объем выборки , Х – изучаемая случайная величина, которая в результате наблюдений значение хi принимает тi раз; тi называется частотой варианты хi , а отношение лементы математической статистики - student2.ru называ6тся относительной частотой варианты, прием лементы математической статистики - student2.ru .

Размах выборки R – разность между максимальным и минимальным элементами выборки.

Естественной формой эмпирического закона распределения (этап обработки вариационного ряда) является статистический ряд – таблица частот, выборочный ряд – таблица относительных частот, полигон распределения, гистограмма, эмпирическая функция распределения.

Часто возникает задача нахождения подходящих приближенных значений (оценки) неизвестных параметров распределения количественного признака Х генеральной совокупности по данным выборки. Ниже рассмотрены определения статистических оценок параметров распределения: точечной и интервальной.

Определение: Точечной называют оценку неизвестного параметра распределения, которая определяется одним числом.

Выборочная средняя:

лементы математической статистики - student2.ru (23)

используется в качестве точечной оценки математического ожидания признака (случайной величины) Х генеральной совокупности.

Выборочная дисперсия:

лементы математической статистики - student2.ru (24)

используется в качестве точечной оценки дисперсии признака Х генеральной совокупности.

Выборочное среднее квадратическое отклонение:

лементы математической статистики - student2.ru (25)

Исправленное среднее квадратическое отклонение:

лементы математической статистики - student2.ru (26)

Выборочной модой М0 распределения называют варианту выборки с наибольшей частотой.

Выборочной медианойmе называют число, которое делит вариационный ряд на две части, содержащие равное число вариант.

Определение: Интервальной называют оценку неизвестного параметра, которая определяется двумя числами – концами интервала, покрывающего оцениваемый параметр.

Определение: Доверительным называют интервал, который с заданной надежностью (доверительной вероятностью) покрывает оцениваемый параметр.

Для оценки неизвестного параметра – математического ожидания а нормально распределенного количественного признака Х по выборочной средней лементы математической статистики - student2.ru при известном среднем квадратическом отклонении σ генеральной совокупности служит доверительный интервал

φγ= лементы математической статистики - student2.ru (27),

где лементы математической статистики - student2.ru =δ – точность оценки, n – объем выборки, t – значение функции Лапласа ф(t) (таблица в приложении учебника), при котором ф(t)= лементы математической статистики - student2.ru , где γ – надежность. При неизвестном σ доверительный интервал для оценки математического ожидания а имеет вид:

лементы математической статистики - student2.ru (28),

где s исправленное среднее квадратическое отклонение, tγ находится по таблице значений функции tγ=t(n,γ) по заданным n и γ (Таблица в приложении учебника).

Для оценки среднего квадратического отклонения σ нормально распределенного количественного признака Х с надежностью γ по исправленному выборочному среднему квадратическому отклонению s служат доверительные интервалы:

(S(1-q); S(1+q))(при q<1) (29)

(0 ; S(1+q))(при q>1) (30),

где q находится по таблице значений функции q=q(n, γ) по заданным n и γ. (Таблица в приложении учебника).

Задача 11. Из генеральной совокупности извлечена выборка:

2,0 2,6 2,8 2,4 2,8 2,2 2,0 2,6

2,6 2,6 2,4 2,2 2,4 2,8 2,4 2,6

2,4 2,4 2,4 2,2 2,6 2,0 2,0 2,8

2,2 2,8 2,6 2,2 2,0 2,8 2,0 2,8

2,4 3,2 2,6 3,2 2,6 2,6 3,0 2,2

Признак Х имеет нормальное распределение.

Требуется: 1)Составить вариационный, статистический и выборочный ряды распределения. Найти размах выборки. По полученному распределению выборки: 2) Построить полигон относительных частот; 3) Построить график эмпирической функции распределения; 4) Вычислить выборочную среднюю, выборочную дисперсию, выборочное исправленное среднее квадратическое отклонение, моду и медиану; 5) С надежностью γ=0,95 найти доверительные интервалы для математического ожидания и среднего квадратического отклонения изучаемого признака генеральной совокупности.

Решение: 1. Вариационный ряд состоит из различных чисел: 2,0; 2,0; 2,0; 2,0; 2,0; 2,0; 2,2; 2,2; 2,2; 2,2; 2,2; 2,2; 2,4; 2,4; 2,4; 2,4; 2,4; 2,4; 2,4; 2,4; 2,6; 2,6; 2,6; 2,6; 2,6; 2,6; 2,6; 2,6; 2,6; 2,6; 2,8; 2,8; 2,8; 2,8; 2,8; 2,8; 2,8; 3,0; 3,2; 3,2.

Статистический ряд – таблица частот имеет вид:

лементы математической статистики - student2.ru 2,0 2,2 2,4 2,6 2,8 3,0 3,2
лементы математической статистики - student2.ru

Таблица 2

В первой строке таблицы числа вариационного ряда, а во второй – их частоты.

Выборочный ряд – таблица относительных частот имеет вид:

Таблица 3

xi 2,0 2,2 2,4 2,6 2,8 3,0 3,2
wi 0,15 0,15 0,2 0,25 0,175 0,025 0,05

Размах выборки равен разности R=3,2–2,0=1,2

2. Полигон относительных частот – графическое изображение выборочного ряда распределения. По оси абсцисс откладываются значения вариант xi, а по оси ординат значения соответствующих относительных частот wi, точки (xi, wi) соединяются отрезками прямых, образующих ломаную (рис. 5).

0,25
0,2
0,175
0,15
0,05
0,025
2,0
2,2
2,4
2,6
2,8
3,0
3,2
Wi
x
0,95
0,925
0,755
0,5
0,15
2,0
2,2
2,4
2,6
2,8
3,0
3,2
F*(x)
x
0,3

Рис. 5. Полигон относительных частот Рис. 6. График эмпирич. функции

3. Эмпирическая функция распределения F*(x)= лементы математической статистики - student2.ru , где nx – число вариант, меньших х, n – объем выборки. Объем выборки n=40. Наименьшая варианта равна 2,0 – следовательно при х≤2,0 F*(x)=0,так как значение Х <2,0 не наблюдалось. Следующее значение варианты 2,2 – следовательно при 2,0<х≤2,2 F*(x)=0,15, так как значение Х<2,2 наблюдалось 6 раз. Проводим и далее аналогичные рассуждения. Искомая эмпирическая функция имеет вид:

0 при х≤2,0

0,15 при2,0< х≤2,2

0,3 при 2,2< х≤2,4

F*(x) = 0,5 при 2,4< х≤2,6

0,75 при 2,6< х≤2,8

0,925 при 2,8< х≤3,0

0,95 при 3,0< х≤3,2

1 при3,2< х

4. Используя формулы (23), (24), (25) определения моды и медианы находим: выборочную среднюю:

лементы математической статистики - student2.ru = лементы математической статистики - student2.ru =2,485;

выборочную дисперсию:

Dв= лементы математической статистики - student2.ru

лементы математической статистики - student2.ru ;

исправленное среднее квадратическое отклонение:

лементы математической статистики - student2.ru ;

моду: М0=2,6; медиану: те лементы математической статистики - student2.ru (2,4; 2,6).

5.Доверительный интервал для математического ожидания имеет вид (31). Находим t=2,023 по таблице значений функции tγ=t(γ,n) при γ=0,95, n=40.

лементы математической статистики - student2.ru =2,485, S=0,323, тогда уγ=(2,485-2,023 лементы математической статистики - student2.ru ;2,485+2,023 лементы математической статистики - student2.ru );

уγ=(2,382; 2,588).

Доверительный интервал для среднего квадратического отклонения имеет вид (29). Находим q=0,24<1по таблице значений функции q= q(γ, n) при γ=0,95, n=40. S=0,323, тогда γ=(0,323(1-0,24); 323(1+0,24)); γ=(0,245; 0,401).

Задача 12.Для выборки, извлеченной из генеральной совокупности, дан интервальный статистический ряд.

αi-βi 5-10 10-15 15-20 20-25 25-30 30-35 35-40 40-45 45-50
n*i 7 8 15 18 23 19 14 10 6

Требуется: 1) построить полигон интервальных относительных частот; 2)

построить кумулятивную кривую; 3) построить гистограмму относительных частот; 4) найти выборочную среднюю, выборочную дисперсию, выборочное среднее квадратическое отклонение, выборочную моду и выборочную медиану; 5) проверить на уровне значимости α=0,05 гипотезу о нормальном распределении признака Х генеральной совокупности по критерию согласия Пирсона; 6) в случае согласованности с нормальным распределением найти с надежностью γ=0,95 доверительные интервалы для оценки математического ожидания и среднего квадратического отклонения признака Х генеральной совокупности.

Решение: Объем выборки n= лементы математической статистики - student2.ru .

Составим таблицу 5, в которой αii-i-й интервал, n лементы математической статистики - student2.ru - количество вариант, попадающих в i – й интервал, х лементы математической статистики - student2.ru – интервальная варианта – середина интервала, х лементы математической статистики - student2.ru лементы математической статистики - student2.ru ( i= 1,2, …,9), W лементы математической статистики - student2.ru (i = 1,2, …,9) – интервальная относительная частота, лементы математической статистики - student2.ru лементы математической статистики - student2.ru – накопленная интервальная относительная частота, ui – условная варианта.

Таблица 5

i αii x лементы математической статистики - student2.ru n лементы математической статистики - student2.ru лементы математической статистики - student2.ru лементы математической статистики - student2.ru лементы математической статистики - student2.ru ui u лементы математической статистики - student2.ru ui n лементы математической статистики - student2.ru u лементы математической статистики - student2.ru
5–10 7,5 0,06 0,06 0,012 –4 –28
10–15 12,5 0,07 0,13 0,014 –3 –24
15–20 17,5 0,12 0,25 0,024 –2 –30
20–25 22,5 0,15 0,40 0,030 –1 –18
25–30 27,5 0,19 0,59 0,038
30–35 32,5 0,16 0,75 0,032
35–40 37,5 0,12 0,87 0,024
40–45 42,5 0,08 0,95 0,016
45–50 47,5 0,05 0,010
Σ    
Σ∕n     0,008 4,358

22,5
17,5
12,5
7,5
27,5
32,5
37,5
42,5
47,5
0,19
0,16
0,15
0,12
0,08
0,07
0,06
0,05
Wi*
x
1. Полигон интервальных относительных частот ломаная линия с ершинами в точках (хi*,wi i=1,2,…,9(рис. 7).

Рис. 7. Полигон интервальных относительных частот.

0,95
0,87
0,75
0,59
0,40
0,25
0,13
лементы математической статистики - student2.ru
x
0,06
2. Кумулятивная кривая – ломаная линия с вершинами в точках (βi, лементы математической статистики - student2.ru ), i=1,2,…,9, где βi – правый конец i-го интервала группировки (рис. 8).

Рис. 8. Кумулятивная кривая

3. Гистограмма относительных частот – ступенчатая фигура, состоящая из прямоугольников с основаниями – интервалами ( i,βi) и высотами равными лементы математической статистики - student2.ru (i=1,2,…,9) (рис. 9).

0,038
0,032
0,030
0,024
0,016
0,010
0,012
0,014
Wi*/h
x

Рис. 9. Гистограмма относительных частот

4. Найдем лементы математической статистики - student2.ru ,Dв, σв. Используем таблицу 5. Применим метод условных вариант для случая интервальной группировки. Условня варианта ui= лементы математической статистики - student2.ru , лементы математической статистики - student2.ru , лементы математической статистики - student2.ru = лементы математической статистики - student2.ru , лементы математической статистики - student2.ru =4,358, лементы математической статистики - student2.ru =h лементы математической статистики - student2.ru +c=5·0,008+27,5=27,54, Dвu= лементы математической статистики - student2.ru - лементы математической статистики - student2.ru =4,358-(0,008)2=4,358; Dвх=h2 Dвu=52·4,358≈108,95,

σвx= лементы математической статистики - student2.ru .

В случае интервальной группировки формула для нахождения выборочной моды имеет вид:

М0= лементы математической статистики - student2.ru +h лементы математической статистики - student2.ru .

Формула для нахождения медианы имеет вид:

те= лементы математической статистики - student2.ru +h лементы математической статистики - student2.ru .

5.Для проверки гипотезы о нормальном распределении с помощью критерия согласия Пирсона составим расчетную таблицу 6, в которой

Zi лементы математической статистики - student2.ru ; s= лементы математической статистики - student2.ru - исправленное выборочное среднее квадратическое отклонение. Рi= лементы математической статистики - student2.ru ,для f(x)= лементы математической статистики - student2.ru имеется таблица значений.

Таблица 6

i лементы математической статистики - student2.rui лементы математической статистики - student2.ru лементы математической статистики - student2.ru zi f(zi) рi npi лементы математической статистики - student2.ru - npi ( лементы математической статистики - student2.ru - npi)2 ( лементы математической статистики - student2.ru - npi) npi
5-10 7,5 1,8959 0,0656 0,0310 3,720 4,280 18,3184 4,924
10-15 12,5 1,4228 0,1456 0,0688 8,256 6,744 45,481 5,509
15-20 17,5 0,9498 0,2541 0,1202 14,424 0,576 0,332 0,023
20-25 22,5 0,4768 0,3555 0,1682 20,184 2,184 4,769 0,236
25-30 27,5 0,0037 0,3989 0,1887 22,644 0,356 0,127 0,006
30-35 32,5 0,4692 0,3572 0,1689 20,268 1,268 0,608 0,079
35-40 37,5 0,9422 0,2565 0,1213 14,556 -0,556 0,309 0,021
40-45 42,5 1,4153 0,1456 0,0688 8,256 1,744 3,041 0,368
45-50 47,5 1,8883 0,0669 0,0316 3,792 2,208 4,875 1,286
              12,452

Наблюдаемое значение статистики Пирсона χ2набл.=12,5.

Определяем критическую точку статистики Пирсона по таблице значений χ 2 при α=1-γ=1–95=0,05, к=т-3=9–6, χ 2кр.= χ 20,05(6)=12,6.

Сравним χ 2набл. и χ 2кр.: χ 2набл. < χ 2кр..

И в соответствии с разрешающим правилом критерия Пирсона , гипотеза нормальности согласуется с данной выборкой.

6. Доверительный интервал для оценки математического ожидания имеет вид: лементы математической статистики - student2.ru n=120, лементы математической статистики - student2.ru =27,54, S= лементы математической статистики - student2.ru

По таблице значений функции tγ=t(γ,n) при γ=0,95и n=120находим tγ=1,98,доверительный интервал:

уγ= лементы математической статистики - student2.ru , уγ=(25,63; 29,45).

Доверительный интервал для оценки среднего квадратического отклонения имеет вид:

(s(1-q); s(1+q)) (при q<1), s=10,57. По таблице значений функции q=q(γ,n) при γ=0,95и n=120.

Находим q=0,13<1.

уγ= (10,57(1-0,13); 10,57(1+0,13)), уγ=(9,20; 11,94).

Литература

Основная литература

1. Гмурман В.Е. Теория вероятностей и математическая статистика. – М.: Высш. шк., 2004. – 479 с.

2. Гмурман В.Е. Руководство к решению задач по теории вероятностей и математической статистике. – М.: Высш. шк., 2004. – 400 с.

3. Кремер Н.Ш. Теория вероятностей и математическая статистика: Учебник для вузов. М.: ЮНИТИ – ДАНА, 2005. 543 с.

4. Колемаев В.А., Калинина В.Н. Теория вероятностей и математическая статистика. М.: Инфра, 2007.

5. Сборник задач по математике для втузов: Специальные курсы. Под ред. А. В. Ефимова. М.: Наука, 2005.

6. Шолохович Ф.А., Васин В.В. Основы высшей математики. - Екатеринбург, Изд-во УрГУ, 2004.

Дополнительная литература

1. Красс М.С., Чупрынов Б.П. Основы математики и ее приложения в экономическом образовании. - М.: Дело, 2001.

2. Шипачев В.М. Задачник по высшей математике. – М., Высшая школа, 2005.

3. Чебыкин Л.С. Высшая математика: Элементы теории вероятностей и математической статистики: Курс лекций /Свердл. инж.-пед. ин-т. Свердловск, 1981.

ЗАДАНИЯ И МЕТОДИЧЕСКИЕ УКАЗАНИЯ

к выполнению контрольной работы по дисциплине

«теория вероятностей и математическая статистика»

Подписано в печать _________. Формат 60´84/16. Бумага для множ. аппаратов.

Печать плоская. Усл. печ. л. ___. Уч.-изд. л.____. Тираж ____ экз. Заказ № ____.

ФГАОУ ВПО «Российский государственный профессионально-педагогический университет». Екатеринбург, ул. Машиностроителей, 11.

Ризограф ФГАОУ ВПО РГППУ. Екатеринбург, ул. Машиностроителей, 11.

Наши рекомендации