ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ. Технологический институт Федерального государственного образовательного учреждения высшего профессионального образования
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ
Технологический институт Федерального государственного образовательного учреждения высшего профессионального образования
«Южный федеральный университет»
ТИПОВОЙ РАСЧЕТ
по математической статистике
Вариант 11
Выполнила
студент гр. Н-20
Меркулов В.И.
Таганрог 2012
Дана выборка объема n=100:
6,26 | 3,26 | 4,00 | 0,34 | 5,44 | 2,74 | 9,31 | 2,53 | 8,02 | 7,74 |
8,35 | -2,56 | -1,02 | 0,60 | -3,26 | 4,74 | 0,56 | 6,29 | 3,25 | 7,68 |
-2,04 | 3,23 | 6,46 | 4,78 | 0,11 | -0,99 | 1,59 | 4,61 | 1,43 | 1,11 |
1,20 | -0,48 | 0,56 | 5,70 | -6,04 | 5,43 | -1,86 | 4,36 | 5,38 | 2,54 |
0,51 | 2,84 | 5,60 | 2,08 | -0,48 | 6,82 | 0,10 | 2,08 | 9,23 | 1,63 |
6,48 | 0,13 | 0,69 | 1,01 | 1,16 | 3,09 | -4,32 | -0,09 | 1,21 | 0,88 |
4,46 | 5,14 | 2,03 | 0,20 | 11,51 | -2,77 | 2,14 | 1,29 | 3,32 | -2,90 |
3,89 | 4,71 | -0,92 | -2,15 | 2,26 | 3,04 | 0,46 | 7,48 | 3,58 | 5,64 |
7,39 | 4,67 | 5,29 | 3,46 | 0,76 | 5,53 | 2,66 | 2,68 | 9,18 | 4,32 |
4,59 | 1,58 | 1,76 | 4,22 | 7,34 | 6,20 | 2,83 | 0,09 | 7,26 | 7,14 |
Анализируем выборку:
1) Строим таблицу, в которой числа располагаются в порядке возрастания:
n | ||||||||||
x | -6,04 | -4,32 | -3,26 | -2,9 | -2,77 | -2,56 | -2,15 | -2,04 | -1,86 | -1,02 |
n | ||||||||||
x | -0,99 | -0,92 | -0,48 | -0,48 | -0,09 | -0,09 | 0,1 | 0,11 | 0,13 | 0,2 |
n | ||||||||||
x | 0,34 | 0,46 | 0,51 | 0,56 | 0,56 | 0,6 | 0,69 | 0,76 | 0,88 | 1,01 |
n | ||||||||||
x | 1,11 | 1,16 | 1,2 | 1,21 | 1,29 | 1,43 | 1,58 | 1,59 | 1,63 | 1,76 |
n | ||||||||||
x | 2,03 | 2,08 | 2,08 | 2,14 | 2,26 | 2,53 | 2,54 | 2,66 | 2,68 | 2,74 |
n | ||||||||||
x | 2,83 | 2,84 | 3,04 | 3,09 | 3,23 | 3,25 | 3,26 | 3,32 | 3,46 | 3,58 |
n | ||||||||||
x | 3,89 | 4,22 | 4,32 | 4,36 | 4,46 | 4,59 | 4,61 | 4,67 | 4,71 | |
n | ||||||||||
x | 4,74 | 4,78 | 5,14 | 5,29 | 5,38 | 5,43 | 5,44 | 5,53 | 5,6 | 5,64 |
n | ||||||||||
x | 5,7 | 6,2 | 6,26 | 6,29 | 6,46 | 6,48 | 6,82 | 7,14 | 7,26 | 7,34 |
n | ||||||||||
x | 7,39 | 7,48 | 7,68 | 7,74 | 8,02 | 8,35 | 9,18 | 9,23 | 9,31 | 11,51 |
2) Из этой таблицы выбираем наибольшее и наименьшее значение:
=-6,04
=11,51
Примем: =-6
=12
Найдем шаг выборки, разбивая ее на 10 интервалов:
Интервалы:
[-6;-4,2) [-4,2;-2,4) [-2,4;-0,6) [-0,6;1,2) [1,2;3) [3;4,8) [4,8;6,6) [6,6;8,4) [8,4;10,2) [10,2;12)
3) Заполняем таблицу 1:
∆xi | [-6;-4,2) | [-4,2;- 2,4) | [-2,4;-0,6) | [-0,6;1,2) | [1,2;3) | [3;4,8) | [4,8;6,6) | [6,6;8,4) | [8,4;10,2) | [10,2;12) | |
xi* | -5,1 | -3,3 | -1,5 | 0,3 | 2,1 | 3,9 | 5,7 | 7,5 | 9,3 | 11,1 | |
mi | |||||||||||
0,02 | 0,04 | 0,06 | 0,2 | 0,2 | 0,2 | 0,14 | 0,1 | 0,03 | 0,01 | ||
0.04 | 0.12 | 0.3 | 0.51 | 0.69 | 0.84 | 0.88 | 0.9 | 0.91 | |||
0,011 | 0,022 | 0,033 | 0,111 | 0,111 | 0,111 | 0,077 | 0,055 | 0,016 | 0,005 |
Комментарий к таблице 1:
1.- интервалы, на которые разбиваются элементы в таблице,
расположенные в порядке возрастания;
2. - это середины интервалов. Пусть
3. mi- абсолютные частоты (количество чисел из выборки, попадающие в i-й интервал). Проверка: mi= 100.
4. Pi* - относительные частоты. . Проверка:
4/100=0.04...
5. Fi*-эмпирическая (статистическая) функция распределения (функция
распределения выборки), определяющая для каждого значение
X относительную частоту события (X < х ).
0, х < -6
0.04 -6< х < -4,2
0.12, 4,2<х<-2,4
0.3, -2,4<х<-0,6
Fi*= |
0.51, -0,6<х<1,2
0.69, 1,2<х<3
0.84, 3<х<4,8
0.88, 4,8<х<6,6
0.9, 6,6<x<8,4
0,91, 8,4<х<10,2
1, 10,2<x<12
6. Wi*- плотность относительных частот.
h =1,8. Предполагаем, что выборка распределена по нормальному закону.
4) Заполним таблицу 2:
xi* | mi | xi* mi | xi*2 | xi*2 mi | xi | ƒt(xi) | Ft(xi) | |
-5,1 | -10,2 | 26,01 | 52,02 | -2,43 | 0,0062 | 0,0078 | ||
-3,3 | -13,3 | 10,89 | 43,56 | -1,88 | 0,0204 | 0,0301 | ||
-1,5 | -9 | 2,25 | 13,5 | -1,33 | 0,0494 | 0,0918 | ||
0,3 | 0,09 | 1,8 | -0,78 | 0,0882 | 0,2177 | |||
2,1 | 4,41 | 88,2 | -0,23 | 0,1165 | 0,409 | |||
3,9 | 15,21 | 304,2 | 0,31 | 0,1140 | 0,6217 | |||
5,7 | 79,8 | 32,49 | 454,86 | 0,86 | 0,0826 | 0,8051 | ||
7,5 | 56,25 | 562,5 | 1,41 | 0,0442 | 0,9207 | |||
9,3 | 27,9 | 86,49 | 256,47 | 1,56 | 0,0354 | 0,9406 | ||
11,1 | 11,1 | 123,21 | 123,21 | 2,51 | 0,0051 | 0,9938 | ||
Σ | 287,3 | 1900,32 |
Комментарий к таблице 2:
1. - это середина интервала (берем из таблицы 1)
2. - абсолютные частоты (берем из таблицы 1)
3. 4, 5 - эти колонки в таблице 2, рассчитываем по заданным формулам.
Найдем точечные оценки для неизвестных параметров распределения:
- выборочная средняя (математическое ожидание)
-выборочные дисперсия
- среднеквадратическое отклонение
Для того чтобы проверить гипотезу о том, что выборка получена из нормальной генеральной совокупности, подставим точечные оценки вместо неизвестных параметров плотности распределения вероятности:
ƒt(x)= ℮ = ℮ = ℮
Пусть
6. Находим xi по формуле (*):
7. Тогда ƒt(xi)=0,3·φ(xi), где φ(xi)= ℮
(Находим по таблице 1 «Приложения» значения функции Лапласа по значениям аргумента xiи вычислим теоретическую плотность распределения вероятности), φ(x)- четная => φ(-x)=φ(x)
ƒt(x1)=0,3·φ(-2,43)=0,3·φ(2,43)=0,3·0,0208=0,0062
ƒt(x2)= 0,3·φ(-1,88)=0,3·φ(1,88)=0,3·0,0681=0,0204
ƒt(x3)= 0,3·φ(-1,33)=0,3·φ(1,33)=0,3·0,1647=0,0494
ƒt(x4)=0,3·φ(-0,78)=0,3·φ(0,78)=0,3·0,2943=0,0882
ƒt(x5)=0,3·φ(-0,23)=0,3·j(0,23)=0,3*0,3885=0,1165
ƒt(x6)=0,3·φ(0,31)= 0,3·0,3802=0,1140
ƒt(x7)=0,3·φ(0,86)= 0,3·0,2756=0,0826
ƒt(x8)=0,3·φ(1,41)= 0,3·0,1476=0,0442
ƒt(x9)=0,3·φ(1,56)= 0,3·0,1182=0,0354
ƒt(x10)=0,3·φ(2,51)= 0,3·0,0171=0,0051
8. Подсчитываем теоретическую функцию распределения:
где
Ф(-x)=1-(0,5+Ф(x))=0,5-Ф(x)
5) Построим график функции (1) - теоретической плотности распределения, т.е. ft(x) и совместим ее с гистограммой, проверяя насколько согласованы две эти кривые.
Гистограмма - это ступенчатая фигура, состоящая из прямоугольников, основаниями которых служат частичные интервалы длиной h, а высотой, равной отношению Pi/h и называемой плотностью относительных частот Wi (эмпирическая плотность).
Строим гистограмму и проводим аппроксимацию, т.е. проводим кривую, придерживаясь середины гистограммы. На этом же чертеже строим график ft(x), а по оси ОХ берем середины интервала.
6)Аналогично построим график теоретической функции распределения Ft(x) и сравним с эмпирической функцией распределения.
Сравнивая эти графики, видим, что они согласованы достаточно хорошо, => гипотеза о нормальном распределении данной генеральной совокупности правдоподобна.
7) Кроме точечных оценок неизвестных параметров используются еще и интервальные оценки, называемые доверительными интервалами.
Найдем доверительные интервалы для неизвестных математического ожидания и дисперсии с доверительной вероятностью надежности 1-2α в предположении, что выборка распределена по нормальному закону. Задана доверительная вероятность р=0.95.
1-2α=0.95 1-α=1-0.025=0.975
2α=0.05 n=100
α=0.025
а) найдем доверительный интервал для математического ожидания.
Доверительный интервал для математического ожидания m нормальной случайной величины при неизвестной дисперсии о2 определяется с помощью выражения:
где - выборочное среднее (математическое ожидание),
- среднеквадратическое отклонение
=8,401 S=2,1
- квантиль Стьюдента с n-1 степенями свободы.
t1-α(n-1)=t0.975(99)=U(0.975)=1.96
Подставим значения в нашу формулу:
Математическое ожидание принадлежит этому интервалу с вероятностью р=0.95.
б) найдем доверительный интервал для дисперсии:
Доверительный интервал для дисперсии нормальной случайной
величины определяется с помощью выражения:
-выборочная дисперсия
(см. комментарий к таблице 2)
- распределение по степеням свободы, которое отвечает квантилю для уравнений вероятности α, т.е.
Берем по таблице х2 распределения, равные 30, так как число степеней свободы k<99, а по таблице kmax=30.
9,3312<σ2<26,1053
Дисперсия принадлежит этому интервалу с вероятностью р=0.95.
8) Проверим гипотезу о нормальном распределении генеральной совокупности с помощью критерия Пирсона. Для этого в таблице 1 объединим те интервалы, в которых mi 5.
И заполним таблицу 3:
h | 2,2 | 1,1 | 1,1 | 1,1 | 1,1 | 1,1 | 1,1 | 2,2 | ||
∆xi | [3;5,2) | [5,2;6,3) | [6,3;7,4) | [7,4;8,5) | [8,5;9,6) | [9,6;10,7) | [10,7;11,8) | [11,8;14) | ||
xi* | 4,1 | 5,75 | 6,85 | 7,95 | 9,05 | 10,15 | 11,25 | 12,9 | ||
mi | ||||||||||
0,7 | 0,11 | 0,13 | 0,18 | 0,23 | 0,14 | 0,09 | 0,05 | |||
ƒt(xi) | 0,0154 | 0,0847 | 0,1436 | 0,1833 | 0,1792 | 0,1328 | 0,0753 | 0,0189 | ||
0,0338 | 0,0931 | 0,1579 | 0,2016 | 0,1971 | 0,1460 | 0,0828 | 0,0415 | |||
0,6662 | 0,0169 | 0,0279 | 0,0216 | 0,329 | 0,006 | 0,0072 | 0,0085 | |||
00,131 | 0,0030 | 0,004 | 0,002 | 0,5491 | 0,0002 | 0,0006 | 0,0017 | 0,013 |
Комментарий к таблице 3:
1. - интервалы, взятые из таблицы 1, колонки с 1 по 2 и с 7 по 10 объединены;
2. - середины интервалов в 1 и 6 колонках пересчитаны по формуле
3. число элементов, попавших в интервал
4. - относительные частоты;
4. теоретическая плотность распределения ƒt(xi)=0,47·φ(xi) (см. п. 7, комментарий к таблице 2)
5.
ƒt(x1)=0,47·φ(-2,0480)=0,47·φ(2,0480)=0,31*0,0498=0,0154
ƒt(x6)=0,47·φ(2,1423)= 0,47·0,0404=0,0189
Изменяем ft(x6) в строке 5 только в колонке 1 и 6, остальные берем из таблицы 2;
6. теоретическая вероятность попадания случайной величины х в данный интервал. Соответствующие элементы строки 1 (h) умножаем на элементы строки 5;
7.
8. Находим отношение каждого элемента строки 7 к соответствующим элементам стороки 6:
Используя критерий Пирсона, вычислим
По таблице критических точек распределения по заданному уровню значимости а=0.025 и числу степеней свободы k=S-3, где S- число групп выборки. k=6-3=3, находим критическую точку, т.е. 9,4
Если , то нет оснований отвергнуть гипотезу о нормальном распределении генеральной совокупности.
Вывод:
В результате выполнения работы мы проверяли гипотезу о нормальном распределении генеральной совокупности с помощью точечных оценок, с помощью критерия Пирсона. Эмпирические и теоретические частоты различаются незначимо.