II Элементы математической статистики
7. Статистическая обработка результатов измерений
Дан протокол измерений случайной величины Х. Для этой случайной величины требуется:
а) составить интервальную таблицу частот,
б) получить точечные оценки для математического ожидания и дисперсии,
в) найти доверительный интервал для математического ожидания,
г) построить гистограмму,
д) аппроксимировать гистограмму теоретическим нормальным законом распределения,
е) с помощью критерия c2 проверить согласованность теоретического и статистического законов распределений.
Алгоритм выполнения задания
I Простейшая статистическая обработка:
1) Упорядочить вариационный ряд (т. е. записать все значения вариант в порядке возрастания) (таблица 7.1).
2) Найти размах: R = Xmax – Xmin .
3) Подобрать количество разрядов (интервалов):
k = 1+3,32lg(n) = 1,44ln(n)+1, где п – объем выборки(количество разрядов должно быть целым числом).
4) Построить интервальную таблицу частот. Для этого находят длину интервала Dx = R/k (если R не делится нацело на k, то можно слегка расширить диапазон значений случайной величины) и границы интервалов – точки a1, ..., ak+1, где ai = a1 + (i–1)×Dx. Затем подсчитывают частоты mi – количество значений случайной величины (вариант), попавших на каждый интервал.
В таблицу 7.2 заносят границы интервалов (ai; ai+1), среднее значение варианты на каждом интервале , частоты mi и относительные частоты (частости) (столбцы 1-4).
II Вычисление числовых характеристик (точечных выборочных оценок):
1) Вычислить выборочное среднее – оценку для математического ожидания.
2) Вычислить выборочную дисперсию – оценку для дисперсии.
3) Вычислить стандартное отклонение – оценку для среднего квадратичного отклонения.
III Построение доверительного интервала для математического ожидания а:
1) Зная доверительную вероятность (надежность) g, найти по таблице значений функции Лапласа (см. Приложение 1) соответствующее значение t, для которого .
2) Вычислить предельную ошибку ,
где s– стандартное отклонение, п – объем выборки.
3) Записать доверительный интервал для математического ожидания
.
IV Построение гистограммы
Для построения гистограммы относительных частот вычисляют высоты столбцов гистограммы (удобно добавить их в таблицу 7.2 – столбец 5), на оси абсцисс отмечают точки a1, ..., ak+1и над каждым интервалом (ai; ai+1) строят прямоугольник высотой hi. В результате получается ступенчатая фигура, верхний контур которой приблизительно соответствует графику плотности распределения исследуемой случайной величины (рис.1).
V Аппроксимация гистограммы нормальным законом распределения:
1) Составить таблицу значений теоретического нормального закона с параметрами а = , s = s: .
Для удобства расчетов можно
а) найти значения ;
б) по таблице Приложения 1 из [1] найти ;
в) вычислить (таблица 7.3).
2) Построить график теоретической кривой
На рис. 1 отметить точки с координатами ( ; ) и соединить их плавной кривой.
3) Сделать вывод о согласованности статистического распределения (гистограммы) с теоретическим нормальным законом распределения, проанализировав полученный рисунок.
VI Проверка согласованности статистического и теоретического распределений:
1) Вычислить статистику c2: ,
где ;
– функция Лапласа (см. Приложение 1).
2) Определить число степеней свободы r = k – 3.
3) Анализ результатов. Выбрав уровень значимости a (например, a = 0,05), в таблице критических точек распределения c2 (Приложение 3), найти c2кр.
Если c2 < c2кр, то можно принять гипотезу о нормальном распределении, т. е. полученный теоретический закон хорошо аппроксимирует статистическое распределение.
Если c2 > c2кр, то гипотеза о выборе теоретического закона отвергается, т.е. полученный закон не согласуется с экспериментальными данными.
Пример 7
Записав исходные данные в порядке возрастания, получили следующий упорядоченный вариационный ряд (таблица 7.1):
Таблица 7.1. Упорядоченный вариационный ряд
Найдем размах R=141 – 95 = 46.
Так как объем выборки п =100, а количество разрядов должно быть целым числом, то удобно брать k = 7 или k = 8. Расширим диапазон значений вариант до промежутка (94; 142) и выберем k=8.
Тогда длина интервала Dx = (142 – 94)/8 = 6.
Построим интервальную таблицу частот (таблица 7.2, столбцы 1-4). В ту же таблицу занесем вычисленные значения высот столбцов гистограммы.
Таблица 7.2. Интервальная таблица частот
Границы интервалов (ai , ai+1) | Среднее значение | Частота mi | Относительная частота wi | Высота столбца гистограммы hi |
94 – 100 | 0,03 | 0,0050 | ||
100 – 106 | 0,07 | 0,0117 | ||
106 – 112 | 0,11 | 0,0183 | ||
112 – 118 | 0,20 | 0,0333 | ||
118 – 124 | 0,28 | 0,0467 | ||
124 – 130 | 0,19 | 0,0317 | ||
130 – 136 | 0,10 | 0,0167 | ||
136 – 142 | 0,02 | 0,0033 |
Вычислим числовые характеристики.
Выборочное среднее: =
= (97.3+103.7+109.11+115.20+121.28+127.19+133.10+139.2)/100 = 119,2.
Выборочная дисперсия: =
= ((97 – 119,2)2.3 + (103 – 119,2)2.7 + (109 – 119,2)2.11 +
+ (115 – 119,2)2.20 + (121 – 119,2)2.28 + (127 – 119,2)2.19 +
+ (133 – 119,2)2.10 + (139 – 119,2)2.2)/99 = 87,48.
Стандартное отклонение: = 9,35.
Найдем доверительный интервал для математического ожидания.
Пусть доверительная вероятность g=0,95. Тогда по таблице Приложения находим, что если Ф(t) = 0,475 , то t = 1,96. Вычислим предельную ошибку = 1,96.9,35/10 = 1,833.
Таким образом, границы доверительного интервала 119,2 – 1,833 и 119,2 + 1,833, т.е. доверительный интервал для математического ожидания имеет вид (117,367; 121,033).
Составим таблицу значений теоретического нормального закона
(таблица 7.3).
Таблица 7.3. Теоретическая плотность распределения вероятностей
Среднее значение | |||
–2,37 | 0,0241 | 0,0026 | |
–1,73 | 0,0893 | 0,0096 | |
–1,09 | 0,2203 | 0,0236 | |
–0,45 | 0,3605 | 0,0386 | |
0,19 | 0,3918 | 0,0419 | |
0,83 | 0,2827 | 0,0302 | |
1,48 | 0,1334 | 0,0143 | |
2,12 | 0,0422 | 0,0045 |
Построим гистограмму и кривую теоретического нормального распределения (рис. 1).
Из рисунка видно, что теоретическая нормальная кривая хорошо аппроксимирует статистический закон распределения.
Рис. 1. Гистограмма и теоретическая кривая
Проверим согласованность статистического и выбранного теоретического распределения с помощью критерия c2 .
Вычислим значения pi (таблица 7.4).
Таблица 7.4. Расчет критерия c2
Границы интервалов (ai , ai+1) | Частота mi | ||
94 – 100 | Ф(-2,05) – Ф(-2,69) = 0,0166 | 1,082 | |
100 – 106 | Ф(-1,41) – Ф(-2,05) = 0,0592 | 0,197 | |
106 – 112 | Ф(-0,77) – Ф(-1,41) = 0,1413 | 0,693 | |
112 – 118 | Ф(-0,13) – Ф(-0,77) = 0,2284 | 0,353 | |
118 – 124 | Ф(0,51) – Ф(-0,13) = 0,2470 | 0,441 | |
124 – 130 | Ф(1,155) – Ф(0,51) = 0,180 | 0,055 | |
130 – 136 | Ф(1,797) – Ф(1,155) = 0,088 | 0,164 | |
136 – 142 | Ф(2,44) – Ф(1,797) = 0,0286 | 0,259 | |
S = 3,244 |
Вычислим статистику: = 3,244.
Подсчитаем число степеней свободы: r= 8 – 3 = 5.
Выбрав уровень значимости a = 0,05, в таблице (Приложение 3) найдем c2кр(5; 0,05) = 11,1. Так как c2=3,244<11,1=c2кр, то можно принять гипотезу о нормальном распределении, т. е. в данном случае полученный теоретический закон хорошо аппроксимирует статистическое распределение.
8. Оценка корреляционной зависимости между наблюдаемыми величинами
По данной корреляционной таблице (таблица 8.1.) найти коэффициент корреляции и выборочное уравнение прямой регрессии Y на X.
Алгоритм выполнения задания
1. Построить таблицу эмпирического распределения для X (таблица 8.2, столбцы 1-3) и добавить в ту же таблицу вспомогательные значения (столбцы 4-6). Составить также вспомогательную таблицу 8.3
2. Вычислить выборочные средние и выборочные дисперсии:
;
; ; ; ;
; ; ; .
3. Вычислить коэффициенты прямой регрессии Y на Х:
;
и записать уравнение этой прямой: .
Прямая регрессии обязательно проходит через точку с координатами ( ), которая называется центром рассеивания.
4. Вычислить коэффициент корреляции по формуле (31)
и сделать вывод о тесноте линейной зависимости.
Пример 8.
Пусть корреляционная таблица имеет вид (таблица 8.1):
Таблица 8.1. Корреляционная таблица
Х | Y | nх | ||||||||||||
nу | ||||||||||||||
Построим таблицы эмпирического распределения и вспомогательных значений: (таблицы 8.2 и 8.3).
Таблица 8.2. Эмпирическое распределение
хi | nxi | * | nxi.хi | nxi.(хi)2 | nxi.хi. |
13,5 | |||||
33,5 | |||||
Суммы | S4=100 | S5=300 | S6=4410 |
*) Примечание
Таблица 8.3. Вспомогательные значения
yi | nyj | nyj.yj | nyj.(yj)2 |
Суммы | S7 = 1660 | S8 = 67700 |
Вычислим выборочные средние и выборочные дисперсии:
= 100/50 = 2; = 300/50 = 6; = 6 – 4 = 2; = 1,414;
= 1660/50 = 33,2; = 67700/50 = 1354; = 1354 – 33,22 = 251,76;
= 15,87; = 4410/50 = 88,2.
Вычислим коэффициенты прямой регрессии Y на Х:
; .
Тогда уравнение этой прямой: . На рис. 2 построено эмпирическое распределение (точки ( ; )) и прямая регрессии.
Центр рассеяния – точка (2; 33,2)
Вычислим коэффициент корреляции . Так как коэффициент корреляции близок к единице, можно сделать вывод о сильной положительной линейной зависимости между признаками (случайными величинами) Х и Y.
Рис. 2. Эмпирическое распределение и прямая регрессии
Приложение 1. Таблица значений функции
х | сотые доли х | |||||||||
0,0 | 0,0000 | |||||||||
0,1 | ||||||||||
0,2 | ||||||||||
0,3 | ||||||||||
0,4 | ||||||||||
0,5 | ||||||||||
0,6 | ||||||||||
0,7 | ||||||||||
0,8 | ||||||||||
0,9 | ||||||||||
1,0 | 0,3413 | |||||||||
1,1 | ||||||||||
1,2 | ||||||||||
1,3 | ||||||||||
1,4 | ||||||||||
1,5 | ||||||||||
1,6 | ||||||||||
1,7 | ||||||||||
1,8 | ||||||||||
1,9 | ||||||||||
2,0 | 0,4772 | |||||||||
2,1 | ||||||||||
2,2 | ||||||||||
2,3 | ||||||||||
2,4 | ||||||||||
2,5 | ||||||||||
2,6 | ||||||||||
2,7 | ||||||||||
2,8 | ||||||||||
2,9 |
3,0 | 0,49865 | 3,5 | 0,49977 | 4,0 | 0,499968 |
3,1 | 3,6 | 4,5 | 0,499997 | ||
3,2 | 3,7 | 5,0 | 0,499997 | ||
3,3 | 3,8 | ||||
3,4 | 3,9 |
Приложение 2. Таблица значений функции
х | сотые доли х | |||||||||
0,0 | 0,3989 | 0,3989 | 0,3989 | 0,3988 | 0,3986 | 0,3984 | 0,3982 | 0,3980 | 0,3977 | 0,3973 |
0,1 | 0,3970 | 0,3965 | 0,3961 | 0,3956 | 0,3951 | 0,3945 | 0,3939 | 0,3932 | 0,3925 | 0,3918 |
0,2 | 0,3910 | 0,3902 | 0,3894 | 0,3885 | 0,3876 | 0,3867 | 0,3857 | 0,3847 | 0,3836 | 0,3825 |
0,3 | 0,3814 | 0,3802 | 0,3790 | 0,3778 | 0,3765 | 0,3752 | 0,3739 | 0,3726 | 0,3712 | 0,3697 |
0,4 | 0,3683 | 0,3668 | 0,3652 | 0,3637 | 0,3621 | 0,3605 | 0,3589 | 0,3572 | 0,3555 | 0,3538 |
0,5 | 0,3521 | 0,3503 | 0,3485 | 0,3467 | 0,3448 | 0,3429 | 0,3410 | 0,3391 | 0,3372 | 0,3352 |
0,6 | 0,3332 | 0,3312 | 0,3292 | 0,3271 | 0,3251 | 0,3230 | 0,3209 | 0,3187 | 0,3166 | 0,3144 |
0,7 | 0,3123 | 0,3101 | 0,3079 | 0,3056 | 0,3034 | 0,3011 | 0,2989 | 0,2966 | 0,2943 | 0,2920 |
0,8 | 0,2897 | 0,2874 | 0,2850 | 0,2827 | 0,2803 | 0,2780 | 0,2756 | 0,2732 | 0,2709 | 0,2685 |
0,9 | 0,2661 | 0,2637 | 0,2613 | 0,2589 | 0,2565 | 0,2541 | 0,2516 | 0,2492 | 0,2468 | 0,2444 |
1,0 | 0,2420 | 0,2396 | 0,2371 | 0,2347 | 0,2323 | 0,2299 | 0,2275 | 0,2251 | 0,2227 | 0,2203 |
1,1 | 0,2179 | 0,2155 | 0,2131 | 0,2107 | 0,2083 | 0,2059 | 0,2036 | 0,2012 | 0,1989 | 0,1965 |
1,2 | 0,1942 | 0,1919 | 0,1895 | 0,1872 | 0,1849 | 0,1826 | 0,1804 | 0,1781 | 0,1758 | 0,1736 |
1,3 | 0,1714 | 0,1691 | 0,1669 | 0,1647 | 0,1626 | 0,1604 | 0,1582 | 0,1561 | 0,1539 | 0,1518 |
1,4 | 0,1497 | 0,1476 | 0,1456 | 0,1435 | 0,1415 | 0,1394 | 0,1374 | 0,1354 | 0,1334 | 0,1315 |
1,5 | 0,1295 | 0,1276 | 0,1257 | 0,1238 | 0,1219 | 0,1200 | 0,1182 | 0,1163 | 0,1145 | 0,1127 |
1,6 | 0,1109 | 0,1092 | 0,1074 | 0,1057 | 0,1040 | 0,1023 | 0,1006 | 0,0989 | 0,0973 | 0,0957 |
1,7 | 0,0940 | 0,0925 | 0,0909 | 0,0893 | 0,0878 | 0,0863 | 0,0848 | 0,0833 | 0,0818 | 0,0804 |
1,8 | 0,0790 | 0,0775 | 0,0761 | 0,0748 | 0,0734 | 0,0721 | 0,0707 | 0,0694 | 0,0681 | 0,0669 |
1,9 | 0,0656 | 0,0644 | 0,0632 | 0,0620 | 0,0608 | 0,0596 | 0,0584 | 0,0573 | 0,0562 | 0,0551 |
2,0 | 0,0540 | 0,0529 | 0,0519 | 0,0508 | 0,0498 | 0,0488 | 0,0478 | 0,0468 | 0,0459 | 0,0449 |
2,1 | 0,0440 | 0,0431 | 0,0422 | 0,0413 | 0,0404 | 0,0396 | 0,0387 | 0,0379 | 0,0371 | 0,0363 |
2,2 | 0,0355 | 0,0347 | 0,0339 | 0,0332 | 0,0325 | 0,0317 | 0,0310 | 0,0303 | 0,0297 | 0,0290 |
2,3 | 0,0283 | 0,0277 | 0,0270 | 0,0264 | 0,0258 | 0,0252 | 0,0246 | 0,0241 | 0,0235 | 0,0229 |
2,4 | 0,0224 | 0,0219 | 0,0213 | 0,0208 | 0,0203 | 0,0198 | 0,0194 | 0,0189 | 0,0184 | 0,0180 |
2,5 | 0,0175 | 0,0171 | 0,0167 | 0,0163 | 0,0158 | 0,0154 | 0,0151 | 0,0147 | 0,0143 | 0,0139 |
2,6 | 0,0136 | 0,0132 | 0,0129 | 0,0126 | 0,0122 | 0,0119 | 0,0116 | 0,0113 | 0,0110 | 0,0107 |
2,7 | 0,0104 | 0,0101 | 0,0099 | 0,0096 | 0,0093 | 0,0091 | 0,0088 | 0,0086 | 0,0084 | 0,0081 |
2,8 | 0,0079 | 0,0077 | 0,0075 | 0,0073 | 0,0071 | 0,0069 | 0,0067 | 0,0065 | 0,0063 | 0,0061 |
2,9 | 0,0060 | 0,0058 | 0,0056 | 0,0055 | 0,0053 | 0,0051 | 0,0050 | 0,0048 | 0,0047 | 0,0046 |
3,0 | 0,0044 | 0,0043 | 0,0042 | 0,0040 | 0,0039 | 0,0038 | 0,0037 | 0,0036 | 0,0035 | 0,0034 |
3,1 | 0,0033 | 0,0032 | 0,0031 | 0,0030 | 0,0029 | 0,0028 | 0,0027 | 0,0026 | 0,0025 | 0,0025 |
3,2 | 0,0024 | 0,0023 | 0,0022 | 0,0022 | 0,0021 | 0,0020 | 0,0020 | 0,0019 | 0,0018 | 0,0018 |
3,3 | 0,0017 | 0,0017 | 0,0016 | 0,0016 | 0,0015 | 0,0015 | 0,0014 | 0,0014 | 0,0013 | 0,0013 |
3,4 | 0,0012 | 0,0012 | 0,0012 | 0,0011 | 0,0011 | 0,0010 | 0,0010 | 0,0010 | 0,0009 | 0,0009 |
3,5 | 0,0009 | 0,0008 | 0,0008 | 0,0008 | 0,0008 | 0,0007 | 0,0007 | 0,0007 | 0,0007 | 0,0006 |
3,6 | 0,0006 | 0,0006 | 0,0006 | 0,0005 | 0,0005 | 0,0005 | 0,0005 | 0,0005 | 0,0005 | 0,0004 |
3,7 | 0,0004 | 0,0004 | 0,0004 | 0,0004 | 0,0004 | 0,0004 | 0,0003 | 0,0003 | 0,0003 | 0,0003 |
3,8 | 0,0003 | 0,0003 | 0,0003 | 0,0003 | 0,0003 | 0,0002 | 0,0002 | 0,0002 | 0,0002 | 0,0002 |
3,9 | 0,0002 | 0,0002 | 0,0002 | 0,0002 | 0,0002 | 0,0002 | 0,0002 | 0,0002 | 0,0001 | 0,0001 |
Приложение 3. Критические точки распределения c2
Число степеней свободы | Уровень значимости a | |||
0,01 | 0,05 | 0,95 | 0,99 | |
6,6 | 3,8 | 0,0039 | 0,00016 | |
9,2 | 6,0 | 0,103 | 0,020 | |
11,3 | 7,8 | 0,352 | 0,115 | |
13,3 | 9,5 | 0,711 | 0,297 | |
15,1 | 11,1 | 1,15 | 0,554 | |
16,8 | 12,6 | 1,64 | 0,872 | |
18,5 | 14,1 | 2,17 | 1,24 | |
20,1 | 15,5 | 2,73 | 1,65 | |
21,7 | 16,9 | 3,33 | 2,09 | |
23,2 | 18,3 | 3,94 | 2,56 | |
24,7 | 19,7 | 4,57 | 3,05 |
Учебное издание
Основы теории вероятностей
и математической статистики
Методические указания для студентов заочного отделения
Составитель Карпилова Ольга Михайловна
Самарский государственный аэрокосмический университет
имени академика С.П. Королева,
443086 Самара, Московское шоссе, 34