Задачі для самостійного розв’язку .
Постановка задачі.
Нехай – випадкова вибірка об’єму із генеральної сукупності .
Розглянемо задачу перевірки простої статистичної гіпотези про те, що функція розподілу випадкової величини співпадає з деякою відомою функцією .
(17.1.1)
Альтернативна гіпотеза
(17.1.2)
Зауважимо, вид закону розподілу обирається з фізичного змісту випадкової величини . Вид гістограми, а також співвідношення між числовими характеристиками випадкових величин, дозволяють зробити припущення відносно теоретичного розподілу. Наприклад, якщо середнє вибіркове співпадає з вибірковою дисперсією, можна припустити, що випадкова величина розподілена за законом Пуассона. Якщо середнє вибіркове близьке до середньоквадратичного відхилення, то має місце показниковий розподіл. Якщо асиметрія і ексцес близькі до нуля, можна припустити, що має місце нормальний закон розподілу.
Критерії згоди
Як би добре не був обраний теоретичний розподіл , між ним і емпіричними даними завжди існує розбіжність. Пояснюється ця розбіжність випадковими обставинами, наприклад, недостатнім об’ємом спостережень, чи вони є істотними і пов’язані з тим, що невдало підібрано теоретичний розподіл? Необхідно перевірити, чи узгоджується емпіричний розподіл з гіпотезою про розподіл за теоретичним законом .
У будь-якому критерію згоди розглядається деяка випадкова величина , що є мірою розбіжності між емпіричними та теоретичними частотами. Якщо перевищує деяке критичне значення , то основну гіпотезу відкидають, у протилежному випадку – приймають.
17.3 Критерій Пірсона
Емпіричний розподіл задано у вигляді послідовності рівновіддалених варіантів і відповідних їм частот.
(17.3.1)
Використовуючи критерій Пірсона , перевірити гіпотезу про нормальний розподіл випадкової величини.
Правило.Для того, щоб при заданому рівні значущості перевірити гіпотезу про нормальний розподіл генеральної сукупності, треба:
1. Обчислити середнє вибіркове і середнє вибіркове квадратичне відхилення .
(17.3.2)
(17.3.3)
2. Обчислити теоретичні частоти
(17.3.4)
де – об’єм вибірки (сума всіх частот),
- крок (різниця між сусідніми варіантами)
(17.3.5)
(17.3.6)
3. Порівняти емпіричні і теоретичні частоти за допомогою критерія Пірсона. Для цього:
а) обчислити вибіркове значення критерію
(17.3.7)
Величина – є мірою розбіжності між статистичними і теоретичними частотами, розподілена за законом
б) за таблицею критичних точок розподілу , за заданим рівнем значущості і числу ступенів свободи ( – число груп вибірки), знаходять критичну точку правосторонньої області.
Якщо , то немає підстав відхиляти основну гіпотезу про нормальний розподіл випадкової величини.
Якщо , основну гіпотезу про нормальний відхиляють. Іншими словами, емпіричні й теоретичні частоти відрізняються значущо.
Зауваження. Частоти, де треба об’єднати з сусідніми.
Приклад. Використовуючи критерій Пірсона , на рівні значущості перевірити, чи узгоджується гіпотеза про нормальний розподіл генеральної сукупності з емпіричним розподілу вибірки об’єму .
Розв’язання.
1. За формулою (18.3.2)
За формулою (18.3.3)
2. Обчислимо теоретичні частоти за формулою (18.3.4), де ;
Складемо таблицю
= | ||||
-1,62 | 0,1074 | 9,1 | ||
-1,90 | 0,1942 | 16,5 | ||
-0,77 | 0,2966 | 25,3 | ||
-0,35 | 0,3752 | 32,0 | ||
0,08 | 0,3977 | 33,9 | ||
0,51 | 0,3503 | 29,8 | ||
0,93 | 0,2589 | 22,0 | ||
1,36 | 0,1582 | 13,5 | ||
1,78 | 0,0818 | 7,0 |
Значення функції знаходимо за таблицею значень функції щільності нормального стандартного розподілу.
3. Порівняємо емпіричні і теоретичні частоти. Складемо розрахункову таблицю і знайдемо
9,1 | 5,9 | 34,81 | 3,8 | ||
16,5 | 9,5 | 90,25 | 5,5 | ||
25,3 | -0,3 | 0,09 | 0,0 | ||
32,0 | -2,0 | 4,00 | 0,1 | ||
33,9 | -7,9 | 62,41 | 1,8 | ||
29,8 | -8,8 | 77,44 | 2,6 | ||
22,0 | 2,0 | 4,00 | 0,2 | ||
13,5 | 6,5 | 42,25 | 3,1 | ||
7,0 | 6,0 | 36,00 | 5,1 |
За таблицею критичних точок розподілу за рівнем значущості і числом ступенів свободи знайдемо – критичну точку правосторонньої області
Так як , то гіпотезу про нормальний розподіл генеральної сукупності відхиляємо на рівні значущості . Іншими словами, емпіричні й теоретичні частоти відрізняються значущо.
Приклад. Результати іспитів на міцність наведено в таблиці.
міцність деталі в кг | 120-140 | 140-160 | 160-180 | 180-200 | 200-220 | 220-240 | 240-260 | 260-280 |
кількість деталей |
1. Знайти вид закону теоретичного розподілу.
2. Знайти параметри розподілу
3. Перевірити, чи узгоджується обраний теоретичний розподіл з емпіричними даними
Розв’язання. Побудуємо гістограму частот (рис. 17.3.1). Для цього в прямокутній системі координат значення ознаки (міцності деталі в кг) відкладемо на осі абсцис, а частоти ( ) – на осі ординат (масштаб обирається довільно). Потім на відрізках осі абсцис, відповідних побудованим інтервалам, як на основах будуємо прямокутники, висота яких (в обраному масштабі) дорівнює частоті даного інтервалу.
рис. 17.3.1
У тому випадку, коли інтервали різні, на осі ординат відкладаємо значення абсолютної щільності розподілу
(17.3.8)
де – ширина інтервалу,
– частота інтервалу
По вигляду гістограми можна зробити припущення, що випадкова величина X (міцність деталі), що розглядається, розподілена за нормальним законом.
Розрахуємо методом моментів середнє вибіркове , дисперсію вибірки , середньоквадратичне відхилення , вибіркові коефіцієнти асиметрії A й ексцесу E.
Середнє вибіркове обчислюємо за формулою
(17.3.9)
де
(17.3.10)
(17.3.11)
– довільне число, але для спрощення обчислень за приймається число, близьке до , частіше середина інтервалу з найбільшою частотою; для даної задачі ; – довжина інтервалу, в даному випадку .
Дисперсія обчислюється за формулою:
(17.3.12)
де
(17.3.13)
Середньоквадратичне відхилення
(17.3.14)
Коефіцієнт асиметрії обчислюється за формулою
(17.3.15)
де
(17.3.16)
(17.3.17)
Ексцес обчислюємо за формулою
(17.3.18)
де
(17.3.19)
(17.3.20)
(17.3.21)
Всі обчислення зручно звести в таблицю
№ | Інтервали міцності (кг) | Середини інтервалів | Частоти | |||||
120-140 | -3 | -3 | -27 | |||||
140-160 | -2 | -8 | -32 | |||||
160-180 | -1 | -10 | -10 | |||||
180-200 | ||||||||
200-220 | ||||||||
220-240 | ||||||||
240-260 | ||||||||
260-280 | ||||||||
Підставляючи значення сум зі стовпчиків 6, 7, 8, 9 відповідно у формули (17.3.9) – (17.3.21), отримаємо:
Невелике й додатне значення асиметрії говорить про невелику правосторонню асиметрію, а мале від’ємне значення ексцесу говорить про низковершинність розподілу, близького до нормального. Вид гістограми, а також значення асиметрії і ексцесу, дають можливість припустити, що випадкова величина, що аналізується, розподілена за нормальним законом зі щільністю
(17.3.22)
За оцінки параметрів візьмемо відповідне вибіркове середнє і середньоквадратичне відхилення , тобто
Таким чином,
Теоретична частина попадання в інтервал дорівнює ймовірності попадання цієї величини в інтервал , домноженої на (об’єм вибірки).
,
де – функція Лапласа
Необхідні значення зведемо в таблицю
Інтервали | |||||||
120-140 | -2,64 | -1,94 | -0,4958 | -0,4738 | 0,0220 | 1,1 1 | |
140-160 | -1,94 | -1,24 | -0,4738 | -0,3925 | 0,0813 | 4,06 4 | |
160-180 | -1,24 | -0,53 | -0,3925 | -0,2019 | 0,1906 | 9,59 10 | |
180-200 | -0,53 | 0,17 | -0,2019 | 0,0674 | 0,2694 | 13,42 13 | |
200-220 | 0,17 | 0,87 | 0,0674 | 0,3078 | 0,2404 | 12,02 12 | |
220-240 | 0,87 | 1,57 | 0,3078 | 0,4417 | 0,1340 | 6,70 7 | |
240-260 | 1,57 | 2,27 | 0,4417 | 0,4884 | 0,0466 | 2,33 2 | |
260-280 | 2,27 | 2,98 | 0,4884 | 0,4985 | 0,0102 | 0,51 1 | |
- | - | - | - | 0,9945 | 49,72 50 |
Користуючись критерієм Пірсона , перевіримо, чи узгоджуються дані, наведені в таблиці з гіпотезою про нормальний розподіл з параметрами . Для цього обчислимо величину за формулою
Обчислення зведемо в таблицю
Інтервали | |||||
120-140 | |||||
140-160 | |||||
160-180 | |||||
180-200 | 0,077 | ||||
200-220 | |||||
220-240 | -1 | 0,143 | |||
240-260 | |||||
260-280 | |||||
- | - | - | - | 0,22 |
Характер величини потребує, щоб необхідні частоти були не малими. Якщо вони є малими, то вони об’єднуються з сусідніми.
В даному прикладі об’єднують перші дві і дві останні в одну.
Знайдемо ;
- число груп емпіричного розподілу,
- число параметрів, які входять до теоретичного закону розподілу з числом додаткових співвідношень.
, так як емпіричні частоти задовольняють трьом співвідношення:
1) Сума частот дорівнює об’єму вибірки
2) Частоти мають бути такими, що
3) Частоти мають бути такими, що
Таким чином, квантиль розподілу рівня , який залежить від 3 ступенів свободи, знаходимо за таблицею критичних точок розподілу .
Можна зробити висновок, що різниця між теоретичними і емпіричними даними випадкова, а гіпотеза про нормальний розподіл випадкової величини (міцності деталі) приймається за різні значущості .
Контрольні запитання.
1. Які критерії називають критеріями згоди?
2. В чому полягає завдання порівняння емпіричного й теоретичного законів розподілу випадкової величини?
3. Яка статистика використовується в критерії Пірсона ? Якому закону вона підпорядковується?
4. На основі яких даних будується гіпотеза про теоретичний закон розподілу випадкової величини? Як діє критерій Пірсона ?
Задачі для самостійного розв’язку .
· Провести попередній аналіз результатів експериментальних даних. Сформулювати гіпотезу про нормальний розподіл генеральної сукупності Х. Використовуючи критерій Пірсона , на рівні значущості α=0,05 перевірити, чи узгоджується гіпотеза про нормальний розподіл генеральної сукупності Х з заданим емпіричним розподілом?
1. Вимірювалась жирність молока корів (%) із навмання обраної ферми
Границі інтервалів | 1,0-1,2 | 1,2-1,4 | 1,4-1,6 | 1,6-1,8 | 1,8-2,0 | 2,0-2,2 | 2,2-2,4 | 2,4-2,6 | 2,6-2,8 | 2,8-3,0 | 3,0-3,2 |
частоти | 5 | 12 | 18 | 22 | 36 | 24 | 19 | 15 | 11 | 9 | 2 |
2. Вимірювався рівень води навесні під час повені (см)
Границі інтервалів | 0-24 | 24-48 | 48-72 | 72-96 | 96-120 | 120-144 | 144-168 | 168-192 | 192-216 |
частоти | 1 | 2 | 4 | 6 | 12 | 16 | 6 | 3 | 1 |
3. Вимірювалось відхилення діаметру валика від його номінального розміру (мм)
Границі інтервалів | -20 - -10 | -10 - 0 | 0 - 10 | 10 - 20 | 20 - 30 | 30 - 40 | 40 - 50 |
частоти | 20 | 47 | 80 | 89 | 40 | 16 | 8 |
4. Вимірювався діаметр кульок верстатом-автоматом (мм)
Границі інтервалів | 1-3 | 3-5 | 5-7 | 7-9 | 9-11 | 11-13 | 13-15 | 15-17 | 17-19 | 19-21 | 21-23 |
частоти | 2 | 4 | 6 | 10 | 18 | 20 | 16 | 11 | 7 | 5 | 1 |
5. Вимірювався час неперервного горіння електролампочок (год), виготовлених фірмою, до виходу їх з ладу
Границі інтервалів | 6-16 | 16-26 | 26-36 | 36-46 | 46-56 | 56-66 | 66-76 | 76-86 |
частоти | 8 | 7 | 16 | 35 | 15 | 8 | 6 | 5 |
6. Вимірювалась урожайність цукрових буряків у певному районі південного регіону України (ц/га)
Границі інтервалів | 5-10 | 10-15 | 15-20 | 20-25 | 25-30 | 30-35 | 35-40 | 40-45 | 45-50 |
частоти | 7 | 8 | 15 | 18 | 23 | 19 | 14 | 10 | 6 |
7. Розподіл швидкості автомобілів (км/год)
Границі інтервалів | 61-65 | 65-69 | 69-73 | 73-77 | 77-81 | 81-85 | 85-89 | 89-93 | 93-97 | 97-101 |
частоти | 1 | 4 | 5 | 8 | 14 | 9 | 6 | 1 | 1 | 1 |
Границі інтервалів | 49-52 | 52-55 | 55-58 | 58-61 | 61-64 | 64-67 | 67-70 |
частоти | 3 | 6 | 11 | 30 | 21 | 19 | 10 |
8. Сумарне число балів у спортивних змаганнях
9. Розподіл границь міцності зразків зварного шва (Н/мм2)
Границі інтервалів | 28-30 | 30-32 | 32-34 | 34-36 | 36-38 | 38-40 | 40-42 | 42-44 |
частоти | 8 | 15 | 20 | 30 | 20 | 15 | 10 | 5 |
Границі інтервалів | 0,00-0,02 | 0,02-0,04 | 0,04-0,06 | 0,06-0,08 | 0,08-0,10 | 0,10-0,12 | 0,12-0,14 | 0,14-0,16 |
частоти | 9 | 15 | 29 | 35 | 32 | 19 | 8 | 3 |
Границі інтервалів | 8,95-9,05 | 9,05-9,15 | 9,15-9,25 | 9,25-9,35 | 9,35-9,45 | 9,45-9,55 | 9,55-10,05 |
частоти | 4 | 8 | 11 | 7 | 5 | 3 | 2 |
10. Розподіл відхилення напруги від номіналу (мВ)
11. Час виконання вправи (с)
12. Горизонтальне відхилення від цілі (м) для 200 іспитів ракет
Границі інтервалів | -40 - -30 | -30 - -20 | -20 - -10 | -10 -0 | 0 - 10 | 10 -20 | 20 -30 | 30 -40 | 40 -50 | 50 -60 |
частоти | 7 | 11 | 15 | 24 | 49 | 41 | 26 | 17 | 7 | 3 |
Границі інтервалів | 40-50 | 50-60 | 60-70 | 70-80 | 80-90 | 90-100 | 100-110 | 110-120 |
частоти | 5 | 9 | 13 | 24 | 20 | 15 | 8 | 5 |
13. Результати лабораторного аналізу зразків сланцевих порід на вміст окису кремнію (у. о.)
14. Результати лабораторного аналізу зразків сланцевих порід на вміст окису алюмінію (у. о.)
Границі інтервалів | 10-11 | 11-12 | 12-13 | 13-14 | 14-15 | 15-16 | 16-17 | 17-18 |
частоти | 6 | 10 | 14 | 25 | 21 | 16 | 9 | 6 |
15. Величина опору партії резисторів (кОм)
Границі інтервалів | 6-7 | 7-8 | 8-9 | 9-10 | 10-11 | 11-12 | 12-13 | 13-14 |
частоти | 5 | 9 | 15 | 30 | 18 | 14 | 8 | 5 |
Границі інтервалів | -13,5 – -8,5 | -8,5 – -3,5 | -3,5 – 1,5 | 1,5 – 6,5 | 6,5 – 11,5 | 11,5 – 16,5 | 16,5 – 21,5 | 21,5 – 26,5 |
частоти | 5 | 9 | 13 | 24 | 20 | 15 | 8 | 5 |
16. Результати вимірів ємності конденсаторів дали відхилення від номіналу (пкФ)
17. Заміри амплітуди коливань (мм) приладу дали такі результати
Границі інтервалів | 60-65 | 65-70 | 70-75 | 75-80 | 80-85 | 85-90 | 90-95 | 95-100 |
частоти | 7 | 10 | 15 | 30 | 25 | 15 | 8 | 7 |
Границі інтервалів | 40-45 | 45-50 | 50-55 | 55-60 | 60-65 | 65-70 | 70-75 | 75-80 |
частоти | 5 | 9 | 14 | 30 | 16 | 9 | 7 | 5 |
18. Результати вимірів часу відновлення діодів (нс)
Границі інтервалів | 6-8 | 8-10 | 10-12 | 12-14 | 14-16 | 16-18 | 18-20 | 20-22 |
частоти | 5 | 9 | 13 | 24 | 20 | 15 | 8 | 5 |
19. Діаметри шариків, виготовлених станком автоматом (мм)
20. Точність наладки станка автомата характеризується дисперсією довжини деталі (мкм2)
Границі інтервалів | 200-250 | 250-300 | 300-350 | 350-400 | 400-450 | 450-500 | 500-550 | 550-600 |
частоти | 10 | 15 | 18 | 27 | 17 | 13 | 10 | 5 |
Границі інтервалів | -3,00 – -2,5 | -2,5 – -2,0 | -2,0 – -1,5 | -1,5 – -1,0 | -1,0 – -0,5 | -0,5 – 0,0 | 0,0 – 0,5 | 0,5 – 1,0 |
частоти | 5 | 9 | 13 | 24 | 20 | 15 | 8 | 5 |
21. Результати відхилення розмірів деталей від номіналу (мм)
22. Вимірювання відхилення величини опору від номіналу для партії однотипних резисторів дало такі результати (Ом)
Границі інтервалів | -2,00 – -1,5 | -1,5 – -1,0 | -1,0 – -0,5 | -0,5 – 0,0 | 0,0 – 0,5 | 0,5 – 1,0 | 1,0 – 1,5 | 1,5 – 2,0 |
частоти | 5 | 9 | 13 | 24 | 20 | 15 | 8 | 5 |
Границі інтервалів | -3,0 – -2,0 | -2,0 – -1,0 | -1,0 – 0,0 | 0,0 – 1,0 | 1,0 – 2,0 | 2,0 – 3,0 | 3,0 – 4,0 | 4,0 – 5,0 |
частоти | 4 | 10 | 15 | 25 | 20 | 15 | 6 | 5 |
23. Виміри деякої величини дали такі похибки (мм)
Границі інтервалів | 60-65 | 65-70 | 70-75 | 75-80 | 80-85 | 85-90 | 90-95 | 95-100 |
частоти | 5 | 10 | 15 | 25 | 20 | 15 | 10 | 5 |
24. Виміри амплітуди коливань приладу дали такі результати (мм)
Границі інтервалів | 50-55 | 55-60 | 60-65 | 65-70 | 70-75 | 75-80 | 80-85 | 85-90 |
частоти | 5 | 10 | 15 | 30 | 20 | 15 | 10 | 5 |
25. Результати вимірів часу відновлення діодів (нс)