Статистичні гіпотези. Критерії оцінки гіпотез
Визначення ► Гіпотеза – форма мислення, що становить собою припущення про існування певного закономірного зв’язку між явищами, причини виникнення яких невідомі.
Статистичні гіпотези, які будуть розглядатися в даному курсі, поділяються на направлені і ненаправлені, які, в свою чергу, поділяються на нульові і альтернативні.
Визначення ► Нульова гіпотеза (Н0) – гіпотеза про відсутність різниць в значеннях порівнювальних ознак. Наприклад Н0: ( x1 – x2 = 0, де x1, x2 – порівнювальні значення ознак).
Увага | Нульова гіпотеза – це те, що треба спростувати, якщо перед нами стоїть завдання довести значущість різниць. | |
Визначення ► | · Альтернативна гіпотеза (Н1) – гіпотеза про значущість різниць в значеннях порівнювальних ознак. · Експериментальна гіпотеза – це альтернативна гіпотеза, яку ми хочемо довести. Наприклад, Н1: (х1 ≠ х2; х1, х2 – порівнювальні значення ознак). · Направленігіпотези: Н0: х1≤х2; (х1 відрізняється (менше або дорівнює) від х2), Н1: х1>х2. · Ненаправленігіпотези. Н0: х1 не відрізняється від х2 (х1=х2); Н1: х1 відрізняється від х2 (х1≠х2). | |
Увага | Перевірка гіпотез здійснюється за допомогою критеріїв оцінки відмінностей ознак. | |
Існують параметричні і непараметричні критерії статистичної оцінки відмінностей ознак.
Визначення ► Статистичні критерії – це правила, що забезпечують надійну поведінку порівнювальних ознак (тобто прийняття істинної та відхилення хибної гіпотези) з високою ймовірністю.
Висновки | · Із співвідношень емпіричного і критичного (яке визначається з таблиць) значень критерію ми можемо судити про те, чи підтверджується або не підтверджується нульова гіпотеза. (Наприклад, якщо χ2емп > χ2кр, то Но відхиляється (гіпотеза про відсутність різниць). · У більшості випадків для того, щоб ми признали різницю значущою, необхідно, щоб емпіричне значення критерію перебільшувало критичне (виключення представляють критерій знаків – G; критерій Манна-Уітні – U; Т – Вілкоксона). · У більшості випадків одне і те ж емпіричне значення критерію може визнаватися значущим або незначущим у залежності від: а) кількості спостережень у досліджуваній вибірці (n); б) кількості ступенів свободи (ν), що дорівнює числу класів варіаційного ряду мінус число умов, при яких він сформований, причому до числа умов відносяться: об’єм вибірки (n), середнє ( ) та дисперсія (S2). |
Статистичні критерії поділяються на параметричні і непараметричні.
Визначення ► | · Параметричні критерії – критерії, що засновані на нормальному розподілі генеральної сукупності, або які включають у формули розрахунку параметри розподілу, тобто середнє ( ) і дисперсію (S2) або стандартне відхилення. · Непараметричні критерії – критерії, що не базуються на припущенні про тип розподілу генеральної сукупності і які не включають у формулу розрахунку параметри розподілу, а засновані на оперуванні частотами або рангами з використанням порядкових та інтервальних шкал. |
Можливості та обмеження параметричних і непараметричних критеріїв
Параметричні критерії | Непараметричні критерії |
1. Дозволяють безпосередньо оцінити розбіжності, що отримані в двох вибірках (t – критерій Ст’юдента). 2. Дозволяють прямо оцінити розбіжності в дисперсіях (критерій φ*– Фішера). 3. Дозволяють виявити тенденції змін ознаки при переході від умови до умови (дисперсійний однофакторний аналіз), але лише за умов нормального розподілу ознаки. 4. Дозволяють оцінити взаємодію одного і більше факторів і їх взаємного впливу на зміни ознаки (двофакторний дисперсійний аналіз). 5. Експериментальні дані повинні відповідати двом, а іноді трьом умовам: а) значення ознаки виміряні в інтервальній шкалі; б) розподілення ознаки є нормальною; в) в дисперсійному аналізі повинна виконуватися вимога рівності дисперсії в ячейках комплексу. 6. Математичні розрахунки доволі складні. 7. Якщо умови, перераховані в п.5, виконуються , параметричні критерії стають дещо більш міцними, ніж непараметричні. | Дозволяють оцінити лише середні тенденції, наприклад, відповісти на запитання, чи частіше зустрічаються у вибірці А більш високі, а у вибірці Б – більш низькі значення ознаки (критерії Q – Розенбаума, U – Манна-Уітні, φ* – Фішера та ін.). Дозволяють оцінити лише розбіжності в діапазонах варіативності ознаки (критерій φ*–Фішера). Дозволяють виявити тенденції змін ознаки при переході від умови до умови при будь-якому розподіленні ознаки (критерії тенденцій L – Пейджа і S – Джонкіра). Ця можливість відсутня. Експериментальні дані можуть не відповідати жодній з цих умов: а) значення ознаки можуть бути представлені в будь-якій шкалі, починаючи від шкали найменувань; б) розподіл ознаки може бути будь-яким і збіг його з певним теоретичним законом розподілення не обов’язковий, і для нього не потрібна перевірка; в) вимога рівності дисперсій відсутня. Математичні розрахунки в більшій частині прості і не вимагають багато часу (за виключенням критеріїв – Фрідмана і λ – Колмогорова-Смирнова). Якщо умови, перераховані в п.5, не виконуються, непараметричні критерії стають більш міцними, тому що вони менш чутливі "до забруднення". |
Дослідження таблиці 8 дають можливість зробити наступні висновки.