Перевірка гіпотези про порівняння середнього значення ознаки генеральної сукупності зі стандартом

Статистична перевірка гіпотез.

Критерії згоди.

Часто результати вибіркових випробувань є підставою для прийняття одного з альтернативних рішень (наприклад: дана методика викладання предмету є ефективною або неефективною; середній термін придатності продукту, що зазначений на упаковці, є правильним або хибним; прибуток за певним проектом у поточному місяці буде більшим за вказану суму або меншим від неї; певний економічний індекс є нормально розподіленою величиною або розподілений за іншим законом і т.д.). Отже, в даному розділі мова йтиме про висунення певних гіпотез, які необхідно перевірити. Гіпотези, що перевірятимемо, формулюємо на підставі теоретичних міркувань або в результаті статистичних досліджень. Якщо вибірка, за якою висуваємо гіпотезу, має статистичний характер, то саму гіпотезу логічно також назвати статистичною.

Отже, статистичною називають гіпотезу про вигляд невідомого закону розподілу або про параметри відомого розподілу. Наприклад, статистичними є такі гіпотези: генеральна сукупність розподілена за біномним законом; дисперсії двох нормально розподілених генеральних сукупностей рівні між собою, тощо.

Гіпотезу, яку висуваємо, назвемо нульовою, або основною, і позначимо . Конкуруюча, або альтернативна – це гіпотеза, яка повністю чи частковосуперечить висунутій, її позначимо . Наприклад, якщо нульова гіпотеза : генеральна сукупність розподілена за нормальним законом, то одна з альтернативних їй гіпотез може мати вигляд : ця сукупність не розподілена нормально.

Гіпотези поділяються на прості і складні. Проста гіпотеза містить тільки одне припущення. Складна гіпотеза складається із скінченного або нескінченного числа простих гіпотез. Наприклад, якщо – параметр нормального розподілу, то гіпотеза є простою гіпотезою, а гіпотеза , яка складається з нескінченої множини простих гіпотез , де – будь-яке число, що не дорівнює 3, є складною гіпотезою.

Нехай висунуто нульову гіпотезу та альтернативну до неї. Ці гіпотези конкурують одна з одною і потрібно на підставі певних спостережень визначити, якій з них надати перевагу. При цьому можна допустити помилки двох типів:

· помилка першого роду – ми відхиляємо гіпотезу, яка в дійсності є правильною;

· помилка другого роду – ми приймаємо гіпотезу, яка насправді є хибною.

Наслідки цих помилок можуть бути дуже різними. Часто помилка першого роду має більш вагомі наслідки, ніж помилка другого роду

Ймовірність зробити помилку першого роду позначають і називають рівнем значущості. Як правило, значення приймають рівним 0,05; 0,01; 0,001. Наприклад, якщо прийнято , то це означає, що в 1% випадків є ризик припуститися помилки першого роду, тобто відхилити правильну гіпотезу. Чим небажанішою є помилка першого роду, тим меншим вибирають значення .

Для перевірки нульової гіпотези вводять певну чисельну характеристику, яка обчислюється за вибіркою і на підставі якої вирішують: прийняти основну гіпотезу чи альтернативну гіпотезу . Зрозуміло, що вибрана чисельна характеристика для різних вибірок матиме різні значення, які наперед невідомі, і тому вона є випадковою величиною.

Статистичним критерієм (статистикою) гіпотези називають випадкову величину , за допомогою якої проводять перевірку гіпотези. Цю випадкову величину вибираємо такою, щоб закон розподілу її ймовірностей (точний або наближений) був відомий. Емпіричним (спостережуваним) значенням критерію гіпотези називають значення випадкової величини , обчислене за певною вибіркою. Емпіричне значення критерію гіпотези позначається . Сукупність значень критерію (випадкової величини ), за яких нульова гіпотеза відхиляється, називають критичною областю, а сукупність значень критерію , за яких нульову гіпотезу приймають, – областю прийняття гіпотези (областю допустимих значень).

Звідси маємо таке правило перевірки статистичних гіпотез:якщо емпіричне (спостережуване) значення критерію належить критичній області, то нульову гіпотезу відхиляємо; якщо емпіричне значення критерію належить області прийняття гіпотези, то гіпотезу приймаємо.

Якщо випадкова величина є одновимірна, то критична область, як правило, є інтервалом на прямій, який відділений від області прийняття гіпотези критичними точками . Тобто для знаходження критичної області достатньо визначити критичні точки.

Розрізняють три види критичних областей на прямій.

1) Правостороння область (рис.12.1) – це та область на числовій прямій, що визначається нерівністю . Критичну точку у цьому випадку шукаємо за рівнем значущості із співвідношення

(12.1)

Рис.12.1. Правостороння критична область

2) Лівостороння область (рис.12.2) – це та область на числовій прямій, що визначається нерівністю . Критичну точку знаходимо з рівності

(12.2)

Рис.12.2. Лівостороння критична область

Лівосторонню та правосторонню критичні області називають односторонніми критичними областями.

3) Двостороння критична область (рис.12.3) – це та область на числовій прямій, що визначається об’єднанням інтервалів: і . Для знаходження критичних точок використовуємо співвідношення . Виходячи з цієї рівності існує безліч способів вибору . Якщо закон розподілу критерію симетричний відносно точки 0, то двосторонню критичну область будують як симетричну, розділяючи порівну між «хвостами» розподілу, тобто визначаючи = – і = із рівняння:

(12.3)

Рис.12.3. Двостороння критична область

Отже, перевірку статистичної гіпотези проводять за такою схемою:

1) Формулюємо нульову гіпотезу , альтернативну гіпотезу і задаємо рівень значущості для перевірки гіпотези ;

2) Визначаємо критерій для перевірки гіпотези , який є випадковою величиною з відомим розподілом її ймовірностей;

3) За виглядом альтернативної гіпотези встановлюємо вид критичної області (лівостороння, правостороння чи двостороння). Для її побудови за рівнем значущості знаходимо критичні точки за однією рівностей (12.1)–(12.3);

4) Визначаємо емпіричне (спостережуване) значення критерію за конкретною вибіркою;

5) Приймаємо рішення: якщо емпіричне значення критерію потрапляє в критичну область, то нульову гіпотезу відхиляємо; якщо ж значення потрапляє в область допустимих значень, то нульову гіпотезу приймаємо.

Очевидно, що для певної гіпотези можна побудувати різні критерії її перевірки, і за кожним таким критерієм на підставі однієї і тієї ж вибірки можна одержувати свій (можливо, різний) результат щодо прийняття нульової гіпотези . Тому для визначення оптимального критерію за даного рівня значущості вводиться така характеристика як потужність критерію. Потужністю критерію називають ймовірність відхилити нульову гіпотезу, якщо вона є хибною. Тобто, потужність критерію (наскільки критерій вибрано правильно) визначається як ймовірність не допустити помилку другого роду при даному критерії.

Якщо ймовірність помилки другого роду позначити через , то потужність критерію дорівнює . Нехай потужність зростає, тоді ймовірність зробити помилку другого роду зменшується. Таким чином, чим більша потужність критерію, тим менша ймовірність помилки другого роду. Отже, якщо рівень значущості задано, то критичну область варто будувати так, щоб потужність критерію була максимальною.

Перевірка гіпотези про порівняння середнього значення ознаки генеральної сукупності зі стандартом

Нехай ознака генеральної сукупності розподілена за нормальним законом. Математичне сподівання досліджуваної ознаки невідоме, але є підстави припустити, що його значення збігається зі стандартом . Тоді виникає потреба у перевірці нульової гіпотези . Вибір критерію для перевірки цієї гіпотези залежить від того, чи є відомою дисперсія генеральної сукупності.

Випадок I.Дисперсія генеральноїсукупності відома. При відомій дисперсії генеральноїсукупності(далі позначатимемо ) за критерій перевірки гіпотези про значення математичного сподівання використовуємо статистику

, (12.4)

що має нормальний розподіл із параметрами (0;1) (так званий нормований нормальний розподіл), де – вибіркове середнє, – обсяг вибірки.

В залежності від вигляду конкуруючої гіпотези будуємо відповідну критичну область. А саме:

1) якщо конкуруюча гіпотеза , то критична область двостороння, а критичне значення знаходимо за таблицею значень функції Лапласа (додаток 3), використовуючи рівняння:

. (12.5)

Якщо , то гіпотезу приймаємо; якщо ( потрапляє в критичну область (рис.12.3)), то відхиляємо гіпотезу на користь альтернативи

2) Якщо конкуруюча гіпотеза , то критична область – правостороння; критичну точку шукаємо з рівняння:

(12.6)

Якщо то немає підстав відхиляти гіпотезу ; якщо ( потрапляє в правосторонню критичну область (рис.12.1) ), то нульову гіпотезу відхиляємо на користь альтернативної.

3) Якщо , то критична область – лівостороння; критичне значення шукаємо за формулою (12.6).

Тоді, якщо то немає підстав відхиляти гіпотезу ; якщо ( потрапляє в лівосторонню критичну область (рис.12.2)), то гіпотезу відхиляємо на користь гіпотези .

Приклад 12.1. З нормально розподіленої генеральної сукупності створена випадкова вибірка з 64 покупців, які цікавились товаром А. З них товар А купили 16 людей. Постачальник стверджує, що даний товар повинен привернути увагу третини покупців при середньому квадратичному відхиленні рівному одній людині. Перевірити цю гіпотезу при -му рівні значущості.

Розв’язання. Гіпотетичне значення математичного сподівання генеральної сукупності, згідно з твердженням постачальника, дорівнює 21 людині ( ), а середнє квадратичне відхилення . Таким чином, мова йде про перевірку гіпотези про числове значення математичного сподівання нормального розподілу при відомій дисперсії, тобто про порівняння гіпотетичного генерального середнього з вибірковим середнім при відомому генеральному середньому квадратичному відхиленні.

Нульова гіпотеза в цій задачі має вигляд , а альтернативна, наприклад, . Можливі й інші альтернативні гіпотези, наприклад, або . Рівень значущості заданий: .

За критерій у цьому випадку вибираємо статистику (12.4)

Критична область буде симетричною двосторонньою, її утворюють інтервали . За формулою (12.5) обчислюємо З таблиць значень функції Лапласа (додаток 3) знаходимо . Точка розташована симетрично і дорівнює -1,96. Звідси випливає, що критична область складається з інтервалів . Значення потрапляє в критичну область, тому гіпотеза відхиляється. Отже, твердження постачальника є хибним.

Якщо альтернативна гіпотез має вигляд (можливо, вона більш логічна, ніж гіпотеза , оскільки вибіркове середнє менше за ), то за формулою (12.6) обчислюємо . З таблиць значень функції Лапласа (додаток 3) знаходимо Так як , то нульову гіпотезу відхиляємо на користь альтернативи .

Випадок II. Дисперсія генеральноїсукупності невідома. Якщо дисперсія ознаки генеральної сукупності невідома, то за критерій перевірки нульової гіпотези використовуємо статистику

, (12.7)

де – вибіркове середнє, а – виправлене вибіркове середнє квадратичне відхилення. Випадкова величина має розподіл Стьюдента з числом ступенів вільності.

Подальша побудова критичної області здійснюється аналогічно, як викладено у Випадку 1, з тією відмінністю, що критичні точки визначаються за таблицею розподілу Стьюдента (додаток 7).

Приклад 12.2. Для вибірки обсягу з нормально розподіленої генеральної сукупності за ознакою знайдено вибіркове середнє та виправлене середнє квадратичне відхилення Для рівня значущості перевірити нульову гіпотезу за конкуруючої гіпотези: а) ; б) .

Розв’язання. Обчислимо емпіричне значення критерію за формулою (12.7):

.

Розглянемо два випадки, які сформульовані в задачі:

а) у випадку альтернативної гіпотезиза таблицею додатка 7 для числа ступенів вільності і рівня значущості , що зосереджений у верхньому рядку таблиці, знаходимо: Оскільки , то приймаємо гіпотезу

б) у випадку альтернативної гіпотези за таблицею додатка 7 для числа ступенів вільності і рівня значущості що зосереджений у нижньому рядку таблиці, знаходимо: Оскільки ( потрапляє в правосторонню критичну область), то гіпотезу відхиляємо, а приймаємо гіпотезу .

Приклад 12.3. Презентуючи новий принтер виробник стверджує, що середній термін його безвідмовної роботи– 5900 год. Для вибірки із 50 таких принтерів середній термін безвідмовної роботи виявився рівним 5720 год при виправленому середньому квадратичному відхиленні 700 год. За 5%-го рівня значущості перевірити гіпотезу про те, що значення 5900 год є математичним сподіванням (реальним середнім терміном безвідмовної роботи запропонованого пристрою). Вважати, що генеральна сукупність розподілена нормально.

Розв’язання. Потрібно перевірити гіпотезу про значення математичного сподівання нормально розподіленої генеральної сукупності при невідомій генеральній дисперсії. В цьому випадку за критерій вибирають випадкову величину , що визначається формулою (12.7). Величина Т має розподіл Стьюдента з ступенями вільності. В даній задачі мова йде про порівняння вибіркового середнього 5720 год з гіпотетичним математичним сподіванням год, при цьому виправлене середнє квадратичне відхилення 700 год.

Потрібно знайти критичну область для нульової гіпотези . Нехай альтернативна гіпотеза має вигляд . Очевидно, що інші альтернативні гіпотези ( і ) недоцільні, оскільки споживач переважно турбується лише про те, що термін використання пристрію може виявитися меншим ніж гарантує виробник.

Критична область лівостороння; знаходимо з умови . При і з таблиці розподілу Стьюдента ( додаток 7), знаходимо .Таким чином, критична область: . Обчислюємо :

Значення потрапляє в критичну область ( , тому нульова гіпотеза повинна бути відхилена. Звідси випливає, що виробник на презентації завищив термін безвідмовної роботи нового принтера.

Наши рекомендации