Проверка гипотез о числовых значениях параметров
Остановимся теперь на примерах статистических критериев, при этом важные критерии относящиеся к корреляционно-регрессионному анализу будут обсуждаться в соответствующих разделах. Здесь мы опишем несколько примеров статистических критериев, предназначенных для проверки простых статистических гипотез относительно числовых параметров анализируемых законов распределения вероятностей.
Общая схема статистической проверки гипотез:
- Формулируется основная H1 и альтернативная H1 гипотезы.
- Выбирается соответствующий уровень значимости a.
- Определяется объем выборки n.
- Выбирается критерий K для проверки H0.
- Строится критическая область и область принятия гипотезы (в соответствии с выбранной альтернативной гипотезой).
- Вычисляется наблюдаемое значение критерия Kнабл (по данным выборки).
- Принимается статистическое решение (если Kнабл попадает в область принятия решений, то нет оснований отклонять основную гипотезу, т.е. она принимается, если Kнабл попадает в критическую область, то основная гипотеза отвергается).
Критерии проверки гипотез о числовых значениях параметров нормального распределения приведены в таблице 3.
Таблица 3.7
H0 | Предположения | Статистика критерия | H1 | Область принятия решения |
a=a0 | s2 известно | a¹a0 | ||
a>a0 | ||||
a<a0 | ||||
s2 неизвестно | a¹a0 | |||
a>a0 | ||||
a<a0 | ||||
a неизвестно | ||||
Проверка статистических гипотез с использованием критериев значимости может быть проведена на основе доверительных интервалов. Для всех параметрических гипотез Для всех параметрических гипотез область принятия гипотезы H0: q=q0 на уровне значимости a совпадает с доверительным интервалом для параметра q при доверительной вероятности 1–a. При этом одностороннему критерию значимости соответствует односторонний доверительный интервал, а двухстороннему критерию значимости – двухсторонний доверительный интервал. Гипотеза H0 принимается, если значение q0 накрывается соответствующим доверительным интервалом; в противном случае гипотеза H0 отвергается.
Если проверяется гипотеза H0:q=q0, то рассматривается доверительный интервал для разности q1–q2. Гипотеза принимается, если доверительный интервал для разности параметров q1–q2 накрывает нулевые значения. Для проверки гипотезы о равенстве двух дисперсий H0: строится доверительный интервал для отношения дисперсий . В этом случае гипотеза H0 принимается, если доверительный интервал накрывает значение, равное единице.
Пример 3.11. Утверждается, что шарики, изготовленные станком-автоматом, имеют средний диаметр d0=10 мм. В выборке из n=16 шариков средний диаметр оказался равным мм. Проверить нулевую гипотезу H0: , считая, что дисперсия известна и равна s2=1 мм2. Считать уровень значимости a=0,05.
Решение. Введем статистический критерий:
,
который при справедливости нулевой гипотезы H0, имеет стандартное нормальное распределениеN(0;1). Пусть альтернативная гипотеза имеет вид H1: , то критическая область будет иметь двухсторонний вид: (–¥;–Zкрит)È(Zкрит;+¥), где Zкрит определяется из условия
,
или
.
Поскольку
не попадает в критическую область, то нет оснований отклонять нулевую гипотезу, т.е. что шарики, изготовленные станком-автоматом, имеют средний диаметр 10 мм.
Данную задачу можно решить и при помощи доверительных интервалов. Мы уже разбирали, что доверительный интервал для нормального случайной величины при известном s имеет вид
.
Поскольку t0,95=1,96, то
.
Так как d0=10Î(9,84; 10,76), то гипотеза H0 принимается. â
Пример 3.12. Анализируется доход X фирм в отрасли, имеющей нормальное распределение. Предполагается, что средний доход в данной отрасли составляет не менее 1 млн $. По выборке из 49 фирм получены следующие данные: млн $ и s=0,15 млн $. Не противоречат ли эти результаты выдвинутой гипотезе при уровне значимости a=0,01?
Решение. Сформулируем основную и альтернативную гипотезы:
, .
Для проверки гипотезы H0 строим критерий
.
Критическая область будет левосторонней, поэтому
.
Поскольку Tнабл=–4,67<–2,404=Tкрит, то H0 должна быть отклонена в пользу H1, что дает основание считать, что средний доход в отрасли меньше, чем 1 млн $. â
Пример 3.13. Точность работы станка-автомата, заполняющего пакеты порошком, определяется совпадением веса пакетов. Дисперсия веса не должна превышать 25 г2. По выборке из 20 пакетов определена дисперсия s2=30 г2. Определите, требуется ли срочная наладка станка на уровне значимости a=0,05.
Решение. Сформулируем основную и альтернативную гипотезы, соответствующие условию задачи:
, .
Рассчитаем наблюдаемое значение критерия
.
Найдем критическое значение критерия
.
Так как , то нет оснований отклонять основную гипотезу H0, т.е. имеющиеся данные не дают основания считать, что станок требует срочной наладки. â
3.5.3. Проверка гипотез о сравнении параметров
генеральной совокупности
При анализе многих экономических показателей приходится сравнивать две генеральные совокупности. Например, можно сравнивать уровни жизни в двух странах по размеру дохода на душу населения; можно сравнивать два варианта инвестирования по размерам средних дивидендов; качество знаний студентов двух университетов – по среднему баллу на комплексном тестовом экзамене. В этих случаях логично провести сравнение по схеме анализа равенства математических ожиданий двух генеральных совокупностей X и Y.
Рассмотрим две случайные величины X~N(a1,s1) и Y~N(a2,s2), каждая из которых подчиняется нормальному закону распределения. Пусть имеются две независимые выборки с объемами n1 и n2 из генеральных совокупностей X и Y. Необходимо проверить нулевую гипотезу H0: M[X]=M[Y]. Нулевая гипотеза в приведенной формулировке является сложной, поскольку она справедлива при любых a=M[X]=M[Y], однако она может быть сведена к простой, если рассматривать разность средних, т.е. H0: M[X]–M[Y]=0.
Относительно параметров и можно выделить четыре варианта предположений:
a) обе дисперсии известны и равны между собой;
b) обе дисперсии известны, но неравны между собой ;
c) обе дисперсии неизвестны, но предполагается, что они равны между собой;
d) обе дисперсии неизвестны и их равенство не предполагается.
Критерии проверки гипотез о числовых значениях параметров нормального распределения приведены в таблице 3.8. Отметим, что в таблице 3.8 вариант a) рассматривается как частный случай варианта b). В случае неизвестных дисперсий, равенство которых не предполагается, используется аналог статистики варианта b) с заменой неизвестных дисперсий их оценками
. (3.29)
В этой ситуации указать точное распределение введенной статистики затруднительно. Известно, однако, что это распределение близко к распределению Стьюдента с числом степеней свободы, равным
. (3.30)
Критерий проверки устроен так же, как и для варианта c).
Таким образом, для выбора подходящей проверочной статистики в случае, когда генеральные дисперсии неизвестны, необходимо знать, какое предположение принимается. Прежде всего нужно решить, можно ли считать неизвестные генеральные дисперсии равными или нет. Для принятия решения используют F-критерий Фишера (см. далее).
Таблица 3.9
H0 | Предположения | Статистика критерия | H1 | Область принятия решения |
a1=a2 | , известны | a1¹a2 | ||
a1>a2 | ||||
a1<a2 | ||||
, неизвестны, но равны | , где | a1¹a2 | ||
a1>a2 | ||||
a1<a2 |
Зачастую при сравнении двух экономических показателей на первый план выходит анализ разброса значений рассматриваемых случайных величин. Например, при решении вопроса об инвестировании в одну из двух отраслей остро стоит проблема риска вложений. При сравнении уровней жизни в двух странах среднедушевые доходы могут оказаться приблизительно равными. Сопоставив разброс в доходах, мы получаем более точное представление о них. Анализ, аналогичный описанному выше, целесообразно проводить путем сравнения дисперсий исследуемых случайных величин.
Пусть X~N(a1,s1) и Y~N(a2,s2), причем их средне квадратичные отклонения s1 и s2 неизвестны. Выдвигается гипотеза о равенстве дисперсий . Однако это гипотеза в приведенной формулировке является сложной, поэтому вместо этой гипотезы рассматривается другая, простая гипотеза об отношении дисперсий, т.е. .
В качестве критерия проверки гипотезы H0 принимают случайную величину
, (3.31)
определяемую отношение большей исправленной выборочной дисперсии к меньшей ( ). Если нулевая гипотеза H0 верна, то данная статистика имеет F-распределение Фишера с n1=n1–1 и n2=n2–1 степенями свободы. Различные случаи использования этого критерия Фишера приведены в таблице 3.8.
Таблица 3.8
H0 | Предположения | Статистика критерия | H1 | Область принятия решения |
a1, a2 неизвестны | , ( ) | |||
Пример 3.14. Компания по производству сахарного песка имеет производственные линии для наполнения мешочков сахарным песком по 1 кг. Используя данные, собранные в течение долгого периода времени, управляющий оценивает генеральное стандартное отклонение массы мешочков, поставляемых с линии А в 0,02 кг (s1) и с линии B в 0,04 кг (s2). Из линии A была взята случайная выборка объемом n1=10 мешочков и найдена средняя масса содержимого в мешочках . Подобная выборка объемом n2=12 мешочков была взята из линии B и найдена средняя масса . Имеется ли какое-нибудь основание предполагать, что две производственные линии развешивают сахарный песок по мешочкам, средняя масса которых отличается?
Решение. Сформулируем основную и альтернативную гипотезы, соответствующие условию задачи:
, .
Поскольку генеральные дисперсии ( и ) известны, проверим существенность разности между выборочными средними, используя нормальное распределение на уровне значимости a=0,01. Вычисляем наблюдаемое значение критерия
Поскольку критическая область имеет двухсторонний вид, то критическое значение критерия будет определяется из условия
,
или
.
В результате получаем, что |Zнабл|<Zкрит, т.е. нет оснований отклонять нулевую гипотезу. Следовательно, можно полагать, что мешочки, наполненные сахаром на двух производственных линиях, имеют одинаковую среднюю массу. â
Пример 3.15. Для исследования качества масла были сделаны выборки по 10 единиц из каждой последовательной серии (n1 и n2) и определена доля воды в процентах x в каждой выборке. В первой серии средний процент составил с исправленным средним квадратичным отклонением . Для второй серии средний процент воды составил со средним квадратичным отклонением . Имеются ли основания предполагать на 5%-ом уровне значимости, что две серии масла имеют различную массовую долю воды?
Решение. Сформулируем основную и альтернативную гипотезы, соответствующие условию задачи:
, .
Поскольку генеральные дисперсии ( и ) неизвестны, то следует предварительно проверить о равенстве генеральных дисперсий, т.е. проверяем нулевую гипотезу с соответствующей альтернативной гипотезой:
, .
наблюдаемое значение критерия Фишера:
.
Здесь учено, что . Поскольку, в соответствии с выбранной альтернативной гипотезой, критическая область будет двухсторонней, то определяет критической значение критерия Фишера:
В результате получаем, что Fнабл<Fкрит, т.е. нет оснований отклонять нулевую гипотезу. Следовательно, можно полагать, что две генеральные дисперсии раны друг другу.
Продолжим теперь испытание гипотез о равенстве двух генеральных средних. Для этого вычислим наблюдаемое значение соответствующего критерия Стьюдента:
,
.
Поскольку критическая область также будет двухсторонней, то соответствующая критическое значение критерия Стьюдента будет равно:
.
В результате получаем, что Tнабл>Tкрит, т.е. нулевая гипотеза отклоняется. Следовательно, можно полагать, что две серии проб имеют разное содержание воды (по массе). â
Дополнение 1.
МЕТОД МОМЕНТОВ
Выше мы рассмотрели методы оценки числовых характеристик генеральной совокупности, не привязываясь к какой-либо функции распределения. Однако для полного описания генеральной совокупности нужно знать ее функцию распределения. Если известен вид функции распределения, то остается оценить только ее параметры. Для определения используются различные методы. Один из них – метод моментов, который заключается в следующем. Определяются выборочные моменты (например, математическое ожидание, дисперсию) в количестве, равном числу оцениваемых параметров, и приравниваются соответствующим теоретическим моментам распределения, являющихся функциями от неизвестных параметров.
Пример 3.16. Найти методом моментов оценки параметров a и s нормального распределения:
.
Решение. Для отыскания двух параметров необходимо иметь два уравнения относительно этих параметров. Следуя методу моментов, приравняем, например, начальный теоретический момент 1-го порядка (математическое ожидание): эмпирическому моменту 1-го порядка (среднему значению): , а также центральный теоретический момент
2-го порядка (дисперсию): центральному моменту 2-го порядка (исправленной выборочной дисперсии): . В результате получаем два уравнения:
, ,
из которых и находим искомые оценки. â
Пример 3.17. Найти методом моментов оценку параметра l распределения Пуассона:
,
где , l>0.
Решение. Задачу решим двумя способами.
а) Сравним начальные моменты 1-го порядка, т.е. математические ожидания: Поскольку для распределения Пуассона , то получим
.
б) Сравним начальные моменты 2-го порядка. Для распределения Пуассона , тогда . Тогда
.
Оценки разные. По смыслу параметра распределения Пуассона лучше предпочесть первую оценку.
Как мы видим, неопределенность выбора начальных моментов приводит к получению различных оценок для одного и того же параметра. Однако метод моментов, как правило, приводит к состоятельным оценкам. Это означает, что при достаточно больших выборках различие между разными оценками будет незначительным. Недостаток метода моментов заключается в том, что его оценки (за редким исключением) – неэффективны. Поэтому метод моментов используется на практике только как первое приближение, основываясь на которых можно получить более эффективные оценки. Популярность метода моментов состоит в том, что уравнения метода моментов во многих случаях являются достаточно простыми и их решение не связано большими математическими трудностями. â
Дополнение 2.
МЕТОД МАКСИМАЛЬНОГО ПРАВДОПОДОБИЯ
Как мы видели, разные методы оценивания одних и тех же параметров распределения могут давать разные результаты. Когда есть несколько путей к одной цели, естественно, хочется выбрать наилучший. При определенных ограничениях таким методом является метод максимального правдоподобия, основанный на оптимальном использовании имеющейся в выборке информации о параметрах распределения.
Пусть X1, X2, …, Xn возможные результаты независимых наблюдений случайной величины X. Это означает, что X1, X2, …, Xn – независимые случайные величины, причем закон распределения любой из них совпадает с законом распределения величины X. Допустим, что вид распределения величины X задан, но неизвестен параметр q, которым определяется этот закон. Введем функцию
, (3.13)
где в случае исходного непрерывного распределения интерпретируется как плотность распределения случайной величины Xi, а дискретном случае – как вероятность того, что случайная величина Xi примет значение xi. Функцию от случайных величин Xi, рассматриваемую как функцию параметра q, называют функцией правдоподобия.
Оценкой метода максимального правдоподобия (ММП-оценкой) параметра q называется такое значение , при котором функция правдоподобия достигает наибольшего возможного значения:
.
Известно, что точка максимума не изменится, если вместо L(q) использовать lnL(q). Тогда, в соответствии с необходимым условием экстремума функции, получим следующие уравнения правдоподобия:
, (3.14)
для нахождения оценки параметра q.
Пример 3.18. Найти методом максимального правдоподобия оценки параметров a и s нормального распределения.
Решение. Согласно формуле (3.13), функция правдоподобия для нормального распределения будет иметь вид
.
Логарифмируя ее, получим
.
Найдем частные производные по a и s:
, .
Приравнивая частные производные нулю, получим систему уравнений:
Из этих уравнений находим:
и .
Установлено, что оценка является состоятельной, несмещенной и эффективной оценкой параметра a, а оценка – состоятельной, смещенной и асимптотически эффективной оценкой параметра s2. â
Пример 3.19. Найти методом максимального правдоподобия оценку параметра l распределения Пуассона.
Решение. Логарифмическая функция правдоподобия в данном случае, построенная по выборке x1,x2,…,xn, будет иметь вид
.
Отсюда после дифференцирования по l получаем уравнение максимального правдоподобия
.
Отсюда
.
Установлено, что эта оценка является состоятельной, несмещенной и эффективной оценкой параметра l. â
Показано, что ММП-оценки являются состоятельными, асимптотически несмещенными, асимптотически нормальными и асимптотически эффективными. Все это сделало метод максимального правдоподобия весьма популярным. Было открыто, что для многих задач самой различной статистической природы ММП дает хорошие результаты. Единственная трудность состоит в сложности решения уравнений правдоподобия (3.14). Поэтому очень долгое время ММП применялся только для теоретических расчетов. Однако в настоящее время в современные статистические пакеты для ЭВМ начинают включать методы ММП, что сильно упрощает практическое использование ММП.
Не следует думать, что ММП-оценки будут наилучшими во всех ситуациях. Во-первых, их хорошие свойства проявляются часто лишь при очень больших объемах выборки (т.е. являются асимптотическими), так что при малых n с ними могут конкурировать (и даже превосходить их) другие методы. Во-вторых, и это, пожалуй, главное «узкое место» данного подхода, для построения ММП-оценок и обеспечения их хороших свойств необходимо точное знание типа анализируемого закона распределения f(x;q), что в большинстве случаев оказывается практически нереальным. Часто бывает так, что при определенных, хотя и небольших, отклонениях реального распределения от принятого распределения f(x;q), оценки могут резко терять свои «хорошие» свойства. В связи с этим, в последние годы развиваются т.н. робастные, или устойчивые, методы оценивания, позволяющие находить оценки, хотя и не являющиеся наилучшими в рамках предполагаемого закона распределения, но обладающие достаточно устойчивыми свойствами при отклонении реального закона от предполагаемого. И, в-третьих, ММП-оценки могут не быть даже состоятельными, если число оцениваемых по выборке параметров велико (имеет тот же порядок, что и объем выборки) и растет с увеличение числа наблюдений.
Дополнение 3.
КРИТЕРИИ СОГЛАСИЯ
Часто функция распределения случайной величины бывает заранее неизвестна, и возникает необходимость ее определения по эмпирическим данным. Во многих случаях из некоторых дополнительных соображений могут быть сделаны предположения о виде функции распределения F(x). В эконометрике часто используют нормальное распределение, однако в некоторых случаях может возникнуть вопрос о законности использования нормального распределения в том или ином конкретном случае. В таких случаях нужно использовать статистические критерии, которые обосновывали тот или иной выбор распределения.
Любое предположение о виде распределения называется статистической гипотезой и математически выражается соотношением {F(x)ÎH0}, где H0 – какое-то множество функций распределения. Если множество H0 состоит из одного элемента, то гипотеза называется простой. При статистической проверке основной гипотезы H0 формулируют также альтернативную гипотезу {F(x)ÎH1}, где H1 –множество функций распределения, не пересекающееся с множеством H0. Если H1 – множество всех F(x), не входящих в H0, то это множество обычно вообще не упоминают. Множества H0 и H1 в каждой задаче определяются логическими, физическими и другими условиями задачи.
Рассмотрим случай простой гипотезы {F(x)=Fтеор(x)}. Пусть X1, X2, …, Xn – случайная выборка случайной величины X, и пусть – эмпирическая функция распределения. Определим некоторую неотрицательную меру D отклонения эмпирической функции распределения от предполагаемой теоретической функции распределения Fтеор(x). Величину D=D{F(x),Fтеор(x)} можно определить многими способами, в соответствии с которыми получаются различные критерии для проверки интересующей нас гипотезы: критерий хи-квадрат Пирсона, Колмогорова, омега-квадрат Мизеса, Смирнова и другие.
Наиболее распространенным является критерий, введенный К. Пирсоном, приводящий к распределению c2 (c2–критерий Пирсона). Рассмотрим этот критерий. Для этого разобьем множество значений случайной величины X на r интервалов S1, S2, … ,Sr без общих точек. Пусть pi – вероятность того, что величина X принадлежит интервалу Si; ni – количество величин из числа наблюдаемых X2, …, Xn, принадлежащих интервалу Si. За меру D отклонения эмпирической функции распределения от теоретической Fтеор(x) принимают величину
. (3.32)
Величина c2 случайная и нас интересует ее распределение в предположении, что принятая гипотеза верна, т.е. F(x)=Fтеор(x). Ответ на этот вопрос дает теорема Пирсона:
Теорема. Какова бы ни была функция распределения Fтеор(x) случайной величины X, при n®¥ распределение величины c2 стремится к c2–распределению с (r–1) степенями свободы.
Полностью определенное гипотетическое теоретическое распределение встречается на практике довольно редко. Гораздо чаще теоретическое распределение Fтеор(x;q1,…,qk) содержит некоторые неизвестные параметры q1,…,qk, значение которых приходится оценивать по выборке. В результате критерий Пирсона будет иметь вид
. (3.33)
Однако воспользоваться теоремой Пирсона в этом случае уже нельзя, поскольку значения q1,…,qk неизвестны. Если же в приведенном выражении величины q1,…,qk заменить их оценками по выборке, то величины pi(q1,…,qk) уже будут случайными величинами, поэтому и в этом случае применять теорему Пирсона нельзя.
Отметим, что при n®¥ распределение величины c2, если параметры q1,…,qk оцениваются по методу максимального правдоподобия, является распределением c2 с (r–1-k) степенями свободы (теорема Фишера). Таким образом, наличие оцениваемых по выборке параметров (если оценка производится по методу максимального правдоподобия) не меняет характера предельного распределения величины c2, а лишь уменьшает число степеней свободы этого предельного распределения настолько единиц, каково число оцениваемых параметров. В этом состоит одно из достоинств критерия Пирсона.
Отметим, что критерий Пирсона применяется только при достаточно больших выборках (nt50) и достаточно больших частотах (ni³5). Если последнее условие не выполняется для какого-либо интервала вариационного ряда, то его объединяют с соседним интервалом, соответственно уменьшая общее число интервалов.
Схема применения критерия согласия Пирсона проверки гипотезы о предполагаемом законе неизвестного распределения:
1)Вычисляются параметры предполагаемого закона распределения.
2)Вычисляются теоретические частоты .
3)Вычисляют величину .
4)По вычисленному числу степеней свободы n=r–1–k, где r – число интервалов выборки, k – число параметров распределения и по выбранному уровню значимости a по таблицам распределения c2, находят .
5)Если , то нет оснований отклонять нулевую гипотезу, если – нулевая гипотеза отвергается.
Пример 3.20. По распределению, заданному таблицей (таб. 3.9), выяснить при помощи критерия Пирсона можно ли на уровне значимости a=0,05 считать, что генеральная совокупность имеет нормальное распределение.
Решение. В предположении, что имеет место нормальное распределение, то можно оценить ее два параметра
, .
Таблица 3.9