Проверка статистических гипотез о значениях коэффициентов

В только что рассмотренном примере мы построили Проверка статистических гипотез о значениях коэффициентов - student2.ru – доверительный интервал для параметра Проверка статистических гипотез о значениях коэффициентов - student2.ru в виде

Проверка статистических гипотез о значениях коэффициентов - student2.ru

т. е. Проверка статистических гипотез о значениях коэффициентов - student2.ru

Существенно, что при любом истинном значении параметра Проверка статистических гипотез о значениях коэффициентов - student2.ru вероятность накрытия этого значения построенным доверительным интервалом равна Проверка статистических гипотез о значениях коэффициентов - student2.ru .

Рассмотрим значение Проверка статистических гипотез о значениях коэффициентов - student2.ru =1; построенный интервал его не накрывает. Однако, если Проверка статистических гипотез о значениях коэффициентов - student2.ru действительно равняется 1, то вероятность такого ненакрытия равна Проверка статистических гипотез о значениях коэффициентов - student2.ru . Таким образом, факт ненакрытия значения Проверка статистических гипотез о значениях коэффициентов - student2.ru =1 построенным интервалом представляет (в случае, когда Проверка статистических гипотез о значениях коэффициентов - student2.ru =1) осуществление довольно редкого события, имеющего малую вероятность Проверка статистических гипотез о значениях коэффициентов - student2.ru , и это дает нам основания сомневаться в том, что в действительности Проверка статистических гипотез о значениях коэффициентов - student2.ru =1.

То же самое относится и к любому другому фиксированному значению Проверка статистических гипотез о значениях коэффициентов - student2.ru , не принадлежащему указанному Проверка статистических гипотез о значениях коэффициентов - student2.ru -доверительному интервалу: предположение о том, что в действительности Проверка статистических гипотез о значениях коэффициентов - student2.ru , представляется маловероятным.

Подобного рода предположения называют в этом контексте статистическими гипотезами (statisticalhypothesis). О проверяемой гипотезе говорят как об исходной – «нулевой» (maintained, null) гипотезе и обозначают такую гипотезу символом Проверка статистических гипотез о значениях коэффициентов - student2.ru , так что в последнем случае мы имеем дело с гипотезой

Проверка статистических гипотез о значениях коэффициентов - student2.ru

В соответствии со сказанным выше, такую гипотезу естественно отвергать (отклонять), если значение Проверка статистических гипотез о значениях коэффициентов - student2.ru не принадлежит Проверка статистических гипотез о значениях коэффициентов - student2.ru -доверительному интервалу для Проверка статистических гипотез о значениях коэффициентов - student2.ru , т. е. интервалу

Проверка статистических гипотез о значениях коэффициентов - student2.ru

Вспоминая, как этот интервал строился, мы замечаем, что Проверка статистических гипотез о значениях коэффициентов - student2.ru непринадлежит этому интервалу тогда и только тогда, когда

Проверка статистических гипотез о значениях коэффициентов - student2.ru

т. е. когда наблюдаемое значение отношения

Проверка статистических гипотез о значениях коэффициентов - student2.ru

«слишком велико» по абсолютной величине. Последнее означает «слишком большое» отклонение оценки Проверка статистических гипотез о значениях коэффициентов - student2.ru от гипотетического значения Проверка статистических гипотез о значениях коэффициентов - student2.ru параметра Проверка статистических гипотез о значениях коэффициентов - student2.ru , в сравнении с оценкой Проверка статистических гипотез о значениях коэффициентов - student2.ru значения Проверка статистических гипотез о значениях коэффициентов - student2.ru корня из дисперсии оценки этого параметра.

Итак, если

Проверка статистических гипотез о значениях коэффициентов - student2.ru

мы отвергаем гипотезу Проверка статистических гипотез о значениях коэффициентов - student2.ru . Однако выполнение этого неравенства для некоторого значения Проверка статистических гипотез о значениях коэффициентов - student2.ru вовсе не означает, что гипотеза Проверка статистических гипотез о значениях коэффициентов - student2.ru обязательно не верна. Если в действительности Проверка статистических гипотез о значениях коэффициентов - student2.ru , то все же имеется вероятность Проверка статистических гипотез о значениях коэффициентов - student2.ru того, что это неравенство будет выполнено.

В последнем случае, в соответствии с выбранным правилом, мы все же отвергнем гипотезу Проверка статистических гипотез о значениях коэффициентов - student2.ru , допустив при этом «ошибку 1-го рода». Такая ошибка происходит в среднем в Проверка статистических гипотез о значениях коэффициентов - student2.ru случаях из ста.

Если бы мы выбрали произвольный доверительный уровень Проверка статистических гипотез о значениях коэффициентов - student2.ru , то тогда мы отвергали бы гипотезу Проверка статистических гипотез о значениях коэффициентов - student2.ru при выполнении неравенства

Проверка статистических гипотез о значениях коэффициентов - student2.ru

и ошибка 1-го рода происходила в среднем в Проверка статистических гипотез о значениях коэффициентов - student2.ru случаев из 100. Точнее, вероятность ошибки 1-го рода была бы равна Проверка статистических гипотез о значениях коэффициентов - student2.ru :

Проверка статистических гипотез о значениях коэффициентов - student2.ru Проверка статистических гипотез о значениях коэффициентов - student2.ru отвергается Проверка статистических гипотез о значениях коэффициентов - student2.ru Проверка статистических гипотез о значениях коэффициентов - student2.ru верна Проверка статистических гипотез о значениях коэффициентов - student2.ru = Проверка статистических гипотез о значениях коэффициентов - student2.ru .

Само правило решения вопроса об отклонении или неотклонении статистической гипотезы Проверка статистических гипотез о значениях коэффициентов - student2.ru называется статистическим критерием проверки гипотезы Н0, а выбранное при формулировании этого правила значение gназывается уровнем значимости критерия.

Выбор большего или меньшего значения gопределяется степенью значимости для исследователя исходной гипотезы Проверка статистических гипотез о значениях коэффициентов - student2.ru . Скажем, выбор между значениями Проверка статистических гипотез о значениях коэффициентов - student2.ru и Проверка статистических гипотез о значениях коэффициентов - student2.ru в пользу Проверка статистических гипотез о значениях коэффициентов - student2.ru означает, что исследователь заранее настроен в пользу гипотезы Проверка статистических гипотез о значениях коэффициентов - student2.ru и ему требуются очень весомые аргументы, свидетельствующие против этой гипотезы, чтобы все же отказаться от нее. Выбор же в пользу уровня значимости Проверка статистических гипотез о значениях коэффициентов - student2.ru означает, что исследователь не столь сильно отстаивает гипотезу Проверка статистических гипотез о значениях коэффициентов - student2.ru и готов отказаться от нее и при менее убедительной аргументации против этой гипотезы.

Всякий статистический критерий основывается на использовании той или иной статистики(статистики критерия), т. е. случайной величины, значения которой могут быть вычислены (по крайней мере, теоретически) на основании имеющихся статистических данных и распределение которой известно (хотя бы приближенно).

В нашем примере критерий проверки гипотезы Проверка статистических гипотез о значениях коэффициентов - student2.ru основывался на использовании t-статистики

Проверка статистических гипотез о значениях коэффициентов - student2.ru ,

значение которой можно вычислить по данным наблюдений, поскольку Проверка статистических гипотез о значениях коэффициентов - student2.ru – известное (заданное) число, а Проверка статистических гипотез о значениях коэффициентов - student2.ru и Проверка статистических гипотез о значениях коэффициентов - student2.ru вычисляются на основании данных наблюдений.

Каждому статистическому критерию соответствует критическое множество R значений статистики критерия, при которых гипотеза Проверка статистических гипотез о значениях коэффициентов - student2.ru отвергается в соответствии с принятым правилом. В нашем примере таковым является множество значений указанной Проверка статистических гипотез о значениях коэффициентов - student2.ru -статистики, превышающих по абсолютной величине значение Проверка статистических гипотез о значениях коэффициентов - student2.ru

Итак, статистический критерий определяется заданием

a. статистической гипотезы Н 0;

b. уровня значимости g;

c. статистики критерия;

d. критического множества R.

Можно подумать, что пункты b) и d) дублируют друг друга, поскольку в нашем примере критическое множество Проверка статистических гипотез о значениях коэффициентов - student2.ru однозначно определяется по заданному уровню значимости Проверка статистических гипотез о значениях коэффициентов - student2.ru . Однако, как мы увидим в дальнейшем, одному и тому же уровню значимости можно сопоставить различные критические множества, что дает возможность выбирать множество Проверка статистических гипотез о значениях коэффициентов - student2.ru наиболее рациональным образом, в зависимости от выбора гипотезы Проверка статистических гипотез о значениях коэффициентов - student2.ru (выбор наиболее мощного критерия).

Компьютерные пакеты программ статистического анализа данных (в том числе и Пакет анализа EXСEL)первоочередное внимание уделяют проверке гипотезы

Проверка статистических гипотез о значениях коэффициентов - student2.ru

в рамках нормальной модели множественной линейной регрессии

у=a0+a1х1 +a2х2 +…+amхm+e.

где e нормально распределенная случайная величина с параметрами Проверка статистических гипотез о значениях коэффициентов - student2.ru .

Эта гипотеза соответствует предположению исследователя о том, что Проверка статистических гипотез о значениях коэффициентов - student2.ru -я объясняющая переменная не имеет существенного значения с точки зрения объяснения изменчивости значений объясняемой переменной Проверка статистических гипотез о значениях коэффициентов - student2.ru , так что она может быть исключена из модели.

Для соответствующего критерия

a. Проверка статистических гипотез о значениях коэффициентов - student2.ru ;

b. уровень значимости Проверка статистических гипотез о значениях коэффициентов - student2.ru по умолчанию обычно выбирается равным Проверка статистических гипотез о значениях коэффициентов - student2.ru ;

c. статистика критерия имеет вид

Проверка статистических гипотез о значениях коэффициентов - student2.ru

если гипотеза Проверка статистических гипотез о значениях коэффициентов - student2.ru верна, то эта статистика имеет Проверка статистических гипотез о значениях коэффициентов - student2.ru - распределение Стьюдентас Проверка статистических гипотез о значениях коэффициентов - student2.ru степенями свободы,

Проверка статистических гипотез о значениях коэффициентов - student2.ru ~ Проверка статистических гипотез о значениях коэффициентов - student2.ru ,

в связи с чем ее обычно называют t-статистикой (t-statistic) или t-отношением (t-ratio);

d) критическое множество имеет вид

Проверка статистических гипотез о значениях коэффициентов - student2.ru

При этом, в распечатках результатов регрессионного анализа (т. е. статистического анализа модели линейной регрессии) сообщаются:

· значение оценки Проверка статистических гипотез о значениях коэффициентов - student2.ru параметра Проверка статистических гипотез о значениях коэффициентов - student2.ru в графе Коэффициенты (Coefficient);

· значение Проверка статистических гипотез о значениях коэффициентов - student2.ru знаменателя t-статистики в графе Стандартная ошибка (Std.Error);

· значение отношения Проверка статистических гипотез о значениях коэффициентов - student2.ru в графе t-статистика (t-statistic).

Кроме того, сообщается также

· вероятность того, что случайная величина, имеющая распределение Стьюдента с Проверка статистических гипотез о значениях коэффициентов - student2.ru степенями свободы, примет значение, не меньшее по абсолютной величине, чем наблюденное значение Проверка статистических гипотез о значениях коэффициентов - student2.ru – в графе Р-значение(Р-valueили Probability).

В отношении полученного при анализе Р-значения возможны следующие варианты.

Если указываемое P-значение меньше выбранного уровня значимости Проверка статистических гипотез о значениях коэффициентов - student2.ru , то это равносильно тому, что значение t-статистики Проверка статистических гипотез о значениях коэффициентов - student2.ru попало в область отвержения гипотезы Проверка статистических гипотез о значениях коэффициентов - student2.ru , т. е. Проверка статистических гипотез о значениях коэффициентов - student2.ru В этом случае гипотеза Проверка статистических гипотез о значениях коэффициентов - student2.ru отвергается.

Если указываемое P-значение больше выбранного уровня значимости Проверка статистических гипотез о значениях коэффициентов - student2.ru , то это равносильно тому, что значение t-статистики Проверка статистических гипотез о значениях коэффициентов - student2.ru не попало в область отвержения гипотезы Проверка статистических гипотез о значениях коэффициентов - student2.ru , т. е. Проверка статистических гипотез о значениях коэффициентов - student2.ru В этом случае гипотеза Проверка статистических гипотез о значениях коэффициентов - student2.ru не отвергается.

Если (в пределах округления) указываемое P-значение равно выбранному уровню значимости Проверка статистических гипотез о значениях коэффициентов - student2.ru , то в отношении гипотезы Проверка статистических гипотез о значениях коэффициентов - student2.ru можно принять любое из двух возможных решений.

В случае, когда гипотеза Проверка статистических гипотез о значениях коэффициентов - student2.ru отвергается (вариант 1), говорят, что параметр Проверка статистических гипотез о значениях коэффициентов - student2.ru статистически значим (statisticallysignificant); это соответствует признанию того, что наличие j-й объясняющей переменной в правой части модели существенно для объяснения наблюдаемой изменчивости объясняемой переменной.

Напротив, в случае, когдагипотеза Проверка статистических гипотез о значениях коэффициентов - student2.ru не отвергается (вариант 2), говорят, что параметр Проверка статистических гипотез о значениях коэффициентов - student2.ru статистически незначим (statisticallyunsignificant). В этом случае в рамках используемого статистического критерия мы не получаем убедительных аргументов против предположения о том, что Проверка статистических гипотез о значениях коэффициентов - student2.ru . Это соответствует признанию того, что наличие j-й объясняющей переменной в правой части модели не существенно для объяснения наблюдаемой изменчивости объясняемой переменной, а следовательно, можно обойтись и без включения этой переменной в модель регрессии.

Впрочем, выводы о статистической значимости (или незначимости) того или иного параметра модели зависят от выбранного уровня значимости Проверка статистических гипотез о значениях коэффициентов - student2.ru : решение в пользу статистической значимости параметра может измениться на противоположное при уменьшении Проверка статистических гипотез о значениях коэффициентов - student2.ru , а решение в пользу статистической незначимости параметра может измениться на противоположное при уменьшении значения Проверка статистических гипотез о значениях коэффициентов - student2.ru .

Пример 5.1.Пусть в примере с уровнями безработицы в США получаем Проверка статистических гипотез о значениях коэффициентов - student2.ru и следующую таблицу:

Переменная Коэф-т Ст. ошибка t-статист. P-знач.
2.294 0.410 5.589 0.0001
ZVET 0.125 0.062 2.011 0.0626

Соответственно, при выборе уровня значимости Проверка статистических гипотез о значениях коэффициентов - student2.ru коэффициент при переменной Проверка статистических гипотез о значениях коэффициентов - student2.ru признается статистически незначимым ( Проверка статистических гипотез о значениях коэффициентов - student2.ru -значение больше уровня значимости). Однако, если выбрать Проверка статистических гипотез о значениях коэффициентов - student2.ru , то Проверка статистических гипотез о значениях коэффициентов - student2.ru -значение меньше уровня значимости, и коэффициент при переменной Проверка статистических гипотез о значениях коэффициентов - student2.ru придется признать статистически значимым.

Пример 5.2.Пусть при исследовании зависимости спроса на куриные яйца от цены получаем Проверка статистических гипотез о значениях коэффициентов - student2.ru и следующую таблицу:

Переменная Коэф-т Ст. ошибка t-статист. P-знач.
21.100 2.304 9.158 0.0000
CENA –18.559 5.010 -3.705 0.0026

Здесь коэффициент при объясняющей переменной Проверка статистических гипотез о значениях коэффициентов - student2.ru статистически значим даже при выборе Проверка статистических гипотез о значениях коэффициентов - student2.ru , так что цена является существенной объясняющей переменной.

Пример 5.3.Регрессионный анализ потребления свинины на душу населения США в зависимости от оптовых цен на свинину дает значения Проверка статистических гипотез о значениях коэффициентов - student2.ru и значения параметров:

Переменная Коэф-т Ст. ошибка t-статист. P-знач.
77.484 13.921 5.566 0.0001
Цена -24.775 29.794 -0.832 0.4219

В этом примере коэффициент при переменной Цена оказывается статистически незначимым при любом разумном выборе уровня значимости Проверка статистических гипотез о значениях коэффициентов - student2.ru .

Замечание.Мы уже отмечали ранее возможность ложной корреляции между двумя переменными и, соответственно, возможность ложного использования одной из переменных в качестве объясняющей для описания изменчивости другой переменной. Проиллюстрируем такую ситуацию на основе рассмотренных нами методов регрессионного анализа.

Пример 5.4.Рассмотрим модель линейной связи между мировым рекордом по прыжкам в высоту с шестом среди мужчин ( Проверка статистических гипотез о значениях коэффициентов - student2.ru , в см) и суммарным производством электроэнергии в США ( Проверка статистических гипотез о значениях коэффициентов - student2.ru , в млрд. квт-час). Пусть значение коэффициента детерминации для этой модели Проверка статистических гипотез о значениях коэффициентов - student2.ru . Результаты регрессионного анализа:

Переменная Коэф-т Ст. ошибка t-статист. P-знач.
-2625.497 420.840 -6.234 0.0000
H 7.131 0.841 8.483 0.0000

Формально, переменная Проверка статистических гипотез о значениях коэффициентов - student2.ru признается существенной для объяснения изменчивости переменной Проверка статистических гипотез о значениях коэффициентов - student2.ru , так что здесь мы сталкиваемся с ложной (паразитной) регрессией переменной Проверка статистических гипотез о значениях коэффициентов - student2.ru на переменную Проверка статистических гипотез о значениях коэффициентов - student2.ru , обусловленной наличием выраженного (линейного) тренда обеих переменных во времени.

Наши рекомендации