Проверка статистических гипотез о значениях коэффициентов

В только что рассмотренном примере мы построили Проверка статистических гипотез о значениях коэффициентов - student2.ru – доверительный интервал для параметра в виде

Проверка статистических гипотез о значениях коэффициентов - student2.ru

т. е. Проверка статистических гипотез о значениях коэффициентов - student2.ru

Существенно, что при любом истинном значении параметра Проверка статистических гипотез о значениях коэффициентов - student2.ru вероятность накрытия этого значения построенным доверительным интервалом равна .

Рассмотрим значение Проверка статистических гипотез о значениях коэффициентов - student2.ru =1; построенный интервал его не накрывает. Однако, если действительно равняется 1, то вероятность такого ненакрытия равна Проверка статистических гипотез о значениях коэффициентов - student2.ru . Таким образом, факт ненакрытия значения =1 построенным интервалом представляет (в случае, когда Проверка статистических гипотез о значениях коэффициентов - student2.ru =1) осуществление довольно редкого события, имеющего малую вероятность , и это дает нам основания сомневаться в том, что в действительности Проверка статистических гипотез о значениях коэффициентов - student2.ru =1.

То же самое относится и к любому другому фиксированному значению Проверка статистических гипотез о значениях коэффициентов - student2.ru , не принадлежащему указанному -доверительному интервалу: предположение о том, что в действительности Проверка статистических гипотез о значениях коэффициентов - student2.ru , представляется маловероятным.

Подобного рода предположения называют в этом контексте статистическими гипотезами (statisticalhypothesis). О проверяемой гипотезе говорят как об исходной – «нулевой» (maintained, null) гипотезе и обозначают такую гипотезу символом Проверка статистических гипотез о значениях коэффициентов - student2.ru , так что в последнем случае мы имеем дело с гипотезой

Проверка статистических гипотез о значениях коэффициентов - student2.ru

В соответствии со сказанным выше, такую гипотезу естественно отвергать (отклонять), если значение Проверка статистических гипотез о значениях коэффициентов - student2.ru не принадлежит -доверительному интервалу для , т. е. интервалу

Проверка статистических гипотез о значениях коэффициентов - student2.ru

Вспоминая, как этот интервал строился, мы замечаем, что Проверка статистических гипотез о значениях коэффициентов - student2.ru непринадлежит этому интервалу тогда и только тогда, когда

Проверка статистических гипотез о значениях коэффициентов - student2.ru

т. е. когда наблюдаемое значение отношения

Проверка статистических гипотез о значениях коэффициентов - student2.ru

«слишком велико» по абсолютной величине. Последнее означает «слишком большое» отклонение оценки Проверка статистических гипотез о значениях коэффициентов - student2.ru от гипотетического значения параметра , в сравнении с оценкой значения корня из дисперсии оценки этого параметра.

Итак, если

Проверка статистических гипотез о значениях коэффициентов - student2.ru

мы отвергаем гипотезу Проверка статистических гипотез о значениях коэффициентов - student2.ru . Однако выполнение этого неравенства для некоторого значения вовсе не означает, что гипотеза обязательно не верна. Если в действительности Проверка статистических гипотез о значениях коэффициентов - student2.ru , то все же имеется вероятность того, что это неравенство будет выполнено.

В последнем случае, в соответствии с выбранным правилом, мы все же отвергнем гипотезу Проверка статистических гипотез о значениях коэффициентов - student2.ru , допустив при этом «ошибку 1-го рода». Такая ошибка происходит в среднем в случаях из ста.

Если бы мы выбрали произвольный доверительный уровень Проверка статистических гипотез о значениях коэффициентов - student2.ru , то тогда мы отвергали бы гипотезу при выполнении неравенства

Проверка статистических гипотез о значениях коэффициентов - student2.ru

и ошибка 1-го рода происходила в среднем в Проверка статистических гипотез о значениях коэффициентов - student2.ru случаев из 100. Точнее, вероятность ошибки 1-го рода была бы равна :

Проверка статистических гипотез о значениях коэффициентов - student2.ru отвергается верна = .

Само правило решения вопроса об отклонении или неотклонении статистической гипотезы Проверка статистических гипотез о значениях коэффициентов - student2.ru называется статистическим критерием проверки гипотезы Н₀, а выбранное при формулировании этого правила значение gназывается уровнем значимости критерия.

Выбор большего или меньшего значения gопределяется степенью значимости для исследователя исходной гипотезы Проверка статистических гипотез о значениях коэффициентов - student2.ru . Скажем, выбор между значениями и в пользу означает, что исследователь заранее настроен в пользу гипотезы Проверка статистических гипотез о значениях коэффициентов - student2.ru и ему требуются очень весомые аргументы, свидетельствующие против этой гипотезы, чтобы все же отказаться от нее. Выбор же в пользу уровня значимости Проверка статистических гипотез о значениях коэффициентов - student2.ru означает, что исследователь не столь сильно отстаивает гипотезу и готов отказаться от нее и при менее убедительной аргументации против этой гипотезы.

Всякий статистический критерий основывается на использовании той или иной статистики(статистики критерия), т. е. случайной величины, значения которой могут быть вычислены (по крайней мере, теоретически) на основании имеющихся статистических данных и распределение которой известно (хотя бы приближенно).

В нашем примере критерий проверки гипотезы Проверка статистических гипотез о значениях коэффициентов - student2.ru основывался на использовании t-статистики

Проверка статистических гипотез о значениях коэффициентов - student2.ru ,

значение которой можно вычислить по данным наблюдений, поскольку Проверка статистических гипотез о значениях коэффициентов - student2.ru – известное (заданное) число, а и вычисляются на основании данных наблюдений.

Каждому статистическому критерию соответствует критическое множество R значений статистики критерия, при которых гипотеза Проверка статистических гипотез о значениях коэффициентов - student2.ru отвергается в соответствии с принятым правилом. В нашем примере таковым является множество значений указанной Проверка статистических гипотез о значениях коэффициентов - student2.ru -статистики, превышающих по абсолютной величине значение

Итак, статистический критерий определяется заданием

a. статистической гипотезы Н₀;

b. уровня значимости g;

c. статистики критерия;

d. критического множества R.

Можно подумать, что пункты b) и d) дублируют друг друга, поскольку в нашем примере критическое множество Проверка статистических гипотез о значениях коэффициентов - student2.ru однозначно определяется по заданному уровню значимости . Однако, как мы увидим в дальнейшем, одному и тому же уровню значимости можно сопоставить различные критические множества, что дает возможность выбирать множество Проверка статистических гипотез о значениях коэффициентов - student2.ru наиболее рациональным образом, в зависимости от выбора гипотезы (выбор наиболее мощного критерия).

Компьютерные пакеты программ статистического анализа данных (в том числе и Пакет анализа EXСEL)первоочередное внимание уделяют проверке гипотезы

Проверка статистических гипотез о значениях коэффициентов - student2.ru

в рамках нормальной модели множественной линейной регрессии

у=a₀+a₁х₁ +a₂х₂ +…+a_mх_m+e.

где e нормально распределенная случайная величина с параметрами Проверка статистических гипотез о значениях коэффициентов - student2.ru .

Эта гипотеза соответствует предположению исследователя о том, что Проверка статистических гипотез о значениях коэффициентов - student2.ru -я объясняющая переменная не имеет существенного значения с точки зрения объяснения изменчивости значений объясняемой переменной Проверка статистических гипотез о значениях коэффициентов - student2.ru , так что она может быть исключена из модели.

Для соответствующего критерия

a. Проверка статистических гипотез о значениях коэффициентов - student2.ru ;

b. уровень значимости Проверка статистических гипотез о значениях коэффициентов - student2.ru по умолчанию обычно выбирается равным ;

c. статистика критерия имеет вид

Проверка статистических гипотез о значениях коэффициентов - student2.ru

если гипотеза Проверка статистических гипотез о значениях коэффициентов - student2.ru верна, то эта статистика имеет - распределение Стьюдентас степенями свободы,

Проверка статистических гипотез о значениях коэффициентов - student2.ru ~ ,

в связи с чем ее обычно называют t-статистикой (t-statistic) или t-отношением (t-ratio);

d) критическое множество имеет вид

Проверка статистических гипотез о значениях коэффициентов - student2.ru

При этом, в распечатках результатов регрессионного анализа (т. е. статистического анализа модели линейной регрессии) сообщаются:

· значение оценки Проверка статистических гипотез о значениях коэффициентов - student2.ru параметра в графе Коэффициенты (Coefficient);

· значение Проверка статистических гипотез о значениях коэффициентов - student2.ru знаменателя t-статистики в графе Стандартная ошибка (Std.Error);

· значение отношения Проверка статистических гипотез о значениях коэффициентов - student2.ru в графе t-статистика (t-statistic).

Кроме того, сообщается также

· вероятность того, что случайная величина, имеющая распределение Стьюдента с Проверка статистических гипотез о значениях коэффициентов - student2.ru степенями свободы, примет значение, не меньшее по абсолютной величине, чем наблюденное значение Проверка статистических гипотез о значениях коэффициентов - student2.ru – в графе Р-значение(Р-valueили Probability).

В отношении полученного при анализе Р-значения возможны следующие варианты.

Если указываемое P-значение меньше выбранного уровня значимости Проверка статистических гипотез о значениях коэффициентов - student2.ru , то это равносильно тому, что значение t-статистики попало в область отвержения гипотезы , т. е. В этом случае гипотеза Проверка статистических гипотез о значениях коэффициентов - student2.ru отвергается.

Если указываемое P-значение больше выбранного уровня значимости Проверка статистических гипотез о значениях коэффициентов - student2.ru , то это равносильно тому, что значение t-статистики не попало в область отвержения гипотезы , т. е. Проверка статистических гипотез о значениях коэффициентов - student2.ru В этом случае гипотеза не отвергается.

Если (в пределах округления) указываемое P-значение равно выбранному уровню значимости Проверка статистических гипотез о значениях коэффициентов - student2.ru , то в отношении гипотезы можно принять любое из двух возможных решений.

В случае, когда гипотеза Проверка статистических гипотез о значениях коэффициентов - student2.ru отвергается (вариант 1), говорят, что параметр статистически значим (statisticallysignificant); это соответствует признанию того, что наличие j-й объясняющей переменной в правой части модели существенно для объяснения наблюдаемой изменчивости объясняемой переменной.

Напротив, в случае, когдагипотеза Проверка статистических гипотез о значениях коэффициентов - student2.ru не отвергается (вариант 2), говорят, что параметр статистически незначим (statisticallyunsignificant). В этом случае в рамках используемого статистического критерия мы не получаем убедительных аргументов против предположения о том, что Проверка статистических гипотез о значениях коэффициентов - student2.ru . Это соответствует признанию того, что наличие j-й объясняющей переменной в правой части модели не существенно для объяснения наблюдаемой изменчивости объясняемой переменной, а следовательно, можно обойтись и без включения этой переменной в модель регрессии.

Впрочем, выводы о статистической значимости (или незначимости) того или иного параметра модели зависят от выбранного уровня значимости Проверка статистических гипотез о значениях коэффициентов - student2.ru : решение в пользу статистической значимости параметра может измениться на противоположное при уменьшении Проверка статистических гипотез о значениях коэффициентов - student2.ru , а решение в пользу статистической незначимости параметра может измениться на противоположное при уменьшении значения Проверка статистических гипотез о значениях коэффициентов - student2.ru .

Пример 5.1.Пусть в примере с уровнями безработицы в США получаем Проверка статистических гипотез о значениях коэффициентов - student2.ru и следующую таблицу:

Переменная	Коэф-т	Ст. ошибка	t-статист.	P-знач.
	2.294	0.410	5.589	0.0001
ZVET	0.125	0.062	2.011	0.0626

Соответственно, при выборе уровня значимости Проверка статистических гипотез о значениях коэффициентов - student2.ru коэффициент при переменной признается статистически незначимым ( -значение больше уровня значимости). Однако, если выбрать Проверка статистических гипотез о значениях коэффициентов - student2.ru , то -значение меньше уровня значимости, и коэффициент при переменной придется признать статистически значимым.

Пример 5.2.Пусть при исследовании зависимости спроса на куриные яйца от цены получаем Проверка статистических гипотез о значениях коэффициентов - student2.ru и следующую таблицу:

Переменная	Коэф-т	Ст. ошибка	t-статист.	P-знач.
	21.100	2.304	9.158	0.0000
CENA	–18.559	5.010	-3.705	0.0026

Здесь коэффициент при объясняющей переменной Проверка статистических гипотез о значениях коэффициентов - student2.ru статистически значим даже при выборе , так что цена является существенной объясняющей переменной.

Пример 5.3.Регрессионный анализ потребления свинины на душу населения США в зависимости от оптовых цен на свинину дает значения Проверка статистических гипотез о значениях коэффициентов - student2.ru и значения параметров:

Переменная	Коэф-т	Ст. ошибка	t-статист.	P-знач.
	77.484	13.921	5.566	0.0001
Цена	-24.775	29.794	-0.832	0.4219

В этом примере коэффициент при переменной Цена оказывается статистически незначимым при любом разумном выборе уровня значимости Проверка статистических гипотез о значениях коэффициентов - student2.ru .

Замечание.Мы уже отмечали ранее возможность ложной корреляции между двумя переменными и, соответственно, возможность ложного использования одной из переменных в качестве объясняющей для описания изменчивости другой переменной. Проиллюстрируем такую ситуацию на основе рассмотренных нами методов регрессионного анализа.

Пример 5.4.Рассмотрим модель линейной связи между мировым рекордом по прыжкам в высоту с шестом среди мужчин ( Проверка статистических гипотез о значениях коэффициентов - student2.ru , в см) и суммарным производством электроэнергии в США ( , в млрд. квт-час). Пусть значение коэффициента детерминации для этой модели Проверка статистических гипотез о значениях коэффициентов - student2.ru . Результаты регрессионного анализа:

Переменная	Коэф-т	Ст. ошибка	t-статист.	P-знач.
	-2625.497	420.840	-6.234	0.0000
H	7.131	0.841	8.483	0.0000

Формально, переменная Проверка статистических гипотез о значениях коэффициентов - student2.ru признается существенной для объяснения изменчивости переменной , так что здесь мы сталкиваемся с ложной (паразитной) регрессией переменной Проверка статистических гипотез о значениях коэффициентов - student2.ru на переменную , обусловленной наличием выраженного (линейного) тренда обеих переменных во времени.

Наши рекомендации

Проверка статистических гипотез. Проверка гипотез о законе распределения

Проверка статистических гипотез о значениях отдельных коэффициентов

Проверка статистических гипотез

Проверка гипотез о числовых значениях математических ожиданий

Проверка статистических гипотез

Проверка гипотез о числовых значениях параметров

Проверка статистических гипотез

← Предыдущая страница | Следующая страница →