F-тест на равенство дисперсий

Две выборки

Пусть имеются две выборки объемом m и n соответственно случайных величин X и Y, имеющих нормальное распределение. Необходимо проверить равенство их дисперсий. Статистика теста

F-тест на равенство дисперсий - student2.ru

где F-тест на равенство дисперсий - student2.ru — выборочная дисперсия.

Если статистика больше критического, то дисперсии не одинаковы, в противном случае дисперсии выборок одинаковы

Несколько выборок

Пусть выборка объемом N случайной величины X разделена на k групп с количеством наблюдений F-тест на равенство дисперсий - student2.ru в i-ой группе.

Межгрупповая («объясненная») дисперсия: F-тест на равенство дисперсий - student2.ru

Внутригрупповая («необъясненная») дисперсия: F-тест на равенство дисперсий - student2.ru

F-тест на равенство дисперсий - student2.ru

Данный тест можно свести к тестированию значимости регрессии переменной X на фиктивные переменные-индикаторы групп. Если статистика превышает критическое значение, то гипотеза о равенстве дисперсий в выборках отвергается, в противном случае дисперсии можно считать одинаковыми.

Проверка ограничений на параметры регрессии

Статистика теста для проверки линейных ограничений на параметры классической нормальной линейной регрессии определяется по формуле:

F-тест на равенство дисперсий - student2.ru

где F-тест на равенство дисперсий - student2.ru -количество ограничений, n-объем выборки, k-количество параметров модели, ESS-сумма квадратов остатков модели, F-тест на равенство дисперсий - student2.ru -коэффициент детерминации, индексы S и L относятся соответственно к короткой и длинной модели (модели с ограничениями и модели без ограничений).

Замечание

Описанный выше F-тест является точным в случае нормального распределения случайных ошибок модели. Однако F-тест можно применить и в более общем случае. В этом случае он является асимптотическим. Соответствующую F-статистику можно рассчитать на основе статистик других асимптотических тестов — теста Вальда(W), теста множителей Лагранжа(LM) и теста отношения правдоподобия (LR) — следующим образом:

F-тест на равенство дисперсий - student2.ru

Все эти статистики асимптотически имеют распределение F(q, n-k), несмотря на то, что их значения на малых выборках могут различаться.

Проверка значимости линейной регрессии

Данный тест очень важен в регрессионном анализе и по существу является частным случаем проверки ограничений. В данном случае нулевая гипотеза — об одновременном равенстве нулю всех коэффициентов при факторах регрессионной модели (то есть всего ограничений k-1). В данном случае короткая модель — это просто константа в качестве фактора, то есть коэффициент детерминации короткой модели равен нулю. Статистика теста равна:

F-тест на равенство дисперсий - student2.ru

Соответственно, если значение этой статистики больше критического значения при данном уровне значимости, то нулевая гипотеза отвергается, что означает статистическую значимость регрессии. В противном случае модель признается незначимой.

Пример

Пусть оценивается линейная регрессия доли расходов на питание в общей сумме расходов на константу, логарифм совокупных расходов, количество взрослых членов семьи и количество детей до 11 лет. То есть всего в модели 4 оцениваемых параметра (k=4). Пусть по результатам оценки регрессии получен коэффициент детерминации F-тест на равенство дисперсий - student2.ru . По вышеприведенной формуле рассчитаем значение F-статистики в случае, если регрессия оценена по данным 34 наблюдений и по данным 64 наблюдений:

F-тест на равенство дисперсий - student2.ru

F-тест на равенство дисперсий - student2.ru

Критическое значение статистики при 1 % уровне значимости (в Excel функция FРАСПОБР) в первом случае равно F-тест на равенство дисперсий - student2.ru , а во втором случае F-тест на равенство дисперсий - student2.ru . В обоих случаях регрессия признается значимой при заданном уровне значимости. В первом случае P-значение равно 0,1 %, а во втором — 0,00005 %. Таким образом, во втором случае уверенность в значимости регрессии существенно выше (существенно меньше вероятность ошибки в случае признания модели значимой).

Простой пример

Пусть дана независимая выборка F-тест на равенство дисперсий - student2.ru , где F-тест на равенство дисперсий - student2.ru . Пусть есть две простые гипотезы:

F-тест на равенство дисперсий - student2.ru

Тогда можно определить следующий статистический критерий:

F-тест на равенство дисперсий - student2.ru

где F-тест на равенство дисперсий - student2.ru - выборочное среднее.

Литература

1.Р 50.1.037-2002. Рекомендации по стандартизации. Прикладная статистика: Правила проверки согласия опытного распределения с теоретическим. Часть II: Непараметрические критерии. — М.: Госстандарт РФ, 2002. Электронная версия.

2.Методика и техника статистической обработки первичной социологической информации. Отв. ред. Г.В. Осипов. М., "Наука", 1968.

3.Начинская С.В. Основы спортивной статистики. - К.: Вища шк., 1987. - 189 с.

4.Толоконцев Н.А. Вычисление среднего квадратического отклонения по размаху. Сравнение с общепринятым методом. Тезисы докладов третьего совещания по применению математических методов в биологии. ЛГУ, 1961, стр.83 - 85.

1.

Наши рекомендации