Материал из MachineLearning.

Перейти к: навигация, поиск

Для получения информации об адекватности построеной модели многомерной линейной регрессии исследуют регрессионные остатки. Если выбранная регрессионная модель хорошо описывает истинную зависимость, то остатки должны быть независимыми нормально распределенными случайными величинами с нулевым средним, и в их значениях должен отсутствовать тренд. Анализ регрессионных остатков - это процесс проверки выполнения этих условий.

Пусть дана последовательность наблюдаемых величин Материал из MachineLearning. - student2.ru и получены их оценки:

Материал из MachineLearning. - student2.ru - предикторные переменные, Материал из MachineLearning. - student2.ru - коэффициенты регрессионной модели, Материал из MachineLearning. - student2.ru - ответ.

Регрессионные остатки обозначим через Материал из MachineLearning. - student2.ru , Материал из MachineLearning. - student2.ru .

Свойства регрессионных остатков

Для того, чтобы регрессионная модель хорошо описывала истинные данные, регрессионные остатки Материал из MachineLearning. - student2.ru должны обладать следующими свойствами:

Материал из MachineLearning. - student2.ru Материал из MachineLearning. - student2.ru

Эту гипотезу можно проверять любым параметрическим или непараметрическим критерием сравнения среднего с заданным значением( в данном случае - с нулём).

Материал из MachineLearning. - student2.ru Материал из MachineLearning. - student2.ru - т.е. одинаковая дисперсия.

Проверяется аналогично, любым параметрическим или непараметрическим критерием сравнения дисперсии с заданным значением. Например, Критерий Зигеля-Тьюки.

Материал из MachineLearning. - student2.ru Материал из MachineLearning. - student2.ru

Это дополнительное предположение. Его важно проверить, если для проверки других свойств регрессионных остатков мы хотим использовать статистический критерий, предполагающий нормальность данных. Для проверки этой гипотезы можно использовать Критерий нормальности.

Материал из MachineLearning. - student2.ru Материал из MachineLearning. - student2.ru - независимы.

Независимость остатков может быть проверена при помощи статистики Дарбина-Уотсона.

Материал из MachineLearning. - student2.ru

Материал из MachineLearning. - student2.ru

Материал из MachineLearning. - student2.ru

Материал из MachineLearning. - student2.ru .

Для проверки этих условий используется визуальный анализ. Зависимость Материал из MachineLearning. - student2.ru не должна иметь закономерностей, где Материал из MachineLearning. - student2.ru .

Критерий Фишера применяется для проверки равенства дисперсий двух выборок. Его относят к критериям рассеяния.

При проверке гипотезы положения (гипотезы о равенстве средних значений в двух выборках) с использованием критерия Стьюдента имеет смысл предварительно проверить гипотезу о равенстве дисперсий. Если она верна, то для сравнения средних можно воспользоваться более мощным критерием.

В регрессионном анализе критерий Фишера позволяет оценивать значимость линейных регрессионных моделей. В частности, он используется в шаговой регрессии для проверки целесообразности включения или исключения независимых переменных (признаков) в регрессионную модель.

В дисперсионном анализе критерий Фишера позволяет оценивать значимость факторов и их взаимодействия.

Критерий Фишера основан на дополнительных предположениях о независимости и нормальности выборок данных. Перед его применением рекомендуется выполнить проверку нормальности.

Описание критерия

Заданы две выборки Материал из MachineLearning. - student2.ru .

Обозначим через Материал из MachineLearning. - student2.ru и Материал из MachineLearning. - student2.ru дисперсии выборок Материал из MachineLearning. - student2.ru и Материал из MachineLearning. - student2.ru , Материал из MachineLearning. - student2.ru и Материал из MachineLearning. - student2.ru — выборочные оценки дисперсий Материал из MachineLearning. - student2.ru и Материал из MachineLearning. - student2.ru :

Материал из MachineLearning. - student2.ru ;

Материал из MachineLearning. - student2.ru ,

где

Материал из MachineLearning. - student2.ru — выборочные средние выборок Материал из MachineLearning. - student2.ru и Материал из MachineLearning. - student2.ru .

Дополнительное предположение: выборки Материал из MachineLearning. - student2.ru и Материал из MachineLearning. - student2.ru являются нормальными. Критерий Фишера чувствителен к нарушению предположения о нормальности.

Нулевая гипотеза Материал из MachineLearning. - student2.ru

Статистика критерия Фишера:

Материал из MachineLearning. - student2.ru

имеет распределение Фишера с Материал из MachineLearning. - student2.ru и Материал из MachineLearning. - student2.ru степенями свободы. Обычно в числителе ставится большая из двух сравниваемых дисперсий. Тогда критической областью критерия является правый хвост распределения Фишера, что соотвествует альтернативной гипотезе Материал из MachineLearning. - student2.ru .

Критерий (при уровне значимости Материал из MachineLearning. - student2.ru ):

Материал из MachineLearning. - student2.ru против альтернативы Материал из MachineLearning. - student2.ru

если Материал из MachineLearning. - student2.ru или Материал из MachineLearning. - student2.ru , то нулевая гипотеза Материал из MachineLearning. - student2.ru отвергается в пользу альтернативы Материал из MachineLearning. - student2.ru .

против альтернативы Материал из MachineLearning. - student2.ru

если Материал из MachineLearning. - student2.ru , то нулевая гипотеза Материал из MachineLearning. - student2.ru отвергается в пользу альтернативы Материал из MachineLearning. - student2.ru ;

где Материал из MachineLearning. - student2.ru есть Материал из MachineLearning. - student2.ru -квантиль распределения Фишера с Материал из MachineLearning. - student2.ru и Материал из MachineLearning. - student2.ru степенями свободы.

Критерий Стьюдента

Наши рекомендации