Проверка выполнения предпосылок МНК.
Проверка выполнения предпосылок МНК выполняется на основе анализа остаточной компоненты e. Ряд остатковe должен удовлетворять ряду требований, а именно: равенство нулю математического ожидания, случайный характер отклонений от математического ожидания, отсутствие автокорреляции и неизменность дисперсии остатков при изменении факторной переменной, нормальный закон распределения. Рассмотрим способы проверки этих условий:
1. Проверка равенства математического ожидания уровней ряда остатков нулю осуществляется в ходе проверки соответствующей . С этой целью строится t-статистика
,
где - среднее арифметическое значение уровней ряда остатков , - среднеквадратическое отклонение для этой последовательности, рассчитанное по формуле для малой выборки. На уровне значимости α гипотеза отклоняется, если , где - критерий распределения Стьюдента с доверительной вероятностью (1-α) и степенями свободы.
2. Для проверки условия случайности возникновения отдельных отклонений от тренда часто используется критерий поворотных точек. Значение случайной переменной считается поворотной точкой, если оно одновременно больше (или одновременно меньше) значений предыдущего и последующего члена. Если остатки случайны, то поворотная точка приходится в среднем примерно на каждые 1,5 наблюдения.
Существует определённая зависимость между средней арифметической , дисперсией количества поворотных точек в ряде остатков р и числом членов исходного ряда наблюдений n. С использованием этих зависимостей критерий случайности отклонений от тренда при с доверительной вероятностью 0,95 можно представить в виде:
,
где квадратные скобки означают, что от результата вычисления в правой части необходимо взять целую часть (не путать с процедурой округления!).
Если неравенство (5.6) не выполняется, то ряд остатков нельзя назвать случайным (то есть он содержит регулярную компоненту) и, следовательно, модель не является адекватной.
3. Наличие (отсутствие) автокорреляции в отклонениях фактических значений от модели роста проще всего проверить с помощью критерия Дарбина-Уотсона. С этой целью строится статистика Дарбина-Уотсона (d – статистика), в основе которой лежит расчётная формула
.
Для формулирования вывода о наличии (отсутствии) автокорреляции полученное значение необходимо сравнить с критическими значениями (нижнее) и (верхнее), которые определяются по специальным таблицам для трёх уровней значимости ( =0,01; =0,025; =0,05). При сравнении могут возникнуть следующие ситуации: - остатки содержат автокорреляцию; - область неопределённости, когда нет оснований принять или отвергнуть гипотезу о существовании автокорреляции; - ряд остатков некоррелирован. Если d превышает 2, то это свидетельствует о наличии отрицательной корреляции. Перед входом в таблицу такие значения следует преобразовать по формуле .
Если установлено наличие автокорреляции остатков, нужно улучшить модель (изменить кривые роста, попытаться выделить дополнительные регулярные компоненты и т.п.). Если же ситуация оказалась неопределённой, применяют другие критерии. В частности можно воспользоваться первым коэффициентом автокорреляции:
.
Для суждения о наличии или отсутствии автокорреляции с исследуемом ряду фактическое значение коэффициента автокорреляции (5.8) сопоставляется с табличным (критическим) для 5%-го или 1%-го уровня значимости (вероятность допустить ошибку при принятии гипотезы о независимости уровней ряда). Если , то гипотеза об отсутствии автокорреляции в ряду может быть принята. Когда же фактическое значение больше табличного, делают вывод о наличии автокорреляции во временном ряду.
4. Неизменность дисперсии остатков при изменении факторной переменной (исследование на гетероскедастичность) обычно проверяется с помощью трёх тестов, в которых делаются различные предположения о зависимости между дисперсией случайной компоненты и факторной переменной: тест ранговой корреляции Спирмена, тест Голдфельда-Квандта и тест Глейзера.
При малом объёме выборки для оценки гетероскедастичности может использоваться метод Голдфельда-Квандта. Для проведения такого теста необходимо выполнить следующие шаги:
- упорядочить n наблюдений по мере возрастания переменной x;
- разделить совокупность наблюдений на две группы (соответственно с малыми и большими значениями фактора x) и построить по каждой из групп уравнение регрессии
- определить остаточную сумму квадратов для первой регрессии и второй регрессии .
- вычислить отношения Fнабл = S2/S1 (или S1/S2). В числителе должна быть большая сумма квадратов. F распреде
- полученное отношение имеет сравнит с Fкр(a, k1, k2), где k1 = n1 – m, k2 = n2 – m. Здесь n1 и n2 – количество наблюдений попавших в 1-ю и 2-ю группы. Если Fнабл > Fкр , то гетероскедастичность имеет место, то есть условие о неизменности дисперсии при изменении факторной переменной не выполняется.
5. Соответствие ряда остатков нормальному закону распределения проверим с помощью R/S – критерия:
.
Полученное значение проверяется на предмет попадания в интервал, границы которого являются табличными значениями, и зависят от уровня доверия α и количества наблюдений n.
Если все четыре пункта проверки 1-5 дают положительный результат, делается вывод о том, что выбранная трендовая модель является адекватной реальному ряду наблюдений. Только в этом случае её можно использовать для построения прогнозных оценок. В противном случае модель нужно улучшать.