Высокое значение коэффициента детерминации определяется наличием в выборке аномальных значений

полученное уравнение не рекомендуется использовать для прогнозирования

высокое значение коэффициента детерминации говорит о том, что между объемом кредитов и объемом инвестиций в основной капитал существует тесная линейная зависимость

полученное уравнение имеет высокую прогнозную силу

Решение:

Данные упорядочены по возрастанию объемов кредитов, предоставленных предприятиям, организациям, банкам и физическим лицам. Даже беглый взгляд на данные позволяет заметить, что Московская область является аномальным значением – в ней обе переменные имеют значения, в разы превосходящие все остальные величины. Такие значения называются аномальными, или выбросами. На рисунке показано расположение точек всей выборки и уравнение регрессии, построенное по ней.

Высокое значение коэффициента детерминации определяется наличием в выборке аномальных значений - student2.ru
Наличие аномально больших значений способствует высокому значению коэффициента детерминации, поскольку для минимизации суммы квадратов отклонений уравнение регрессии обязательно должно пройти через аномальную точку.

Если исключить аномальное значение и построить поле корреляции и уравнение регрессии, а также рассчитать коэффициент детерминации (см. на рисунке), то можно заметить, что связь между переменными не является сильной и высокой прогнозной силой уравнение не обладает.

Высокое значение коэффициента детерминации определяется наличием в выборке аномальных значений - student2.ru

Кейс 1 подзадача 3

1. По 72 банкам построено уравнение зависимости размеров кредитов, выданных предприятиям и организациям, в млн. руб. (y) от собственного капитала, млн руб. (x): y = 710,967 + 3,057 ∙ x . Исходные данные упорядочены по убыванию величины собственного капитала. По величинам остатков рассчитан коэффициент автокорреляции первого порядка, равный -0,45539. На рисунке представлен график остатков.


Высокое значение коэффициента детерминации определяется наличием в выборке аномальных значений - student2.ru
Если для остатков модели, выполнены предпосылки МНК, то оценки параметров, полученные методом наименьших квадратов (МНК), обладают свойствами …

Несмещенности

Состоятельности

Эффективности

гомоскедастичности

гетероскедастичности

нормального распределения

Решение:

Оценки параметров регрессии должны обладать определенными критериями: быть несмещенными, состоятельными и эффективными. Несмещенность оценки означает, что математическое ожидание остатков равно нулю. Оценки считаются эффективными, если они характеризуются наименьшей дисперсией. Состоятельность оценок характеризует увеличение точности оценок с увеличением объема выборки. Если выполняются следующие предпосылки метода наименьших квадратов:

1) случайный характер остатков;

2) нулевая средняя величина остатков, не зависящая от xi;

3) гомоскедастичность остатков – дисперсия каждого отклонения ei одинакова для всех значений xi;

4) отсутствие автокорреляции остатков (значения остатков ei распределены независимо друг от друга);

5) остатки подчиняются нормальному закону распределения,
то оценки, полученные методом наименьших квадратов, обладают свойствами несмещенности, состоятельности и эффективности.

Наши рекомендации