Проверка данных на мультиколлинеарность(Тест Фаррара-Глобера).
Всероссийская Академия Внешней Торговли
Факультет Внешнеторгового Менеджмента
Кафедра информатики и математики
Предметно – аналитическая справка:
«Зависимость цен на фотоаппараты от их характеристик»
Выполнил:
Студент ФВМ-3
Золотов Богдан
Научный руководитель:
Старший преподаватель кафедры информатики и математики
Никитина Татьяна Аркадьевна
Оглавление:
Введение……………………………………………………………………………………………….3
Перечень условных обозначений………………………………………………………..3
Исходные данные…………………………………………………………………………………4
Графический анализ данных ………………………………………………………………4
Регрессионный анализ…………………………………………………………………………5
Проверка данных на мультиколлениарность…………………………………….6
Тест «длинная – короткая» модель……………………………………………………..6
Тест Чоу на однородность данных………………………………………………………7
Тест Гольдфельда – Куандта………………………………………………………………..7
Тест Бреуша – Пагана…………………………………………………………………………...7
Тест Дарбина-Уотсона………………………………………………………………………….8
Тест Броуша – Годфри………………………………………………………………………….8
Заключение…………………………………………………………………………………………..8
Введение.
Цель данной работы – составление модели для исследования зависимости цен наиболее популярных на российском рынке на ноябрь 2013 года фотоаппаратов. Таким образом, в своей модели я использую n=38 наблюдений(38 различных фотоаппаратов). Изначально предположим, что цена фотоаппарата (объясняемая переменная Y) зависит от следующих факторов (объясняющих поведение Y переменных X):
X1 | Оптический zoom, кратность | ||
X2 | Высота,мм | ||
X3 | Толщина,мм | ||
X4 | Макс частота кадров видеоролика, кадр/сек | ||
X5 | Размер экрана, дюйм |
Перечень условных обозначений
n– число наблюдений
k– число факторов
a – альфа, уровень значимости, равный 0,05
q – число отбрасываемых факторов при проверке гипотезы «длинная - короткая»
FGнабл, FGкрит – наблюдаемое и критическое значения теста Фаррара-Глобера
ESSдл - ESS из длинной модели для проверки гипотезы «длинная-короткая»
ESSкор – ESS из короткой модели для проверки гипотезы «длинная-короткая».
ESS -сумма ESS из общей регрессии для теста Чоу
ESS1 - ESS из регрессии для первой части теста Чоу
ESS2 - ESS из регрессии для второй части теста Чоу
q – число выбрасываемых средних наблюдений для теста Гольдфельда-Куандта
m, n -число наблюдений для первой и второй подвыборки теста Гольдфельда-Куандта.
F и Fкр –наблюдаемое и критическое значения статистики
DW- наблюдаемое значение критерия Дарбина-Уотсона.
du; dl-значение статистик Дарбина-Уотсона при 5% уровне значимости.
Исходные данные.
X1 | Оптический zoom, кратность | ||
X2 | Высота,мм | ||
X3 | Толщина,мм | ||
X4 | Макс частота кадров видеоролика, кадр/сек | ||
X5 | Размер экрана, дюйм |
Графический анализ данных.
По имеющимся данным строим графики-диаграммы рассеяния зависимости объясняемой переменной Y (цена фотоаппарата, руб.) от каждой из объясняющих переменных X.
Проведя анализ графиков, я выдвинул предположения о присутствии гетероскедастичности.
Относительно всех построенных графиков можно сделать вывод: модель линейна.
Регрессионный анализ.
После того как были построены графики при помощи пакета анализа Microsoft Excel была получена регрессия. Модель получилась значимой, а значимые коэффициенты X1, X2, X5. Коэффициент детерминации R^2 =0,8, что свидетельствует о достаточно высокой точности построенной модели.
Теоретическое уравнение регрессии: Y= Y=B0+B1X1+B2X2+B3X3+B4X4+B5X5+E
Выборочное уравнение регрессии:
Y^=-13822,56-707,176X1-79,834X2-31,798X3+46,369X4+3234,139X5+E
Интерпретация коэффициентов:
β1 При увеличении оптического zoom на 1 ед.,цена фотоаппарата увеличится в среднем на 707,17руб. при неизменных прочих факторах
β2 При увеличении высоты фотоаппарата на 1 мм.,цена увеличится в среднем на 79,83руб. при неизменных прочих факторах
β3 При увеличении толщины фотоаппарата на 1мм.,цена увеличится в среднем на 31,80руб. при неизменных прочих факторах
β4 При увеличении максимальной частоты кадров фотоаппарата на 1ед.,цена увеличится в среднем на 46,37руб. при неизменных прочих факторах
β5 При увеличении размера экрана фотоаппарата на 1 дюйм, цена увеличится в среднем на 3234,14руб. при неизменных прочих факторах
Проверка данных на мультиколлинеарность(Тест Фаррара-Глобера).
Я провёл тест Фарара Глобера на выявление мультиколлинеарности, мультиколлинеарность выявлена, факторы линейно зависимы между собой и именно этим объясняется нелогичность в интерпретации некоторых коэффициентов.