ТЕМА: Фіктивні змінні в регресійних моделях
Необхідність використання фіктивних змінних
У регресійних моделях у якості пояснюючих змінних часто доводиться використовувати не тільки кількісні (обумовлені чисельно), але і якісні змінні. Наприклад, попит на деяке благо може визначатися ціною даного блага, ціною на замінники даного блага, доходом споживачів тощо (ці показники визначаються кількісно). Але попит може також залежати від смаків споживачів, їхніх вподобань, національних і релігійних особливостей. А ці показники представити в чисельному виді не можна. Виникає проблема відображення в моделі впливу таких змінних на досліджувану величину. Це досить складне завдання.
Зазвичай в моделях вплив якісного фактору виражається у вигляді фіктивної ( dummy) змінної, яка відображає два протилежні стани якісного фактору. Наприклад, «фактор діє» - «фактор не діє», «курс валюти фіксований» - «курс валюти плаваючий», «сезон літній» - «сезон зимовий» тощо. У цьому випадку фіктивна змінна D може виражатися у двійковій формі:
0, фактор не діє,
D = 1, фактор діє.
Наприклад, D = 0, якщо споживач не має вищої освіти, D = 1, якщо споживач має вищу освіти.
Таким чином, крім моделей, що містять тільки кількісні пояснюючі змінні (позначені Xj), у регресійному аналізі розглядаються також моделі, що містять лише якісні змінні (позначені Dj) або ті й інші одночасно.
Регресійні моделі, що містять лише якісні пояснюючі змінні, називаються ANOVA - моделями (моделями дисперсійного аналізу). Наприклад, нехай Y - початкова заробітна плата. Тоді залежність між заробітною платою і наявністю вищої освіти можна виразити моделлю парної регресії Y = βо + γ D + u. (1)
0, претендент не має вищої освіти,
D = 1, претендент має вищу світу.
При цьому M(Y | D = 0) = βо + γ · 0 = βо, M(Y | D = 1) = βо + γ ·1 = βо + γ.
Коефіцієнтβо визначає середню початкову заробітну плату за відсутності вищої освіти. Коефіцієнт γ вказує, на яку величину відрізняються середні початкові заробітні плати за наявності та відсутності вищої освіти у претендента. Перевіряючи статистичну значущість коефіцієнта γ за допомогою t-статистики або значущість коефіцієнта детермінації R2 за допомогою F-статистики, можна визначити, впливає чи ні наявність вищого утворення на початкову заробітну плату.
Неважко помітити, що ANOVA-моделі являють собою кусково-постійні функції. Однак такі моделі в економіці є вкрай рідкими. Набагато частіше зустрічаються моделі, що містять як якісні, так і кількісні змінні.
Моделі ANCOVA
Моделі, у яких пояснюючі змінні носять як кількісний, так і якісний характер, називаються ANCOVA - моделями (моделями коваріаційного аналізу).