Примеры решения задач по множественной регрессии

Пример 1. Уравнение регрессии, построенное по 17 наблюдениям, имеет вид:

Примеры решения задач по множественной регрессии - student2.ru

Расставить пропущенные значения, а также построить доверительный интервал для b2 с вероятностью 0,99.

Решение. Пропущенные значения определяем с помощью формул:

Примеры решения задач по множественной регрессии - student2.ru Примеры решения задач по множественной регрессии - student2.ru Примеры решения задач по множественной регрессии - student2.ru

Примеры решения задач по множественной регрессии - student2.ru

Таким образом, уравнение регрессии со статистическими характеристиками выглядит так:

Примеры решения задач по множественной регрессии - student2.ru

Доверительный интервал для b2 строим по соответствующей формуле. Здесь уровень значимости равен 0,01, а число степеней свободы равно n – p – 1 = 17 – 3 – 1 = 13, где n = 17 – объём выборки, p = 3 – число факторов в уравнении регрессии. Отсюда

Примеры решения задач по множественной регрессии - student2.ru

Примеры решения задач по множественной регрессии - student2.ru ,

или Примеры решения задач по множественной регрессии - student2.ru . Этот доверительный интервал накрывает истинное значение параметра Примеры решения задач по множественной регрессии - student2.ru с вероятностью, равной 0,99.

Пример 2.Уравнение регрессии в стандартизованных переменных выглядит так:

Примеры решения задач по множественной регрессии - student2.ru .

При этом вариации всех переменных равны следующим величинам:

Примеры решения задач по множественной регрессии - student2.ru .

Сравнить факторы по степени влияния на результирующий признак и определить значения частных коэффициентов эластичности.

Решение.Стандартизованные уравнения регрессии позволяют сравнивать факторы по силе их влияния на результат. При этом, чем больше по абсолютной величине коэффициент при стандартизованной переменной, тем сильнее данный фактор влияет на результирующий признак. В рассматриваемом уравнении самое сильное воздействие на результат оказывает фактор х1, имеющий коэффициент – 0,82, самое слабое – фактор х3 с коэффициентом, равным – 0,43.

В линейной модели множественной регрессии обобщающий (средний) коэффициент частной эластичности определяется выражением, в которое входят средние значения переменных и коэффициент при соответствующем факторе уравнения регрессии натурального масштаба. В условиях задачи эти величины не заданы. Поэтому воспользуемся выражениями для вариации по переменным:

Примеры решения задач по множественной регрессии - student2.ru

Коэффициенты bj связаны со стандартизованными коэффициентами βj соответствующим соотношением, которое подставим в формулу для среднего коэффициента эластичности:

Примеры решения задач по множественной регрессии - student2.ru .

При этом знак коэффициента эластичности будет совпадать со знаком βj:

Примеры решения задач по множественной регрессии - student2.ru

Пример 3. По 32 наблюдениям получены следующие данные:

Примеры решения задач по множественной регрессии - student2.ru

Определить значения скорректированного коэффициента детерминации, частных коэффициентов эластичности и параметра а.

Решение. Значение скорректированного коэффициента детерминации определим по одному из формул для его вычисления:

Примеры решения задач по множественной регрессии - student2.ru

Частные коэффициенты эластичности (средние по совокупности) вычисляем по соответствующим формулам:

Примеры решения задач по множественной регрессии - student2.ru

Поскольку линейное уравнение множественной регрессии выполняется при подстановке в него средних значений всех переменных, определяем параметр а:

Примеры решения задач по множественной регрессии - student2.ru

Пример 4. По некоторым переменным имеются следующие статистические данные:

Примеры решения задач по множественной регрессии - student2.ru Примеры решения задач по множественной регрессии - student2.ru Примеры решения задач по множественной регрессии - student2.ru Примеры решения задач по множественной регрессии - student2.ru Примеры решения задач по множественной регрессии - student2.ru

Примеры решения задач по множественной регрессии - student2.ru Примеры решения задач по множественной регрессии - student2.ru Примеры решения задач по множественной регрессии - student2.ru Примеры решения задач по множественной регрессии - student2.ru

Построить уравнение регрессии в стандартизованном и натуральном масштабах.

Решение.Поскольку изначально известны коэффициенты парной корреляции между переменными, начать следует с построения уравнения регрессии в стандартизованном масштабе. Для этого надо решить соответствующую систему нормальных уравнений, которая в случае двух факторов имеет вид:

Примеры решения задач по множественной регрессии - student2.ru

или, после подстановки исходных данных:

Примеры решения задач по множественной регрессии - student2.ru

Решаем эту систему любым способом, получаем: β1 = 0,3076, β2 = 0,62.

Запишем уравнение регрессии в стандартизованном масштабе:

Примеры решения задач по множественной регрессии - student2.ru

Теперь перейдем к уравнению регрессии в натуральном масштабе, для чего используем формулы расчета коэффициентов регрессии через бета-коэффициенты и свойство справедливости уравнения регрессии для средних переменных:

Примеры решения задач по множественной регрессии - student2.ru

Уравнение регрессии в натуральном масштабе имеет вид:

Примеры решения задач по множественной регрессии - student2.ru

Пример 5.При построении линейной множественной регрессии Примеры решения задач по множественной регрессии - student2.ru по 48 измерениям коэффициент детерминации составил 0,578. После исключения факторов х3, х7 и х8 коэффициент детерминации уменьшился до 0,495. Обоснованно ли было принятое решение об изменении состава влияющих переменных на уровнях значимости 0,1, 0,05 и 0,01?

Решение.Пусть Примеры решения задач по множественной регрессии - student2.ru - коэффициент детерминации уравнения регрессии при первоначальном наборе факторов, Примеры решения задач по множественной регрессии - student2.ru - коэффициент детерминации после исключения трех факторов. Выдвигаем гипотезы:

Примеры решения задач по множественной регрессии - student2.ru ; Примеры решения задач по множественной регрессии - student2.ru

Основная гипотеза предполагает, что уменьшение величины Примеры решения задач по множественной регрессии - student2.ru было несущественным, и решение об исключении группы факторов было правильным. Альтернативная гипотеза говорит о правильности принятого решения об исключении.

Для проверки нуль – гипотезы используем следующую статистику:

Примеры решения задач по множественной регрессии - student2.ru ,

где n = 48, p = 10 – первоначальное количество факторов, k = 3 – количество исключаемых факторов. Тогда

Примеры решения задач по множественной регрессии - student2.ru

Сравним полученное значение с критическим F(α; 3; 39) на уровнях 0,1; 0,05 и 0,01:

F(0,1; 3; 37) = 2,238;

F(0,05; 3; 37) = 2,86;

F(0,01; 3; 37) = 4,36.

На уровне α = 0,1 Fнабл > Fкр, нуль – гипотеза отвергается, исключение данной группы факторов не оправдано, на уровнях 0,05 0,01 нуль – гипотеза не может быть отвергнута, и исключение факторов можно считать оправданным.

Пример 6. На основе квартальных данных с 2000 г. по 2004 г. получено уравнение Примеры решения задач по множественной регрессии - student2.ru . При этом ESS=110,3, RSS=21,4 (ESS – объясненная СКО, RSS – остаточная СКО). В уравнение были добавлены три фиктивные переменные, соответствующие трем первым кварталам года, и величина ESS увеличилась до 120,2. Присутствует ли сезонность в этом уравнении?

Решение. Это задача на проверку обоснованности включения группы факторов в уравнение множественной регрессии. В первоначальное уравнение с тремя факторами были добавлены три переменные, соответствующие первым трем кварталам года.

Определим коэффициенты детерминации уравнений. Общая СКО определяется как сумма факторной и остаточной СКО:

ТSS = ESS1 + RSS1 = 110,3 + 21,4 = 131,7

Отсюда:

Примеры решения задач по множественной регрессии - student2.ru

Проверяем гипотезы Примеры решения задач по множественной регрессии - student2.ru . Для проверки нуль – гипотезы используем статистику

Примеры решения задач по множественной регрессии - student2.ru

Здесь n = 20 (20 кварталов за пять лет – с 2000 г. по 2004 г.), p = 6 (общее количество факторов в уравнении регрессии после включения новых факторов), k = 3 (количество включаемых факторов). Таким образом:

Примеры решения задач по множественной регрессии - student2.ru

Определим критические значения статистики Фишера на различных уровнях значимости:

Примеры решения задач по множественной регрессии - student2.ru

На уровнях значимости 0,1 и 0,05 Fнабл> Fкр, нуль – гипотеза отвергается в пользу альтернативной, и учет сезонности в регрессии является обоснованным (добавление трех новых факторов оправдано), а на уровне 0,01 Fнабл< Fкр, и нуль – гипотеза не может быть отклонена; добавление новых факторов не оправдано, сезонность в регрессии не является существенной.

Пример 7. При анализе данных на гетероскедастичность вся выборка была после упорядочения по одному из факторов разбита на три подвыборки. Затем по результатам трехфакторного регрессионного анализа было определено, что остаточная СКО в первой подвыборке составила 180, а в третьей – 63. Подтверждается ли наличие гетероскедастичности, если объем данных в каждой подвыборке равен 20?

Решение. Рассчитаем–статистику для проверки нуль–гипотезы о гомоскедастичности по тесту Голдфелда–Квандта:

Примеры решения задач по множественной регрессии - student2.ru .

Найдем критические значения статистики по Фишеру:

Примеры решения задач по множественной регрессии - student2.ru

Следовательно, на уровнях значимости 0,1 и 0,05 Fнабл> Fкр, и гетероскедастичность имеет место, а на уровне 0,01 Fнабл< Fкр, и гипотезу о гомоскедастичности отклонить нельзя.

Пример 8. На основе квартальных данных получено уравнение множественной регрессии Примеры решения задач по множественной регрессии - student2.ru , для которого ESS = 120,32 и RSS = 41,4. Для этой же модели были раздельно проведены регрессии на основе следующих данных: 1 квартал 1991 г. – 1 квартал 1995 г. и 2 квартал 1995 г. – 4 квартал 1996 г. В этих регрессиях остаточные СКО соответственно составили 22,25 и 12,32. Проверить гипотезу о наличии структурных изменений в выборке.

Решение. Задача о наличии структурных изменений в выборке решается с помощью теста Чоу.

Гипотезы имеют вид: Примеры решения задач по множественной регрессии - student2.ru , где s0, s1 и s2 – остаточные СКО соответственно для единого уравнения по всей выборке и уравнений регрессии двух подвыборок общей выборки. Основная гипотеза отрицает наличие структурных изменений в выборке. Для проверки нуль – гипотезы рассчитывается статистика (n = 24; p = 3):

Примеры решения задач по множественной регрессии - student2.ru

Поскольку F – статистика меньше единицы, нуль – гипотезу нельзя отклонить ни для какого уровня значимости. Например, для уровня значимости 0,05 :

Примеры решения задач по множественной регрессии - student2.ru .

Наши рекомендации