Дана матрица парных коэффициентов корреляции
Коллинеарными являются факторы …
и
и
и
и y
Решение:
Считается, что две переменные явно коллинеарны, т.е. находятся между собой в линейной зависимости, если . В нашей модели только коэффициент парной линейной регрессии между факторами и больше 0,7. , значит, факторы и коллинеарны.
4. В модели множественной регрессии определитель матрицы парных коэффициентов корреляции между факторами , и близок к нулю. Это означает, что факторы , и …
мультиколлинеарны
независимы
количественно измеримы
значимы
Решение:
Для оценки мультиколлинеарности факторов может использоваться определитель матрицы парных коэффициентов корреляции между факторами. Если факторы не коррелированы между собой, то матрица парных коэффициентов корреляции между факторами была бы единичной. Поскольку все недиагональные элементы были бы равны нулю.
, поскольку = = и = = =0.
Если между факторами существует полная линейная зависимость и все коэффициенты парной корреляции равны единице, то определитель такой матрицы равен нулю.
Чем ближе к нулю определитель матрицы межфакторной корреляции, тем сильнее мультиколлинеарность факторов и ненадежнее результаты множественной регрессии. И, наоборот, чем ближе к единице определитель матрицы межфакторной корреляции, тем меньше мультиколлинеарность факторов.
5. Для эконометрической модели линейного уравнения множественной регрессии вида построена матрица парных коэффициентов линейной корреляции (y – зависимая переменная; х(1), х(2), х(3), x(4)– независимые переменные):
Коллинеарными (тесно связанными) независимыми (объясняющими) переменными не являются …
x(2) и x(3)
x(1) и x(3)
x(1) и x(4)
x(2) и x(4)
Решение:
При построении модели множественной регрессии необходимо исключить возможность существования тесной линейной зависимости между независимыми (объясняющими) переменными, которая ведет к проблеме мультиколлинеарности. При этом осуществляют проверку коэффициентов линейной корреляции для каждой пары независимых (объясняющих) переменных. Эти значения отражены в матрице парных коэффициентов линейной корреляции. Считается, что наличие значений коэффициентов парной корреляции между объясняющими переменными, превышающих по абсолютной величине 0,7, отражает тесную связь между этими переменными (теснота связи с переменной y в данном случае не рассматривается). Такие независимые переменные называются коллинеарными. Если значение коэффициента парной корреляции между объясняющими переменными не превышает по абсолютной величине 0,7, то такие объясняющие переменные не являются коллинеарными. Рассмотрим значения парных коэффициентов межфакторной корреляции: между x(1) и x(2) значение равно 0,45; между x(1) и x(3) – равно 0,82; между x(1) и x(4) – равно 0,94; между x(2) и x(3) – равно 0,3; между x(2) и x(4) – равно 0,7; между x(3) и x(4) – равно 0,12. Таким образом, не превышают 0,7 значения , , . Следовательно, коллинеарными не являютсяфакторы x(1) и x(2), x(2) и x(3), x(3) и x(4). Из последних перечисленных пар в вариантах ответов присутствует пара x(2) и x(3) – это верный вариант ответа. Для остальных пар: x(1 и x(3), x(1) и x(4), x(2) и x(4) – значения парных коэффициентов межфакторной корреляции превышают 0,7, и эти факторы являются коллинеарными.
Тема 3: Фиктивные переменные
1. Дана таблица исходных данных для построения эконометрической регрессионной модели:
Фиктивными переменными не являются …
стаж работы
производительность труда
уровень образования
уровень квалификации работника
Решение:
При построении регрессионной модели может возникнуть ситуация, когда необходимо включить в уравнение помимо количественных переменных переменные, отражающие некоторые атрибутивные признаки (пол, образование, регион и т.п.). Такого рода качественные переменные называются «фиктивными» (dummy) переменными. Для построения указанной в постановке задания модели используются фиктивные переменные: уровень образования и уровень квалификации работника. Остальные переменные не являются фиктивными, из предложенных вариантов это стаж работы и производительность труда.
2. При исследовании зависимости потребления мяса от уровня дохода и пола потребителя можно рекомендовать …
использовать фиктивную переменную – пол потребителя
разделить совокупность на две: для потребителей женского пола и для потребителей мужского пола
использовать фиктивную переменную – уровень дохода
исключить из рассмотрения пол потребителя, так как данный фактор нельзя измерить количественным образом
Решение:
При построении регрессионной модели может возникнуть ситуация, когда необходимо включить в уравнение помимо количественных переменных переменные, отражающие некоторые атрибутивные признаки (пол, образование, регион и т.п.). Такого рода качественные переменные называются «фиктивными» (dummy) переменными. Они отражают неоднородность исследуемой статистической совокупности и используются для более качественного моделирования зависимостей в таких неоднородных объектах наблюдения. При моделировании отдельных зависимостей по неоднородным данным можно также воспользоваться способом разделения всей совокупности неоднородных данных на несколько отдельных совокупностей, количество которых равно количеству состояний dummy-переменной. Таким образом правильными вариантами ответов являются: «использовать фиктивную переменную – пол потребителя» и «разделить совокупность на две: для потребителей женского пола и для потребителей мужского пола».
3. Изучается зависимость цены квартиры (у) от ее жилой площади (х) и типа дома. В модель включены фиктивные переменные, отражающие рассматриваемые типы домов: монолитный, панельный, кирпичный. Получено уравнение регрессии: ,
где ,
Частными уравнениями регрессии для кирпичного и монолитного являются …
для типа дома кирпичный
для типа дома монолитный
для типа дома кирпичный
для типа дома монолитный
Решение:
Требуется узнать частное уравнение регрессии для кирпичного и монолитного домов. Для кирпичного дома значения фиктивных переменных следующие , . Уравнение примет вид: или для типа дома кирпичный.
Для монолитного дома значения фиктивных переменных следующие , . Уравнение примет вид
или для типа дома монолитный.
4. При анализе промышленных предприятий в трех регионах (Республика Марий Эл, Республика Чувашия, Республика Татарстан) были построены три частных уравнения регрессии:
для Республики Марий Эл;
для Республики Чувашия;
для Республики Татарстан.
Укажите вид фиктивных переменных и уравнение с фиктивными переменными, обобщающее три частных уравнения регрессии.
Решение:
Три уравнения отличаются только свободным членом. Нужно ввести две фиктивные переменные, например и . Поскольку для Республики Марий значение свободного члена минимальное, то для нее
Пусть
Тогда уравнение для Республики Чувашия можно переписать в виде
или
Пусть
Тогда уравнение для Республики Татарстан можно переписать в виде или
Итоговое уравнение будет
5. В эконометрике фиктивной переменной принято считать …
переменную, принимающую значения 0 и 1
описывающую количественным образом качественный признак
переменную, которая может равняться только целому числу
несущественную переменную
Решение:
Качественное различие признаков можно формализовать с помощью любой переменной, принимающей два значения, не обязательно 0 или 1. Однако в эконометрической практике почти всегда используются фиктивные переменные типа «0-1», поскольку в этом случае можно интерпретировать результаты моделирования.