Принципы отбора факторов модели

Не включенные в модель и, соответственно, неучтенные в ней прочие факторы могут составить значительную долю в общей вариации результативного признака. Эта недостача в определенной мере учитывается коэффициентом Принципы отбора факторов модели - student2.ru .

Многофакторный регрессионный анализ решает три задачи:

1) определяет специфику модели – вид функции неслучайных переменных Принципы отбора факторов модели - student2.ru , включенных в модель;

2) выявляет тесноту связи между факторами;

3) устанавливает влияние отдельных факторов на результативный признак.

При отборе факторов модели представляет интерес матрица коэффициентов парной корреляции

Принципы отбора факторов модели - student2.ru

В случае линейной зависимости множественной регрессии исследуется так же расширенная матрица

Принципы отбора факторов модели - student2.ru

Элементы матриц Принципы отбора факторов модели - student2.ru и Принципы отбора факторов модели - student2.ru позволяют сделать отбор факторов и определить их минимальное, но достаточное количество для описания результативной переменной.

Многофакторная модель линейной регрессии может быть представлена как

Принципы отбора факторов модели - student2.ru

или в матричном виде Принципы отбора факторов модели - student2.ru , где

Принципы отбора факторов модели - student2.ru

Факторы, включаемые в модель, должны быть количественно измеримы. Так, если фактор изначально качественный, то ему нужно придать количественную определенность. Подобная ситуация возникает, когда при построении регрессионных моделей помимо количественных переменных необходимо отразить и некоторые атрибутивные признаки (регион, образование, пол и т.д.). Такого рода переменные называются качественными или фиктивными. Они отражают неоднородность статистической совокупности и используются для более качественного моделирования по совокупности неоднородных объектов наблюдения. Учет влияния фиктивных переменных осуществляется с помощью булевых переменных, которые могут принимать только одно из двух возможных значений: 0 или 1.

Однако в некоторых случаях бывает целесообразно разделить неоднородную совокупность на однородные и применять моделирование к отдельным однородным совокупностям данных.

Пример.Пусть эконометрическая модель включает такие факторы: а) пол работника (мужской, женский); б) уровень образования (среднее, высшее); в) категория жилья (общежитие, отдельная квартира); г) социальный статус (замужем, не замужем); д) стаж работы (лет, месяцев); е) среднемесячная зарплата; ж) величина прожиточного минимума в регионе. Какие из этих факторов являются количественными, а какие качественными?

Ответ. Первые четыре фактора являются качественными, поскольку не могут быть измерены. Последние три, напротив, могут быть измерены и потому являются количественными.

Пример. При продаже-покупке квартиры в городе ее цена y может зависеть от полезной площади xи таких качественных факторов как: Принципы отбора факторов модели - student2.ru – дом кирпичный, Принципы отбора факторов модели - student2.ru – дом панельный. Придадим качественным (фиктивным) переменным количественное значение:

Принципы отбора факторов модели - student2.ru

Теперь уравнение регрессии можно представить в виде Принципы отбора факторов модели - student2.ru . Пусть теоретическая функция регрессии (цена квартиры) имеет вид Принципы отбора факторов модели - student2.ru тогда цены отдельных типов квартир даются формулами: Принципы отбора факторов модели - student2.ru – дом кирпичный; Принципы отбора факторов модели - student2.ru – дом панельный.

Важное требование, предъявляемое к эффективности линейной эконометрической модели, состоит в том, что взаимодействия фактора xи фиктивных переменных быть не должно. В противном случае анализ зависимости результата от факторов сильно усложняется, а уравнение регрессии принимает вид Принципы отбора факторов модели - student2.ru Аппроксимация зависимости Принципы отбора факторов модели - student2.ru при корреляции Принципы отбора факторов модели - student2.ru и фиктивной переменной Принципы отбора факторов модели - student2.ru весьма затрудняется. Эту ситуацию можно проиллюстрировать, см. рис. а) и б).

На рисунке а) схематически представлена зависимость результативного признака yот x при отсутствии связи между x и z, а на рисунке б) – при наличии такой связи.

       
  Принципы отбора факторов модели - student2.ru   Принципы отбора факторов модели - student2.ru
 

Факторы, включаемые в модель должны быть некоррелированы. При сильнойинтеркорреляции объясняющих факторов, когда Принципы отбора факторов модели - student2.ru , невозможно определить их раздельное влияние на результативный признак. В этом случае характеристики уравнения регрессии плохо интерпретируются, а их оценки ненадежны. Так, в уравнении Принципы отбора факторов модели - student2.ru , при Принципы отбора факторов модели - student2.ru с изменением Принципы отбора факторов модели - student2.ru будет меняться и Принципы отбора факторов модели - student2.ru . Тогда Принципы отбора факторов модели - student2.ru и Принципы отбора факторов модели - student2.ru нельзя интерпретировать как показатели силы раздельного влияния Принципы отбора факторов модели - student2.ru и Принципы отбора факторов модели - student2.ru на Принципы отбора факторов модели - student2.ru . Дублирующие факторы из модели необходимо исключить. Из двух факторов Принципы отбора факторов модели - student2.ru , для которых Принципы отбора факторов модели - student2.ru , исключить следует тот, который имеет менее выраженный экономический смысл и слабее связан с результативным признаком y.

Отбор факторов модели осуществляется в два этапа:

1) включаются факторы, исходя из экономической природы явления, а экономически немотивированное включение в модель факторов – нецелесообразно;

2) на основе анализа корреляционной матрицы исключаются дублирующие факторы, т.е. факторы, имеющие неслучайную связь с уже отобранными.

Следует понимать, что матрица коэффициентов парной корреляции позволяет исключить лишь явнуюколлинеарность двух факторов.

В случае линейной зависимости между факторами и результативной переменной анализ корреляционной матрицы и выборочных коэффициентов множественной корреляции исчерпывает анализ мультиколлинеарности.

Наши рекомендации