Множественный регрессионный анализ

Построение уравнения множественной регрессии начинается с решения вопроса о спецификации модели, который в свою очередь включает 2 круга вопросов: отбор факторов и выбор уравнения регрессии.

Отбор факторов обычно осуществляется в два этапа:

1) теоретический анализ взаимосвязи результата и круга факторов, которые оказывают на него существенное влияние;

2) количественная оценка взаимосвязи факторов с результатом. При линейной форме связи между признаками данный этап сводится к анализу корреляционной матрицы (матрицы парных линейных коэффициентов корреляции):

множественный регрессионный анализ - student2.ru

Факторы, включаемые во множественную регрессию, должны отвечать следующим требованиям:

1. Они должны быть количественно измеримы. Если необходимо включить в модель качественный фактор, не имеющий количественного измерения, то ему нужно придать количественную определенность (например, в модели урожайности качество почвы задается в виде баллов).

2. Каждый фактор должен быть достаточно тесно связан с результатом (т.е. коэффициент парной линейной кор­реляции между фактором и результатом должен быть существенным).

3. Факторы не должны быть коррелированны друг с другом, тем более находиться в строгой функциональной связи (т.е. они не должны быть интеркоррелированны). Разновидностью интеркоррелированности факторов является мультиколлинеарность - наличие высокой линейной связи между всеми или несколькими факторами.

Мультиколлинеарность может привести к нежелательным последствиям:

1) оценки параметров становятся ненадежными, обнаруживают большие стандартные ошибки и меняются с из­менением объема наблюдений (не только в величине, но и по знаку), что делает модель непригодной для анализа и прогнозирования.

2) затрудняется интерпретация параметров множественной регрессии как характеристик действия факторов в «чистом» виде, ибо факторы коррелированны; параметры линейной регрессии теряют экономический смысл;

3) нельзя определить изолированное влияние факторов на результативный показатель.

Мультиколлинеарность имеет место, если определи­тель матрицы межфакторной корреляции близок к нулю:

множественный регрессионный анализ - student2.ru

Если же определитель матрицы межфакторной корреляции близок к единице, то мультколлинеарности нет.

Существуют различные подходы преодоления сильной межфакторной корреляции. Простейший из них - исключение из модели фактора (или факторов), в наибольшей степени ответственных за мультиколлинеарность при условии, что качество модели при этом пострадает несущественно (а именно, множественный регрессионный анализ - student2.ru снизится несущественно).

Определение факторов, ответственных за мультиколлинеарность, может быть основано на анализе матрицы межфакторной корреляции. При этом определяют пару признаков-факторов, которые сильнее всего связаны между собой (коэффициент линейной парной корреляции максимален по модулю). Из этой пары в наибольшей степени ответственным за Мультиколлинеарность будет тот признак, который теснее связан с другими факторами модели (имеет более высокие по модулю значения коэффициентов парной линейной корреляции).

Еще один способ определения факторов, ответственных за мультиколлинеарность основан на вычислении ко­эффициентов множественной детерминации множественный регрессионный анализ - student2.ru , показывающего зависимость каждого фактора от других факторов модели. При этом в качестве зависимой переменной рассматривается каждый из факторов множественный регрессионный анализ - student2.ru . Ав качестве независимых переменных прочие факторы модели множественный регрессионный анализ - student2.ru . Чем ближе значение коэффициента множественной детерминации к единице, тем больше ответственность за мультиколлинеарность фактора, выступающего в роли зависимой переменной. Сравнивая между собой коэффициенты множественной детерминации для различных факторов можно проранжировать переменные по степени ответственности за мультиколлинеарность.

При выборе формы уравнения множественной регрес­сии предпочтение отдается линейной функции: множественный регрессионный анализ - student2.ru

в виду четкой интерпретации параметров.

Данное уравнение регрессии называют уравнением регрессии в естественном (натуральном) масштабе. Коэффициент регрессии множественный регрессионный анализ - student2.ru при факторе множественный регрессионный анализ - student2.ru называют условно-чистым коэффициентом регрессии.Он измеряет среднее по совокупности отклонение признака-результата от его средней величины при отклонении признака-фактора множественный регрессионный анализ - student2.ru на единицу, при условии, что все прочие факторы модели не изменяются (зафиксированы на своих средних уровнях).

Если не делать предположения о значениях прочих факторов, входящих в модель, то это означало бы, что каждый из них при изменении множественный регрессионный анализ - student2.ru также изменялся бы, так как факторы (пусть и несильно) связаны между собой, и своим изменением оказывал бы влияние на признак-результат.

Наши рекомендации