Анализ и способы снижения влияния мультиколлинеарности

На значимость модели

Мультиколлинеарность – попарная корреляционная зависимость между факторами.

Мультиколлинеарная зависимость присутствует, если коэффициент парной корреляции Анализ и способы снижения влияния мультиколлинеарности - student2.ru .

Отрицательное воздействие мультиколлинеарности состоит в следующем:

1. Усложняется процедура выбора главных факторов.

2. Искажается смысл коэффициента множественной корреляции (он предполагает независимость факторов).

3. Усложняются вычисления при построении самой модели.

4. Снижается точность оценки параметров регрессии, искажается оценка дисперсии.

Следствием снижения точности является ненадежность коэффициентов регрессии и отчасти неприемлемость их использования для интерпретации как меры воздействия соответствующей объясняющей переменной на зависимую переменную.

Оценки коэффициента становятся очень чувствительными к выборочным наблюдениям. Небольшое увеличение объема выборки может привести к очень сильным сдвигам в значениях оценок. Кроме того, стандартные ошибки оценок входят в формулы критерия значимости, поэтому применение самих критериев становится также ненадежным. Из сказанного ясно, что исследователь должен пытаться установить стохастическую мультиколлинеарность и по возможности устранить ее.

Для измерения мультиколлинеарности можно использовать коэффициент множественной детерминации

Анализ и способы снижения влияния мультиколлинеарности - student2.ru , (4.23)

где R – коэффициент множественной корреляции.

При отсутствии мультиколлинеарности факторов

Анализ и способы снижения влияния мультиколлинеарности - student2.ru , (4.24)

где d_yj – коэффициент парной детерминации, вычисляемый по формуле

Анализ и способы снижения влияния мультиколлинеарности - student2.ru , (4.25)

где Анализ и способы снижения влияния мультиколлинеарности - student2.ru – коэффициент парной корреляции между j-м фактором и зависимой переменной у.

При наличии мультиколлинеарности соотношение (4.24) не соблюдается. Поэтому в качестве меры мультиколлинеарности используется следующая разность:

Анализ и способы снижения влияния мультиколлинеарности - student2.ru . (4.26)

Чем меньше эта разность, тем меньше мультиколлинеарность. Для устранения мультиколлинеарности используется метод исключения переменных.Этот метод заключается в том, что высоко коррелированные объясняющие переменные (факторы) устраняются из регрессии и она заново оценивается. Отбор переменных, подлежащих исключению, производится с помощью коэффициентов парной корреляции. Опыт показывает, что если Анализ и способы снижения влияния мультиколлинеарности - student2.ru , то одну из переменных можно исключить, но какую переменную исключить из анализа, решают исходя из управляемости факторов на уровне предприятия.

Обычно в модели оставляют тот фактор, на который можно разработать мероприятие, обеспечивающее улучшение значения этого фактора в планируемом году. Возможна ситуация, когда оба мультиколлинеарных фактора управляемы на уровне предприятия.

Решить вопрос об исключении того или иного фактора можно только в соответствии с процедурой отбора главных факторов.

Отбор факторов не самостоятельный процесс, он сопровождается построением модели. Принятие решения об исключении факторов производится на основе анализа значений специальных статистических характеристик и с учетом управляемости факторов на уровне предприятия.

Процедура отбора главных факторов обязательно включает следующие этапы:

1. Анализ факторов на мультиколлинеарностъ и ее исключение.Здесь производится анализ значений коэффициентов парной корреляции Анализ и способы снижения влияния мультиколлинеарности - student2.ru между факторами х_i и x_j.

2. Анализ тесноты взаимосвязи факторов(х)с зависимой переменной(у).

Для анализа тесноты взаимосвязи х и у используются значения коэффициента парной корреляции между фактором и функцией ( Анализ и способы снижения влияния мультиколлинеарности - student2.ru ). Величина определяется на ЭВМ и представлена в корреляционной матрицевида:

№ переменной	x₁	x₂	x₃	…	x_m	y
x₁				…
x₂				…
x₃				…
…	…	…	…	…	…	…
x_m				…
y				…

Факторы, для которых Анализ и способы снижения влияния мультиколлинеарности - student2.ru = О, т. е. не связанные с у, подлежат исключению в первую очередь. Факторы, имеющие наименьшее значение Анализ и способы снижения влияния мультиколлинеарности - student2.ru , могут быть потенциально исключены из модели. Вопрос об их окончательном исключении решается в ходе анализа других статистических характеристик.

3. Анализ коэффициентов р" факторов, которые потенциально могут быть исключены.

Коэффициент β учитывает влияние анализируемых факторов на у с учетом различий в уровне их колеблемости. Коэффициент β показывает, насколько сигм (средних квадратических отклонений) изменяется функция с изменением соответствующего аргумента на одну сигму при фиксированном значении остальных аргументов:

Анализ и способы снижения влияния мультиколлинеарности - student2.ru , (4.27)

Где Анализ и способы снижения влияния мультиколлинеарности - student2.ru – коэффициент β k-roфактора; – среднее квадратическое отклонение k-гофактора; – среднее квадратическое отклонение функции; Анализ и способы снижения влияния мультиколлинеарности - student2.ru – коэффициент регрессии при к-мфакторе.

Из двух факторов х_i и x_j может быть исключен тот фактор, который имеет меньшее значение β.

Допустим, исключению подлежит один из мультиколлинеарных факторов х_i или x_j. Оба фактора управляемы на уровне предприятия, коэффициенты регрессии а_i и а_j статистически значимы. Фактор х_i более тесно связан с у, т. е. Анализ и способы снижения влияния мультиколлинеарности - student2.ru , но при этом . В этом случае обычно исключению подлежит фактор x_j.

4. Проверка коэффициентов регрессии на статистическую значимость.

Проверка может быть произведена двумя способами:

• проверка статистической значимости а_к по критерию Стьюдентапроводится по следующей формуле:

Анализ и способы снижения влияния мультиколлинеарности - student2.ru , (4.27)

где а_k – коэффициент регрессии при к-м факторе;

S_ak – стандартное отклонение оценки параметра а_к (Ферстер Э., Ренц Б. Методы корреляционного и регрессионного анализа. - М.: Финансы и статистика, 1983).

Число степеней свободы статистики t_k равно f = п - т -1, где т – количество факторов, включенных в модель. Значение /, вычисляемое по (4.28), сравнивают с критическим значением t_fa, найденным по таблице Приложения 1 при заданном уровне значимости а и числе степеней свободы f (двухсторонняя критическая область).

Если t_k > t_fa, то а_к существенно больше 0, а фактор х_к оказывает существенное влияние на у. При этом фактор х_к оставляем в модели. Если t_k < t_fa, то фактор исключаем из модели;

• проверка статистической значимости а_к по критерию Фишера –

Анализ и способы снижения влияния мультиколлинеарности - student2.ru , (4.29)

где t² - многомерный аналог критерия Стьюдента.

Число степеней свободы статистики F_k следующее: f₁ = 1, f₂ = п – т-1. Значение F_k, вычисляемое по формуле (4.29), сравнивают с критическим значением Анализ и способы снижения влияния мультиколлинеарности - student2.ru , найденным по таблице Приложения 2, при заданных уровне значимости а и числе степеней свободы f₁, f₂.

Если Анализ и способы снижения влияния мультиколлинеарности - student2.ru , то а_к — существенно больше 0, а фактор х_к оказывает существенное влияние на у. При этом фактор х_к оставляем в модели. Если Анализ и способы снижения влияния мультиколлинеарности - student2.ru , то фактор исключаем из модели.

5. Анализ факторов на управляемость.

В ходе логического анализа на основе экономических знаний исследователь должен сделать вывод: можно ли разработать организационно-технические мероприятия, направленные на улучшение (изменение) выбранных факторов на уровне предприятия. Если это возможно, то данные факторы управляемы. Неуправляемые факторы на уровне предприятия могут быть исключены из модели. Например, из двух факторов х₁ – средняя техническая скорость автомобилей и х₂ – время погрузки-разгрузки на одну ездку при равенстве или близких по значению таких характеристик, как Анализ и способы снижения влияния мультиколлинеарности - student2.ru и , β_x₁ и β_x₂ исключению подлежит x₁. На уровне АТП практически невозможно повлиять на значение технической скорости, которая зависит в основном от климатических условий и величины транспортного потока.

6. Строится новая регрессионная модель без исключенных факторов.Для этой модели определяется коэффициент множественной
детерминации Д.

7. Исследование целесообразности исключения факторов из модели с помощью коэффициента детерминации.

Прежде чем вынести решение об исключении переменных из анализа в силу их незначимого влияния на зависимую переменную, производят исследования с помощью коэффициента детерминации.

В первой регрессии содержится т объясняющих переменных, во второй – только часть из них, а именно т₁ объясняющих переменных. При этом т = m₁ + т₂, т.е. во вторую регрессию мы не включили т₂ объясняющих переменных. Теперь следует проверить, вносят ли совместно эти т₂ переменных существенную долю в объяснение вариации переменной у. Для этого используется статистика

Анализ и способы снижения влияния мультиколлинеарности - student2.ru , (4.30)

которая имеет F-распределение c Анализ и способы снижения влияния мультиколлинеарности - student2.ru и степенями свободы. Здесь Д_т означает коэффициент детерминации регрессии с т объясняющими переменными, а Д_т1 – коэффициент детерминации регрессии с m₁ факторами.

Разность (Д_т - Д_т1) в числителе формулы является мерой дополнительного объяснения вариации переменной у за счет включения т₂ переменных.

Критическое значение Анализ и способы снижения влияния мультиколлинеарности - student2.ru находят по таблице F-распределения при заданном уровне значимости а и f₁ и f₂ степенях свободы. Если Анализ и способы снижения влияния мультиколлинеарности - student2.ru , то включение дополнительно объясняющих переменных совместно не оказывает значимого влияния на переменную у. Если Анализ и способы снижения влияния мультиколлинеарности - student2.ru , то т₂, объясняющих переменных совместно оказывают существенное влияние на вариацию переменной у, и, следовательно, в этом случае все т₂ переменные нельзя исключать из модели.

При реализации первой ситуации ( Анализ и способы снижения влияния мультиколлинеарности - student2.ru )факторы окончательно исключаются из модели.

7. Проверка адекватности модели. Данный этап анализа включает:

• оценку значимости коэффициента детерминации. Данная оценка необходима для решения вопроса: оказывают ли выбранные факторы влияние на зависимую переменную? Оценку значимости Д следует проводить, так как может сложиться такая ситуация, когда величина коэффициента детерминации будет целиком обусловлена случайными колебаниями в выборке, на основании которой он вычислен. Это объясняется тем, что величина Д существенно зависит от объема выборки.

Для оценки значимости коэффициента множественной детерминации используется следующая статистика:

Анализ и способы снижения влияния мультиколлинеарности - student2.ru , (4.31)

которая имеет F-распределение с Анализ и способы снижения влияния мультиколлинеарности - student2.ru и степенями свободы. Здесь Д = R² , а т – количество учитываемых объясняющих переменных (факторов).

Значение статистики F, вычисленное по эмпирическим данным, сравнивается с табличным значением Анализ и способы снижения влияния мультиколлинеарности - student2.ru . Критическое значение определяется по таблице Приложения 2 по заданному а и степеням свободы f₁и f ₂. Если Анализ и способы снижения влияния мультиколлинеарности - student2.ru , то вычисленный коэффициент детерминации значимо отличается от 0 и, следовательно, включенные в регрессию переменные достаточно объясняют зависимую переменную, что позволяет говорить о значимости самой регрессии (модели);

• проверку качества подбора теоретического уравнения. Она проводится с использованием средней ошибки аппроксимации. Средняя ошибка аппроксимации регрессии определяется по формуле:

Анализ и способы снижения влияния мультиколлинеарности - student2.ru ; (4.32)

вычисление специальных показателей, которые применяются для характеристики воздействия отдельных факторов на результирующий показатель. Это коэффициент эластичности, который показывает, насколько процентов в среднем изменяется функция с изменением аргумента на 1% при фиксированных значениях других аргументов:

Анализ и способы снижения влияния мультиколлинеарности - student2.ru ; (4.33)

доля влияния каждого фактора x_j в отдельности на вариацию у (Елисеева И. И., Юзбашев М. М.Общая теория статистики. — М.: Финансы и статистика, 1999):

Анализ и способы снижения влияния мультиколлинеарности - student2.ru , (4.34)

где Анализ и способы снижения влияния мультиколлинеарности - student2.ru – коэффициент бетта фактора x_j.

Показатель g_j является мерой вариации результативного признака за счет изолированного влияния фактора x_j. Следует отметить, что система факторов, входящая в модель регрессии, — это не простая их сумма, так как система предполагает внутренние связи, взаимодействие составляющих ее элементов. Действие системы не равно арифметической сумме воздействий составляющих ее элементов. Поэтому необходимо определить показатель системного эффекта факторов Анализ и способы снижения влияния мультиколлинеарности - student2.ru :

Анализ и способы снижения влияния мультиколлинеарности - student2.ru .

На основе анализа специальных показателей и значений парной корреляции х с у делают вывод, какие из главных факторов оказывают наибольшее влияние на у. После этого переходят к разработке организационно-технических мероприятий, направленных на улучшение значений этих факторов, с целью повышения (снижения) результативного показателя у.

8. Экономическая интерпретация.

Результаты регрессионного анализа сравниваются с гипотезами, сформулированными на первом этапе исследования, и оценивается их правдоподобие с экономической точки зрения.

9. Прогнозирование неизвестных значений зависимой переменой.

Полученное уравнение регрессии находит практическое применение в прогностическом анализе. Прогноз получают путем подстановки в регрессию с численно оцененными параметрами значений факторов. Следует подчеркнуть, что прогнозирование результатов по регрессии лучше поддается содержательной интерпретации, чем простая экстраполяция тенденций, так как полнее учитывается природа исследуемого явления. Более подробно вопросы прогнозирования рассмотрены в работе: Бережная Е.В., Бережной В.И. Математические методы и моделирование экономических систем: учебное пособие. – М.: Финансы и статистика, 2003. – 368 с..

Часть 5
ЛИНЕЙНОЕ ПРОГРАММИРОВАНИЕ В РЕШЕНИИ ОПТИМИЗАЦИОННЫХ ЗАДАЧ

Оптимизационная задача — это экономико-математическая задача, которая состоит в нахождении оптимального (максимального или минимального) значения целевой функции, причем значения переменных должны принадлежать некоторой области допустимых значений.

В самом общем виде задача математически записывается так:

Анализ и способы снижения влияния мультиколлинеарности - student2.ru . (5.1)

где Анализ и способы снижения влияния мультиколлинеарности - student2.ru ;

W – область допустимых значений переменных х₁, х₂, ..., х_n;

f(Х) – целевая функция.

Для того чтобы решить задачу оптимизации, достаточно найти ее оптимальное решение, т. е. указать Анализ и способы снижения влияния мультиколлинеарности - student2.ru такое, что при любом , или для случая минимизации – при любом .

Оптимизационная задача является неразрешимой, если она не имеет оптимального решения. В частности, задача максимизации будет неразрешима, если целевая функция f(X) не ограничена сверху на допустимом множестве W.

Методы решения оптимизационных задач зависят как от вида целевой функции f(X), так и от строения допустимого множества W. Если целевая функция в задаче является функцией п переменных, то методы решения называют методами математического программирования.

В математическом программировании принято выделять следующие основные задачи в зависимости от вида целевой функцииf(X) и от области W:

Ø задачи линейного программирования, если f(X) и W линейны;

Ø Анализ и способы снижения влияния мультиколлинеарности - student2.ru задачи целочисленного программирования, если ставится условие целочисленности переменных x_t, х₂, ..., х_п;