Построение системы показателей. Принципы отбора факторов модели
Основные требования, предъявляемые к включаемым в эконометрическую модель факторам:
• каждый из факторов должен быть обоснован теоретически;
• в перечень целесообразно включать только важнейшие факторы, оказывающие существенное воздействие на изучаемые показатели, при этом рекомендуется, чтобы количество включаемых в модель факторов не превышало одной трети от числа наблюдений в выборке (длины временного ряда);
• факторы не должны быть линейно зависимы, поскольку эта зависимость означает, что они характеризуют аналогичные свойства изучаемого явления. Например, заработная плата работников зависит, наряду с другими факторами, от роста производительности труда и от объема выпускаемой продукции. Однако эти факторы могут быть тесно взаимосвязаны, коррелированны и, следовательно, в модель целесообразно включать только один из этих факторов. Включение в модель линейно взаимозависимых факторов приводит к возникновению явления мультиколлинеарности , которое отрицательно сказывается на качестве модели;
• влияющие на экономический процесс факторы могут быть количественные и качественные. В модель рекомендуется включать только такие факторы, которые могут быть численно измерены;
• в одну модель нельзя включать совокупный фактор и образующие его частные факторы. Одновременное включение таких факторов приводит к неоправданно увеличенному их влиянию на зависимый показатель, к искажению реальной действительности.
При отборе влияющих факторов используются статистические методы отбора. Так, существенного сокращения числа влияющих факторов можно достичь с помощью пошаговых процедур отбора переменных. Среди пошаговых процедур отбора факторов наиболее часто используются процедуры пошагового включения и исключения факторов. Обе эти процедуры хорошо формализованы и потому успешно реализованы в различных машинных программах статистического анализа.
Метод исключения предполагает построение уравнения, включающего всю совокупность переменных, с последующим последовательным (пошаговым) сокращением числа переменных в модели до тех пор, пока не выполнится некоторое наперед заданное условие. Суть метода включения — в последовательном включении переменных в модель до тех пор, пока регрессионная модель не будет отвечать заранее установленному критерию качества. Последовательность включения определяется с помощью частных коэффициентов корреляции: переменные, имеющие относительно исследуемого показателя большее значение частного коэффициента корреляции, первыми включаются в регрессионное уравнение.
Выше отмечено, что одной из предпосылок применения методов регрессионного анализа для построения эконометрических моделей является отсутствие среди независимых переменных (факторов) линейно связанных. Если данная предпосылка не выполняется, то возникает, как уже сказано выше, явление мультиколлинеарности, что приводит к искажению смысла коэффициентов регрессии и затруднению выявления наиболее существенно влияющих факторов.
Важной составляющей процесса построения эконометрической модели является отбор факторов, существенно влияющих на изучаемый показатель и подлежащих включению в разрабатываемую модель. Оптимальный набор факторов определяется на основе качественного и количественного анализа. Прежде всего, на этапе постановки задачи и содержательного экономического анализа экономической модели отбираются факторы, влияние которых должно быть учтено при построении модели. В ряде случаев набор факторов определяется однозначно или с большой степенью уверенности. Например, спрос на товар определяется в основном ценой и доходом.
В более сложных случаях на следующем этапе с помощью формальных статистических методов проверяется целесообразность включения в модель каждого фактора.
Прежде всего, факторы проверяются на наличие тесной линейной корреляционной зависимости между ними. Существование тесной корреляционной зависимости между факторами приводит к получению ненадежных оценок параметров модели. Для преодоления сильной межфакторной корреляции применяется ряд подходов:
– исключение из модели одного или нескольких факторов. Из двух коррелирующих факторов исключаются тот, который более коррелирует с остальными факторами;
– преобразование факторов, при котором уменьшается корреляция между ними. Например, переходят от исходных переменных к их линейным комбинациям, не коррелированным друг с другом (метод главных компонент).
При определении «оптимального» набора факторов могут использоваться два метода:
метод включения;
метод исключения.
Согласно методу включения, сначала строится уравнение регрессии с одним наиболее влияющим фактором (фактор, для которого значение парного коэффициента корреляции с результативным признаком i yx r больше по модулю). Затем в него последовательно вводятся следующие факторы и определяется пара наиболее влияющих факторов. На следующем к первым двум добавляется еще по одному фактору и определяется наилучшая тройка факторов и т. д.
На каждом шаге строится модель регрессии и проверяется значимость факторов. В модель включают только значимые факторы. Для проверки значимости фактора могут использоваться либо критерий Стьюдента, либо частный критерий Фишера. Процесс заканчивается, когда не остается факторов, которые следует включить в модель.
Согласно методу исключения сначала строится уравнение регрессии с полным набором факторов, из числа которых затем последовательно исключаются незначимые (наименее значимые) факторы. На каждом шаге исключается только один фактор, так как после исключения какого-либо фактора другой фактор, бывший до этого незначимым, может стать значимым. Процесс заканчивается, когда не остается факторов, которые следует исключить из модели. Методы включения и исключения не гарантируют определение оптимального набора факторов, но в большинстве случаев дают результаты либо оптимальные, либо близкие к ним.
Не рекомендуется включать в модель очень большое число факторов, так как это может затруднить выявление качественных закономерностей и возрастает опасность включения в модель несущественных случайных факторов.
Кроме того, для получения достаточно надежных оценок параметров желательно, чтобы количество наблюдений превышало количество определяемых параметров не менее чем в 6-7 раз.