Построение регрессионной модели и ее анализ. Метод всех возможных регрессий, ступенчатый и шаговый регрессионные методы
3. Применение методов регрессионного и корреляционного анализа в экономических исследованиях.
1. Задачи анализа и моделирования экономических процессов с использованием вероятностных методов
1.1. Любой экономический процесс целесообразно рассматривать как случайный, поскольку на его вход практически всегда влияют многочисленные случайные факторы. Поэтому при анализе и моделировании технико-экономических процессов необходимо наряду с методами математического программирования (линейного и нелинейного) использовать вероятностные методы: корреляционный и регрессионный анализ, методы теории случайных процессов и др.
Результаты анализа экономических явлений с помощью перечисленных методов позволяют вскрыть и исследовать закономерности развития изучаемого процесса, определить поток управляющей информации, обоснованно выбрать алгоритм управления, оценить надежность и эффективность функционирования управляемой системы и т.д.
Вероятностным методам отводится весьма важная роль в общей системе МО АСУ. В соответствии с ОРММ по созданию АСУП вероятностные методы должны использоваться при решении следующих задач:
– прогнозирование развития хозяйственных объектов,
– расчет показателей и расхода ресурсов,
– прогнозирование технико-экономических показателей,
– определение нормативных данных,
– анализ потерь от брака,
– оценка уровня качества труда коллективов и исполнителей,
– оценка уровня качества продукции,
– определение оптимального состава оборудования,
– комплектование штатов,
– определение количества и состава ремонтных бригад.
Для решения первых пяти задач можно использовать математическую статистику, корреляционный и регрессионный анализ, а для решения последних трех - теорию случайных процессов, ТМО, статистическое (имитационное) моделирование и др.
Особенно широко вероятностные методы могут применяться в АСУ, созданных на базе ЭВМ третьего поколения, поскольку в МО ЕС ЭВМ входят ППП, ориентированные на использование перечисленных методов.
В настоящей лекции рассматриваются вопросы построения регрессионных моделей для расчета и прогнозирования различных экономических показателей.
1.2. Инструментальному построению регрессионной модели предшествует содержательный анализ исследуемого экономического процесса, в ходе которого необходимо прежде всего установить, какие факторы оказывают наибольшее влияние на изучаемый входной показатель.
Если на исследуемый процесс оказывает влияние большое число различных факторов, то для отбора наиболее значимых из них проводят анализ литературных источников, мнений специалистов, результатов пассивных и активных экспериментов.
После отбора значимых факторов приступают к построению математической модели, формально описывающей исследуемый процесс. Полученная модель, в случае ее адекватности изучаемому процессу, может использоваться для прогнозирования значений параметра (выходного) или управления процессом путем целенаправленного изменения значений независимых переменных, входящих в модель.
Следует помнить, что в общем случае модель, пригодную для оптимального управления процессом по выбранному критерию можно построить, если информация, необходимая для разработки модели, получена в результате спланированного эксперимента.
Планирование эксперимента позволяет элиминировать влияние на характеристики построенной модели ковариационной структуры матрицы независимых переменных.
Если оптимальные условия протекания процесса необходимо уточнить непосредственно в ходе производства, то в этом случае применяют методы эволюционного планирования (ЭВОП). Эволюционное планирование - это процедура поиска оптимального режима работы оборудования (протекания технологического процесса) путем экспериментального варьирования факторов, влияющих на параметр оптимизации, и оценки результатов в процессе работы данного оборудования. При этом полученная информация должна вновь использоваться для воздействия на процесс с целью его улучшения. Метод ЭВОП был предложен Боксом и Уилсоном и показал себя хорошо в химической промышленности. В настоящее время известен и применяется ряд методов эволюционного планирования: метод Бокса, вращаемое квадратическое ЭВОП, случайное ЭВОП, последовательный симплексный метод эволюционного планирования.
1.3. Для выделения значимых факторов (следи большого числа взятых под подозрение) можно применять методы экспертных оценок, анализ результатов пассивных наблюдений, метод случайного баланса и алгоритм голосования, статистические методы планирования экспериментов и ряд других. Разделим их условно на две группы:
– экспертные методы, ориентированные на использование мнений специалистов;
– методы, использующие объективные данные натурных экспериментов.
Использование данных натурного (активного и пассивного) эксперимента для выделения значимых факторов.
В литературе описан целый ряд методов для решения задачи выбора подмножества значимых факторов и их упорядочения. Это метод главных компонент, факторный анализ, каноническая корреляция, метод корреляционных плеяд, метод экстремальной группировки признаков, методы таксономии и др. Суть некоторых из них (каноническая корреляция, факторный анализ) заключается в преобразовании исходного факторного пространства с целью уменьшения числа факторов, замене набора исходных факторов некоторыми их комбинациями. Такое преобразование позволяет получить новые линейно независимые переменные, причем потеря информации при такой замене несущественна. Однако полученные в результате преобразования факторы (главные компоненты) и коэффициенты при них трудно поддаются экономической (содержательной) интерпретации. Поэтому мы рассмотрим некоторые специфические статистические методы выбора значимых факторов, применяемые при идентификации объектов.
Следует подчеркнуть, что нет однозначного статистического метода для выполнения этого выбора, и критерий выбора информативной подсистемы факторов в ходе построения модели должен учитывать конкретную цель исследования и специфику используемых методов. Он основывается на оценке важности отдельных факторов для аппроксимации и управления величиной исследуемого (моделируемого) экономического показателя, учете их влияния на точность модели. Причем для одного и того же моделируемого показателя набор существенных (информативных) факторов может изменяться с изменением формы связей и других характеристик модели.
Активный эксперимент. Метод случайного баланса.
Наиболее перспективным для отбора значимых факторов при использовании активного натурного эксперимента представляется применение метода случайного баланса (МСБ). При благоприятных условиях методом случайного баланса можно выделить доминирующие эффекты среди очень большого числа взятых под подозрение. При этом для управления ходом эксперимента и обработки его результатов могут использоваться ЭВМ (метод ветвящейся стратегии). Поскольку обычно заранее неизвестно, какие факторы оказывают наиболее существенное влияние на исследуемый процесс (являются доминирующим), для их ранжирования в порядке убывания вклада, вносимого в общую дисперсию данным фактором, осуществляют постановку так называемых отсеивающих экспериментов. При постановке отсеивающих экспериментов по МСБ все факторы (линейные эффекты) разбиваются на группы и для каждой из групп строится матрица полного факторного эксперимента (ПФЭ). После чего, путем случайного смешивания групповых планов образуется матрица планирования по метолу случайного баланса - случайно сбалансированная матрица. Результаты эксперимента могут быть представлены в виде диаграмм рассеяния, которые используются для качественной оценки вклада фактора и выделения наиболее существенных факторов. Затем значимость факторов оценивается обычными методами регрессионного анализа по критерию минимума остаточной дисперсии.
Пассивный эксперимент.
Иногда по каким-либо причинам постановку на объекте активного эксперимента, например, по методу случайного баланса в данный момент осуществить невозможно, или же его проведение связано со значительными затратами времени и средств. В то же время имеется информация о поведении объекта, собранная в процессе его нормальной эксплуатации (результаты пассивного эксперимента). В этой ситуации для выделения значимых факторов, оценки степени их влияния и характера взаимодействия могут быть использованы методы регрессивного анализа. В том случае, если выделенные факторы оказались управляемыми, может быть спланирован и поставлен экстремальный эксперимент, при этом полученные результаты математической обработки данных пассивного эксперимента могут оказать решающее влияние на выбор плана эксперимента (порядка, реплик) и тем самым на время и стоимость проведения всего исследования.
Поэтому во всех случаях, когда мы располагаем информацией о поведении объекта в реальных условиях эксплуатации, ее предварительный анализ с использованием регрессионных методов для получения представления о составе значимых факторов и характере их взаимодействия, как правило, является исключительно полезным.