Суть регрессионного анализа

Парная линейная регрессия

Поведение и значение любого экономического показателя зависят практически от бесконечного количества факторов, и все их учесть нереально. Однако обычно лишь ограниченное количество факторов действительно суще­ственно воздействует на исследуемый экономический показа­тель. Доля влияния остальных факторов столь незначительна, что их игнорирование не может привести к существенным от­клонениям в поведении исследуемого объекта. В естественных науках большей частью имеют дело со стро­гими (функциональными) зависимостями, при которых каждо­му значению одной переменной соответствует единственное значение другой. Однако в подавляющем большинстве случаев между экономическими переменными таких зависимостей нет. Поэтому в экономике говорят не о функциональных, а о корреляционных либо статистических зависимостях.

Если переменные обозначить Х и Y, то зависимость вида:

Суть регрессионного анализа - student2.ru (1.1)

называется функцией регрессии Y на X. При этом X называется независимой (объясняющей) переменной (прегрессором), Y – зависимой (объясняемой) переменной. При рассмотрении двух случайных величин говорят о парной регрессии.

Зависимость нескольких переменных, выражаемую функцией

Суть регрессионного анализа - student2.ru , (1.2)

называют множественной регрессией.

Под регрессией понимается функциональная зависимость между объясняющими переменными и условным математическим ожиданием (средним значением) зависимой переменной, которая строится с целью предсказания (прогнозирования) этого среднего значения при фиксированных значениях первых.

Для отражения того факта, что реальные значения зависи­мой переменной не всегда совпадают с ее условными математи­ческими ожиданиями и могут быть различными при одном и том же значении объясняющей переменной (наборе объясняю­щих переменных), фактическая зависимость должна быть до­полнена некоторым слагаемым Суть регрессионного анализа - student2.ru , которое, по существу, являет­ся случайной величиной и указывает на стохастическую суть зависимости. Из это­го следует, что связи между зависимой и объясняющей (ими) переменными выражаются соотношениями

Суть регрессионного анализа - student2.ru (1.3)

Суть регрессионного анализа - student2.ru , (1.4)

называемыми регрессионными моделями (уравнениями).

Сре­ди причин обязательного присутствия в регрессионных моделях случайного фактора (отклонения) можно выделить следующие:

1. Невключение в модель всех объясняющих переменных. Любая регрессионная (в частности, эконометрическая) модель является упрощением реальной ситуации. Последняя всегда представляет собой сложнейшее переплетение различных фак­торов, многие из которых в модели не учитываются, что порож­дает отклонение реальных значений зависимой переменной от ее модельных значений. Например, спрос (Q) на товар опреде­ляется его ценой (Р), ценой (Ps) на товары-заменители, ценой (Pс) на дополняющие товары, доходом (Г) потребителей, их ко­личеством (N), вкусами (Т), ожиданиями (W) и т. д. Безуслов­но, перечислить все объясняющие переменные здесь практиче­ски невозможно. Например, мы не учли такие факторы, как традиции, национальные или религиозные особенности, геогра­фическое положение региона, погода и многие другие, влияние которых приведет к некоторым отклонениям реальных наблю­дений от модельных, которые можно выразить через случай­ный член е: Q = f(P, Ps, Pc, I, N, Т, W, Суть регрессионного анализа - student2.ru ). Проблема еще и в том, что никогда заранее не известно, какие факторы при создав­шихся условиях действительно являются определяющими, а какими можно пренебречь. Например, в ряде случаев учесть непосредственно какой-то фактор нельзя в силу невозможности получения по нему статистических данных.

2. Неправильный выбор функциональной формы модели. Из-за слабой изученности исследуемого процесса либо из-за его переменчивости может быть неверно подобрана функция, его моделирующая. Это, безусловно, скажется на отклонении моде­ли от реальности, что отразится на величине случайного члена. Кроме того, неверным может быть подбор объясняющих переменных.

3. Агрегирование переменных. Во многих моделях рассмат­риваются зависимости между факторами, которые сами пред­ставляют сложную комбинацию других, более простых пере­менных. Например, при рассмотрении в качестве зависимой переменной совокупного спроса проводится анализ зависимо­сти, в которой объясняемая переменная является сложной ком­позицией индивидуальных спросов, оказывающих на нее опре­деленное влияние помимо факторов, учитываемых в модели. Это может оказаться причиной отклонения реальных значений от модельных.

4. Ошибки измерений. Какой бы качественной ни была мо­дель, ошибки измерений переменных отразятся на несоответст­вии модельных значений эмпирическим данным, что также от­разится на величине случайного члена.

5. Ограниченность статистических данных. Зачастую строятся модели, выражаемые непрерывными функциями. Но для этого используется набор данных, имеющих дискретную структуру. Это несоответствие находит свое выражение в слу­чайном отклонении.

6. Непредсказуемость человеческого фактора. Эта причи­на может «испортить» самую качественную модель. Действи­тельно, при правильном выборе формы модели, скрупулезном подборе объясняющих переменных все равно невозможно спрогнозировать поведение каждого индивидуума.

Решение задачи построения качественного уравнения рег­рессии, соответствующего эмпирическим данным и целям ис­следования, является достаточно сложным и многоступенча­тым процессом. Его можно разбить на три этапа:

1) выбор формулы уравнения регрессии;

2) определение параметров выбранного уравнения;

3) анализ качества уравнения и поверка адекватности урав­нения эмпирическим данным, совершенствование уравнения.

Выбор формулы связи переменных называется специфика­цией уравнения регрессии. В случае парной регрессии выбор формулы обычно осуществляется по графическому изображе­нию реальных статистических данных в виде точек в декарто­вой системе координат, которое называется корреляционным полем (диаграммой рассеивания) (рис. 1.1).

 
  Суть регрессионного анализа - student2.ru

Рис. 1.1

Если на первых двух графиках относительно четко определяется форма связи (для первого – линейная, для второго – квадратичная), то для третьего явная взаимосвязь между переменными отсутствует. В случае множественной регрессии определение подходящего вида регрессии является наиболее сложной задачей.

Наши рекомендации