Тема 3. Парная регрессия и корреляция[2].

Тема 1. Введение. Эконометрика и эконометрическое моделирование.

Вопросы

  • Понятие эконометрики.
  • Типы экономических данных, используемых в эконометрических исследованиях: пространственные данные и временные ряды
  • Специфика экономических данных
  • Классификация эконометрических моделей
  • Основные этапы построения эконометрических моделей

Термин «эконометрика» появляется в литературе в начале двадцатого века и означает «эконометрические измерения». Приведем некоторые используемые в литературе определения эконометрики.

Эконометрия(эконометрика), наука, изучающая конкретные количественные взаимосвязи экономических объектов и процессов с помощью математических и статистических методов и моделей[1].

Наиболее часто используют определение эконометрики, которое предложил известный российский ученый С.А. Айвазян.

Эконометрика – это самостоятельная научная дисциплина, объединяющая совокупность теоретических результатов, приемов, методов и моделей, предназначенная для того, чтобы на базе экономической теории, экономической статистики, математико-статистического инструментария придавать конкретное ко­личественное выражение общим закономерностям, обусловленным экономической теорией взаимосвязей экономических явлений и процессов [7].

В мировой науке эконометрика занимает достойное место. Свидетельством этого является присуждение за наиболее выдающиеся разработки в этой облас­ти Нобелевских премий по экономике Рагнару Фришу и Яну Тильбергену (1969), Лоуренсу Клейну (1980), Трюгве Хаавельмо (1989), Роберту Лукасу (1995), Джеймсу Хекману и Даниелю Мак-Фаддену (2000) [8].

Типы экономических данных, используемых в эконометрических исследованиях.

Пространственные данные – характеризуют ситуацию по конкретной переменной (или набору переменных), относящейся к пространственно разделенным сходным объектам в один и тот же момент времени. Таковы, например, данные по курсам покупки или продажи наличной валюты в конкретный день по разным обменным пунктам г. Москвы. Другим примером является, скажем, набор сведений (объем производства, количество работников, доход и др.) по разным фирмам в один и тот же момент времени или период.

Временные рядыотражают изменения (динамику) какой-либо переменой на промежутке времени. В качестве примеров временных рядов можно привести ежеквартальные данные по инфляции, данные по средней заработной плате, национальному доходу и денежной эмиссии за несколько и др.

●Специфика экономических данных.

В эконометрике решаются задачи описания данных, оценивания, проверки гипотез, восстановления зависимостей, классификации объектов и признаков, прогнозирования, принятия статистических решений и др.

При выборе методов анализа конкретных экономических данных следует учитывать, что экономические данные обладают рядом особенностей.

Многие экономические показатели неотрицательны. Значит, их надо описывать неотрицательными случайными величинами.

В экономике доля нечисловых данных существенно выше, чем в технике и, соответственно больше применений для ста­тистики объектов нечисловой природы.

Количество изучаемых объектов в экономическом исследовании часто ограничено в принципе, поэтому обоснование вероятностных моделей в ряде случаев затруднено.

Экономические процессы развиваются во времени, поэтому большое место в эконометрике занимают вопросы анализа и про­гнозирования временных рядов, в том числе многомерных. При этом следует отметить, что временные ряды качественно отличаются от простых статистических выборок. Эти особенности состоят в следующем:

× последовательные по времени уровни временных рядов являются взаимозависимыми, особенно это относится к близко расположенным наблюдениям;

× в зависимости от момента наблюдения уровни во временных рядах обладают разной информативностью: информационная ценность наблюдений убывает по мере их удаления от текущего момента времени;

× с увеличением количества уровней временного ряда точность статистических характеристик не будет увеличиваться пропорционально числу наблюдений, а при появлении новых закономерностей развития она может даже уменьшаться. [8].

Переменные, участвующие в эконометрической модели любого типа, разделяются на следующие типы.

Результирующая (зависимая, эндогенная) переменная Y

Она характеризует результат или эффективность функциониро­вания экономической системы. Значения ее формируются в процессе и внутри функционирования этой системы под воздействием ряда других переменных и факторов, часть из которых поддается регистрации, управ­лению и планированию. В регрессион­ном анализе результирующая переменная играет роль функции, значение которой определяется значениями объясняющих переменных, выполняю­щих роль аргументов. По своей природе результирующая переменная все­гда случайна (стохастична).

Объясняющие (экзогенные, независимые) переменные X

Это — переменные, которые поддаются регистрации и описывают условия функционирования реальной экономической системы. Они в зна­чительной мере определяют значения результирующих переменных. Обычно часть из них поддается регулированию и управлению. Значение этих переменных могут задаваться вне анализируемой системы. Поэтому их называют экзогенными. Еще их называют факторными признаками. В регрессионном анализе это аргументы ре­зультирующей функции Y. По своей природе они могут быть как случай­ными, так и неслучайными.

Любая эконометрическая модель предназначена для объяснения значений текущих эндогенных переменных (од­ной или нескольких) в зависимости от значений заранее опре­деленных переменных.

Переменные, выступающие в системе в роли факторов-аргументов, или объясняющих переменных называют предопределенными. Множество предопределен­ных переменных формируется из всех экзогенных переменных и так называемых лаговых эндогенныхпеременных, т. е. таких эндогенных переменных, значения которых входят в уравнения анализиру­емой эконометрической системы измеренными в прошлые моменты времени, а, следовательно, являются уже извест­ными, заданными.

Типы эконометрических моделей

Можно выделить три основных класса моделей, которые применяются для анализа и прогнозирования экономических систем

· модели временных рядов;

· регрессионные модели с одним уравнением;

· системы одновременных уравнений.

Модели временных рядов

Модели временных рядов представляют собой модели зависимости результативного признака от времени.

К ним относятся

· модели кривых роста (трендовые модели),

· адаптивные моде­ли,

· модели авторегрессии и скользящего среднего.

С помощью таких моделей можно решать задачи прогнозирования объема продаж, спроса на продукцию, краткосрочного прогноза процентных ставок и др.

Регрессионные модели с одним уравнением

В регрессионных моделях зависимая (объясняемая) переменная Y может быть представлена в виде функции f (X1, X2, X3, … Xk), где Тема 3. Парная регрессия и корреляция[2]. - student2.ru - независимые (объясняющие) переменные, или факторы; k – количество факторов. В качестве зависимой переменной может выступать практически любой показатель, харак­теризующий, например, деятельность предприятия или курс ценной бумаги. В зависимости от вида функции f ( Тема 3. Парная регрессия и корреляция[2]. - student2.ru ) модели делятся на линейные и нелинейные. В зависимости от количества включенных в модель факторов Х модели делятся на однофакторные (парная модель регрессии) и многофакторные (модель множественной регрессии).

Примеры задач,решаемых с помощьюрегрессионных моделей.

  • Исследование зависимости заработной платы (Y) от возраста (X1), уровня образования (X2), пола (X3), стажа работы (X4) ( Тема 3. Парная регрессия и корреляция[2]. - student2.ru ).
  • Прогноз и планирование выпускаемой продукции по факторам производства (производственная функция Кобба – Дугласа Тема 3. Парная регрессия и корреляция[2]. - student2.ru означает, что объем выпуска продукции (Y), является функцией количества капитала ( K ) и количества (L) труда).
  • Прогноз объемов потребления продукции или услуг определенного вида (кривая Энгеля Тема 3. Парная регрессия и корреляция[2]. - student2.ru , где Y -удельная величина спроса, Х - среднедушевой доход).

Системы эконометрических уравнений

Сложные соци­ально-экономические явления иногда невозможно адекватно описать с помощью только одного соотношения (уравнения). Модели с одним уравнением не отражают взаимосвязей между объясняющими переменными или их связей с другими переменными. Кроме того, некоторые перемен­ные могут оказывать взаимные воздействия и трудно од­нозначно определить, какая из них является зависимой, а какая независимой переменной. Поэтому при построении эконометрической модели прибегают к системам уравне­ний.

Для оценивания систем одновременных уравнений используются специальные методы.

Эконометрические методы используются в экономических и технико-экономических исследованиях, работах по управлению (менеджменту).

Каждой области экономических исследований, связанной с анализом эмпирических данных, как правило, соответствуют свои эконометрические модели.

Тема 3. Парная регрессия и корреляция[2].

Вопросы

  • статистическая зависимость (независимость) случайных переменных. Ковариация.
  • Анализ линейной статистической связи экономических данных, корреляция; вычисление коэффициентов корреляции.
  • линейная модель парной регрессии.
  • Оценка параметров модели с помощью метода наименьших квадратов (МНК).
  • Оценка существенности параметров линейной регрессии.
  • Интервалы прогноза по линейному уравнению регрессии.

Материал данной темы частично знаком студентам и подробно изложен в учебном пособии [1] стр. 170 -176 и 190 - 207.

Рассматривая зависимости между признаками, необходимо выделить, прежде всего, две категории зависимости: 1) функцио­нальные и 2) корреляционные.

Функциональные связи характеризуются полным соответ­ствием между изменением факторного признака и изменением ре­зультативной величины, и каждому значению признака-фактора соответствуют вполне определенные значения результативного признака. Функциональная зависимость может связывать результативный признак с одним или несколькими факторными признаками. Так, величина начисленной заработной платы при повременной оплате труда зависит от количества отработанных часов.

В корреляционных связях между изменением факторного и результативного признака нет полного соответствия, воздействие отдельных факторов проявляется лишь в среднем при массовом на­блюдении фактических данных. Одновременное воздействие на изучаемый признак большо­го количества самых разнообразных факторов приводит к тому, что одному и тому же значению признака-фактора соответствует целое распределение значений результативного признака, по­скольку в каждом конкретном случае прочие факторные призна­ки могут изменять силу и направленность своего воздействия.

Основная задача корреляционного анализа заключается в выявлении взаимосвязи между случайными переменными путем точечной и интервальной оценки парных (частных) коэффициентов корреляции, вычисления и проверки значимости множественных коэффициентов корреляции и детерминации. Кроме того, с помощью корреляционного анализа решаются следующие задачи: отбор факторов, оказывающих наиболее существенное влияние на результативный признак, на основании измерения степени связи между ними; обнаружение ранее неизвестных причинных связей. Корреляция непосредственно не выявляет причинных связей между параметрами, но устанавливает численное значение этих связей и достоверность суждений об их наличии.

При проведении корреляционного анализа вся совокупность данных рассматривается как множество переменных (факторов), каждая из которых содержит n –наблюдений.

При изучении взаимосвязи между двумя факторами их, как правило, обозначают X= Тема 3. Парная регрессия и корреляция[2]. - student2.ru и Y= Тема 3. Парная регрессия и корреляция[2]. - student2.ru

.

ковариация - это статистическая мера взаимодействия двух переменных.

Например, положительное значение ковариации доходности двух ценных бумаг показывает, что доходности этих ценных бумаг имеют тенденцию изменяться в одну сторону.

Ковариация между двумя переменными Тема 3. Парная регрессия и корреляция[2]. - student2.ru рассчитывается следующим образом:

Тема 3. Парная регрессия и корреляция[2]. - student2.ru ,

где Тема 3. Парная регрессия и корреляция[2]. - student2.ru - фактические значения случайных переменных x и y,

Тема 3. Парная регрессия и корреляция[2]. - student2.ru . Тема 3. Парная регрессия и корреляция[2]. - student2.ru

Ковариация зависит от единиц, в которых измеряются переменные Тема 3. Парная регрессия и корреляция[2]. - student2.ru .

Поэтому для измерения силы связи между двумя переменными используется другая статистическая характеристика, называемая коэффициентом корреляции.

Вычисление коэффициента парной корреляции.

Коэффициент парной корреляции

Для двух переменных Тема 3. Парная регрессия и корреляция[2]. - student2.ru коэффициент парной корреляции определяется следующим образом:

Тема 3. Парная регрессия и корреляция[2]. - student2.ru = Тема 3. Парная регрессия и корреляция[2]. - student2.ru , (1)

где Тема 3. Парная регрессия и корреляция[2]. - student2.ru Тема 3. Парная регрессия и корреляция[2]. - student2.ru - оценки дисперсий величин Тема 3. Парная регрессия и корреляция[2]. - student2.ru .

Дисперсия (оценка дисперсии)

Тема 3. Парная регрессия и корреляция[2]. - student2.ru

характеризуют степень разброса значений Тема 3. Парная регрессия и корреляция[2]. - student2.ru ( Тема 3. Парная регрессия и корреляция[2]. - student2.ru ) вокруг своего среднего Тема 3. Парная регрессия и корреляция[2]. - student2.ru ( Тема 3. Парная регрессия и корреляция[2]. - student2.ru , соответственно), или вариабельность (изменчивость) этих переменных на множестве наблюдений.

В общем случае для получения несмещенной оценки дисперсии сумму квадратов следует делить на число степеней свободы оценки (n−p), где n - объем выборки, p - число наложенных на выборку связей. В данном случае p = 1, т.к. выборка уже использовалась один раз для определения среднего X, поэтому число наложенных связей равно единице, а число степеней свободы оценки (т.е. число независимых элементов выборки) равно (n −1).

Более естественно измерять степень разброса значений переменных в тех же единицах, в которых измеряется и сама переменная. Эту задачу решает показатель, называемый среднеквадратическим отклонением или стандартным отклонением, или стандартной ошибкой переменной Х (переменной Y), определяемый соотношением:

Тема 3. Парная регрессия и корреляция[2]. - student2.ru

Слагаемые в числителе формулы (1) выражают взаимодействие двух переменных и определяют знак (положительной или отрицательной) корреляции. Если, например, между переменными существует сильная положительная взаимосвязь (увеличение одной переменной при увеличении второй), каждое слагаемое будет положительным числом. Аналогично, если между переменными существует сильная отрицательная взаимосвязь, все слагаемые в числителе будут отрицательными числами, что в результате дает отрицательное значение корреляции.

Знаменатель выражения для коэффициента корреляции просто нормирует числитель таким образом, что коэффициент корреляции оказывается легко интерпретируемым числом, не имеющим размерности, в диапазоне от -1 до 1.

Числитель выражения для коэффициента корреляции, который трудно интерпретировать из-за необычных единиц измерения, называется ковариацией Х и Y. Несмотря на то, что иногда он используется как самостоятельная характеристика (например, в теории финансов для описания совместного изменения курсов акций на двух биржах), удобнее пользоваться коэффициентом корреляции. Корреляция и ковариация представляют, по сути, одну и ту же информацию, однако корреляция представляет эту информацию в более удобной форме.

Следует отметить, что величина коэффициента корреляции не является доказательством наличия причинно-следственной связи между исследуемыми признаками, а является оценкой степени взаимной согласованности в измене­ниях признаков. Установлению причинно-следственной зависи­мости предшествует анализ качественной природы явлений. Но есть и еще одно обстоятельство, объясняющее формулировку вы­водов о возможном наличии связи по величине коэффициента корреляции.

Связано это с тем, что оценка степени тесноты связи с по­мощью коэффициента корреляции производится, как правило, на основе более или менее ограниченной информации об изучаемом явлении. Возникает вопрос, насколько правомерно наше заклю­чение по выборочным данным в отношении действительного на­личия корреляционной связи в той генеральной совокупности, из которой была произведена выборка?

Принципиально возможны случаи, когда отклонение от нуля полученной величины выборочного коэффициента корреляции оказывается целиком, обусловленным неизбежными случайными колебаниями тех выборочных данных, на основании которых он вычислен. Особенно осторожно следует подходить к истолкова­нию полученных коэффициентов корреляции при незначитель­ных объемах выборочной совокупности.

В этой связи и возникает необходимость оценки существен­ности линейного коэффициента корреляции, дающая возмож­ность распространить выводы по результатам выборки на гене­ральную совокупность. В зависимости от объема выборочной со­вокупности предлагаются различные методы оценки существен­ности линейного коэффициента корреляции.

Оценка значимости коэффициента корреляции при малых объемах выборки выполняется с использованием t - критерия Стьюдента. При этом фактическое (наблюдаемое) значение этого критерия определяется по формуле:

Тема 3. Парная регрессия и корреляция[2]. - student2.ru

Вычисленное по этой формуле значение tнабл сравнивается с критическим значением t-критерия, которое берется из таблицы значений t Стьюдента с учетом заданного уровня значимости и числа степеней свободы (n-2).

Если tнабл > tкр, то полученное значение коэффициента корре­ляции признается значимым (то есть нулевая гипотеза, утвер­ждающая равенство нулю генерального коэффициента корреляции, отвергается). И таким образом делается вывод о том, что между исследуемыми перемен­ными есть тесная статистическая взаимосвязь.

Удобным графическим средством анализа парных данных является диаграмма рассеяния, которая представляет каждое наблюдение в пространстве двух измерений, соответствующих двум факторам.

Диаграмму рассеяния, на которой изображается совокупность значений двух признаков, называют еще корреляционным полем. Каждая точка этой диаграммы имеет координаты Xi и Yi. По мере того, как возрастает сила линейной связи, точки на графике будут лежать более близко к прямой линии, а величина r будет ближе к 1.

Парная регрессия

Регрессионный анализ[3] занимает ведущее место в математике статистических методах эконометрики. До регрессионного анализа следует проводить корреляционный анализ, в процессе которого оценивается степень тесноты статистической связи между исследуемыми переменны­ми. От степени тесноты связи зависит прогностическая сила регрессион­ной модели.

Регрессионный анализ предназначен для исследования зависимости исследуемой переменной от различных факторов и отображения их взаимосвязи в форме регрессионной модели.

В регрессионных моделях зависимая (объясняемая) переменная Y может быть представлена в виде функции f ( Тема 3. Парная регрессия и корреляция[2]. - student2.ru ), где Тема 3. Парная регрессия и корреляция[2]. - student2.ru - независимые (объясняющие) переменные, или факторы.

Связь между переменной Y иk независимыми факторами Х можно охарактеризовать функцией регрессии Y= f ( Тема 3. Парная регрессия и корреляция[2]. - student2.ru ), которая показывает, каково будет в среднем значение переменной yi, если переменные Xi примут конкретные значения.

Данное обстоятельство позволяет использовать модель регрессии не только для анализа, но и для прогнозирования экономических явлений.

Сформулируем регрессионную задачу для случая од­ного факторного признака.

Пусть имеется набор значений двух переменных: Y= Тема 3. Парная регрессия и корреляция[2]. - student2.ru - объясняемая переменная и X= Тема 3. Парная регрессия и корреляция[2]. - student2.ru - объясняющая переменная, каждая из которых содержит n наблюдений.

Пусть между переменными X= Тема 3. Парная регрессия и корреляция[2]. - student2.ru и Y= Тема 3. Парная регрессия и корреляция[2]. - student2.ru теоретически существует некоторая ли­нейная зависимость

Тема 3. Парная регрессия и корреляция[2]. - student2.ru .

Данное уравнение будем называть «истинным» уравне­нием регрессии.

Однако в действительности между X и Y на­блюдается не столь жесткая связь. Отдельные наблюдения Тема 3. Парная регрессия и корреляция[2]. - student2.ru будут отклоняться от линейной зависимости в силу воздействия различ­ных причин. Обычно зависимая переменная находится под влия­нием целого ряда факторов, в том числе и не известных исследо­вателю, а также случайных причин (возмущения и помехи); су­щественным источником отклонений в ряде случаев являются ошибки измерения. Отклонения от предполагаемой формы связи, естественно, могут возникнуть и в силу неправильного выбора вида самого уравнения, описывающего эту зависимость. Учитывая возможные отклонения, линейное уравнение связи двух переменных (парную регрессию) представим в виде

Тема 3. Парная регрессия и корреляция[2]. - student2.ru , (2)

где Тема 3. Парная регрессия и корреляция[2]. - student2.ru - постоянная величина (или свободный член уравнения), Тема 3. Парная регрессия и корреляция[2]. - student2.ru - коэффициент регрессии, определяющий наклон линии, вдоль которой рассеяны данные наблюдений. Это показатель, характеризующий изменение переменной Тема 3. Парная регрессия и корреляция[2]. - student2.ru , при изменении значения Тема 3. Парная регрессия и корреляция[2]. - student2.ru на единицу. Если Тема 3. Парная регрессия и корреляция[2]. - student2.ru - переменные Тема 3. Парная регрессия и корреляция[2]. - student2.ru и Тема 3. Парная регрессия и корреляция[2]. - student2.ru положительно коррелированные, если Тема 3. Парная регрессия и корреляция[2]. - student2.ru < 0 – отрицательно коррелированны; Тема 3. Парная регрессия и корреляция[2]. - student2.ru - случайная переменная, или случайная составляющая, или остаток, или возмущение. Она отражает тот факт, что изменение Тема 3. Парная регрессия и корреляция[2]. - student2.ru будет неточно описываться изменением Х – присутствуют другие факторы, неучтенные в данной модели.

Таким обра­зом, в уравнении (2) значение каждого наблюдения Тема 3. Парная регрессия и корреляция[2]. - student2.ru представлено как сумма двух частей — систематической Тема 3. Парная регрессия и корреляция[2]. - student2.ru и случайной Тема 3. Парная регрессия и корреляция[2]. - student2.ru . В свою оче­редь систематическую часть можно представить в виде уравнения

Тема 3. Парная регрессия и корреляция[2]. - student2.ru

Можно сказать, что общим моментом для любой эконометрической модели явля­ется разбиение зависимой переменной на две части — объясненную и случайную.

Тема 3. Парная регрессия и корреляция[2]. - student2.ru .

Наши рекомендации