Линейная регрессия и корреляция: смысл и оценка параметров

ПАРНАЯ РЕГРЕССИЯ И КОРРЕЛЯЦИЯ В ЭКОНОМЕТРИЧЕСКИХ ИССЛЕДОВАНИЯХ

СПЕЦИФИКАЦИЯ МОДЕЛИ

Как уже отмечалось, в эконометрике широко используются методы статистики. Ставя цель дать количественное описание взаимосвязей между экономическими переменными, эконометрика прежде всего связана с методами регрессии и корреляции.

В зависимости от количества факторов, включенных в уравнение регрессии, принято различать простую (парную) и множественную регрессии.

Простая регрессия представляет собой регрессию между двумя переменными – линейная регрессия и корреляция: смысл и оценка параметров - student2.ru илинейная регрессия и корреляция: смысл и оценка параметров - student2.ru, т. е. модель вида:

линейная регрессия и корреляция: смысл и оценка параметров - student2.ru ,

где линейная регрессия и корреляция: смысл и оценка параметров - student2.ru – зависимая переменная (результативный признак);

линейная регрессия и корреляция: смысл и оценка параметров - student2.ru – независимая, или объясняющая, переменная (признак-фактор).

Множественная регрессия соответственно представляет собой регрессию результативного признака с двумя и большим числом факторов, т. е. модель вида:

.

Методам простой или парной регрессии и корреляции, возможностям их применения в эконометрике посвящена данная глава.

Любое эконометрическое исследование начинается со спецификации модели, то есть формулировки вида модели, исходя из соответствующей теории связи между переменными. Иными словами, исследование начинается с теории, устанавливающей связь между явлениями.

Прежде всего из всего круга факторов, влияющих на результативный признак, необходимо выделить наиболее существенно влияющие факторы. Парная регрессия достаточна, если имеется доминирующий фактор, который и используется в качестве объясняющей переменной. Предположим, что выдвигается гипотеза о том, что величина спроса линейная регрессия и корреляция: смысл и оценка параметров - student2.ru на товар А находится в обратной зависимости от цены линейная регрессия и корреляция: смысл и оценка параметров - student2.ru , т. е. линейная регрессия и корреляция: смысл и оценка параметров - student2.ru . В этом случае необходимо знать, какие остальные факторы предполагаются неизменными, возможно, в дальнейшем их придется учесть в модели и от простой регрессии перейти к множественной.

Уравнение простой регрессии характеризует связь между двумя переменными, которая проявляется как некоторая закономерность лишь в среднем в целом по совокупности наблюдений. Так, если зависимость спроса линейная регрессия и корреляция: смысл и оценка параметров - student2.ru от цены линейная регрессия и корреляция: смысл и оценка параметров - student2.ru характеризуется, например, уравнением линейная регрессия и корреляция: смысл и оценка параметров - student2.ru , то это означает, что с ростом цены на 1 д.е. спрос в среднем уменьшается на 2 д.е. В уравнении регрессии корреляционная по сути связь признаков представляется в виде функциональной связи, выраженной соответствующей математической функцией. Практически в каждом отдельном случае величина линейная регрессия и корреляция: смысл и оценка параметров - student2.ru складывается из двух слагаемых:

линейная регрессия и корреляция: смысл и оценка параметров - student2.ru ,

где линейная регрессия и корреляция: смысл и оценка параметров - student2.ru – фактическое значение результативного признака;

линейная регрессия и корреляция: смысл и оценка параметров - student2.ru – теоретическое значение результативного признака, найденное исходя из соответствующей математической функции связи линейная регрессия и корреляция: смысл и оценка параметров - student2.ru и линейная регрессия и корреляция: смысл и оценка параметров - student2.ru , т. е. из уравнения регрессии;

линейная регрессия и корреляция: смысл и оценка параметров - student2.ru – случайная величина, характеризующая отклонения реального значения результативного признака от теоретического, найденного по уравнению регрессии.

Случайная величина линейная регрессия и корреляция: смысл и оценка параметров - student2.ru называется также возмущением. Она включает влияние не учтенных в модели факторов, случайных ошибок и особенностей измерения. Ее присутствие в модели порождено тремя источниками: спецификацией модели, выборочным характером исходных данных, особенностями измерения переменных.

Приведенное ранее уравнение зависимости спроса линейная регрессия и корреляция: смысл и оценка параметров - student2.ru от цены точнее следует записывать как

линейная регрессия и корреляция: смысл и оценка параметров - student2.ru ,

ибо всегда есть место для действия случайности. Обратная зависимость спроса от цены не обязательно характеризуется линейной функцией, возможны и другие соотношения.

Поэтому от правильно выбранной спецификации модели зависит величина случайных ошибок: они тем меньше, чем в большей мере теоретические значения результативного признака линейная регрессия и корреляция: смысл и оценка параметров - student2.ru подходят к фактическим данным линейная регрессия и корреляция: смысл и оценка параметров - student2.ru .

К ошибкам спецификации будут относиться не только неправильный выбор той или иной математической функции для ух, но и недоучет в уравнении регрессии какого-либо существенного фактора, т. е. использование парной регрессии вместо множественной. Так, спрос на конкретный товар может определяться не только ценой, но и доходом на душу населения.

Наряду с ошибками спецификации могут иметь место ошибки выборки, поскольку исследователь чаще всего имеет дело с выборочными данными при установлении закономерной связи между признаками. Ошибки выборки имеют место и в силу неоднородности данных в исходной статистической совокупности, что, как правило, бывает при изучении экономических процессов. Если совокупность неоднородна, то уравнение регрессии не имеет практического смысла. Для получения хорошего результата обычно исключают из совокупности единицы с аномальными значениями исследуемых признаков. И в этом случае результаты регрессии представляют собой выборочные характеристики.

Использование временной информации также представляет собой выборку из всего множества хронологических дат. Изменив временной интервал, можно получить другие результаты регрессии.

Наибольшую опасность в практическом использовании методов регрессии представляют ошибки измерения. Если ошибки спецификации можно уменьшить, изменяя форму модели (вид математической формулы), а ошибки выборки – увеличивая объем исходных данных, то ошибки измерения практически сводят на нет все усилия по количественной оценке связи между признаками. Особенно велика роль ошибок измерения при исследовании на макроуровне. Так, в исследованиях спроса и потребления в качестве объясняющей переменной широко используется «доход на душу населения». Вместе с тем статистическое измерение величины дохода сопряжено с рядом трудностей и не лишено возможных ошибок, например в результате наличия сокрытых доходов.

Приведем еще один пример: в настоящее время органы государственной статистики получают балансы предприятий, достоверность которых никто не подтверждает. Последующее обобщение такой информации может содержать ошибки измерения. Исследуя, например, в качестве результативного признака прибыль предприятий, мы должны быть уверены, что предприятия показывают в отчетности адекватные реальной действительности величины.

Предполагая, что ошибки измерения сведены к минимуму, основное внимание в эконометрических исследованиях уделяется ошибкам спецификации модели.

В парной регрессии выбор вида математической функции линейная регрессия и корреляция: смысл и оценка параметров - student2.ru может быть осуществлен тремя методами:

· графическим;

· аналитическим, т. е. исходя из теории изучаемой взаимосвязи;

· экспериментальным.

При изучении зависимости между двумя признаками графический метод подбора вида уравнения регрессии достаточно нагляден. Он основан на поле корреляции. Класс математических функций для описания связи двух переменных достаточно широк.

линейная регрессия и корреляция: смысл и оценка параметров - student2.ru линейная регрессия и корреляция: смысл и оценка параметров - student2.ru

линейная регрессия и корреляция: смысл и оценка параметров - student2.ru линейная регрессия и корреляция: смысл и оценка параметров - student2.ru

линейная регрессия и корреляция: смысл и оценка параметров - student2.ru линейная регрессия и корреляция: смысл и оценка параметров - student2.ru

линейная регрессия и корреляция: смысл и оценка параметров - student2.ru линейная регрессия и корреляция: смысл и оценка параметров - student2.ru

линейная регрессия и корреляция: смысл и оценка параметров - student2.ru

Значительный интерес представляет аналитический метод выбора типа уравнения регрессии. Он основан на изучении материальной природы связи исследуемых признаков.

Пусть, например, изучается потребность предприятия в электроэнергии линейная регрессия и корреляция: смысл и оценка параметров - student2.ru в зависимости от объема выпускаемой продукции линейная регрессия и корреляция: смысл и оценка параметров - student2.ru .

Все потребление электроэнергии линейная регрессия и корреляция: смысл и оценка параметров - student2.ru можно подразделить на две части:

· не связанное с производством продукции линейная регрессия и корреляция: смысл и оценка параметров - student2.ru ;

· непосредственно связанное с объемом выпускаемой продукции, пропорционально возрастающее- с увеличением объема выпуска ( линейная регрессия и корреляция: смысл и оценка параметров - student2.ru ).

Тогда зависимость потребления электроэнергии от объема продукции можно выразить уравнением регрессии вида:

линейная регрессия и корреляция: смысл и оценка параметров - student2.ru .

Если затем разделить обе части уравнения на величину объема выпуска продукции ( линейная регрессия и корреляция: смысл и оценка параметров - student2.ru ), то получим выражение зависимости удельного расхода электроэнергии на единицу продукции линейная регрессия и корреляция: смысл и оценка параметров - student2.ru от объема выпущенной продукции ( линейная регрессия и корреляция: смысл и оценка параметров - student2.ru ) в виде уравнения равносторонней гиперболы:

линейная регрессия и корреляция: смысл и оценка параметров - student2.ru .

Аналогично затраты предприятия могут быть подразделены на условно-переменные, изменяющиеся пропорционально изменению объема продукции (расход материала, оплата труда и др.) и условно-постоянные, не изменяющиеся с изменением объема производства (арендная плата, содержание администрации и др.). Соответственно зависимость затрат на производство ( линейная регрессия и корреляция: смысл и оценка параметров - student2.ru ) от объема продукции ( линейная регрессия и корреляция: смысл и оценка параметров - student2.ru ) характеризуется линейной функцией:

линейная регрессия и корреляция: смысл и оценка параметров - student2.ru ,

а зависимость себестоимости единицы продукции ( линейная регрессия и корреляция: смысл и оценка параметров - student2.ru ) от объема продукции – равносторонней гиперболой

линейная регрессия и корреляция: смысл и оценка параметров - student2.ru .

При обработке информации на компьютере выбор вида уравнения регрессии обычно осуществляется экспериментальным методом, т. е. путем сравнения величины остаточной дисперсии Dост, рассчитанной при разных моделях. Если уравнение регрессии проходит через все точки корреляционного поля, что возможно только при функциональной связи, когда все точки лежат на линии регрессии, то фактические значения результативного признака совпадают с теоретическими, т.е. они полностью обусловлены влиянием фактора линейная регрессия и корреляция: смысл и оценка параметров - student2.ru . В этом случае остаточная дисперсия Dост=0. В практических исследованиях, как правило, имеет место некоторое рассеяние точек относительно линии регрессии. Оно обусловлено влиянием прочих не учитываемых в уравнении регрессии факторов. Иными словами, имеют место отклонения фактических данных от теоретических. Величина этих отклонений и лежит в основе расчета остаточной дисперсии:

линейная регрессия и корреляция: смысл и оценка параметров - student2.ru .

Чем меньше величина остаточной дисперсии, тем в меньшей мере наблюдается влияние прочих, не учитываемых в уравнении регрессии факторов, тем лучше уравнение регрессии подходит к исходным данным. При обработке статистических данных на компьютере перебираются разные математические функции в автоматическом режиме и из них выбирается та, для которой остаточная дисперсия является наименьшей.

Если остаточная дисперсия оказывается примерно одинаковой для нескольких функций, то на практике предпочтение отдается более простым видам функций, ибо они в большей степени поддаются интерпретации и требуют меньшего объема наблюдений. Результаты многих исследований подтверждают, что число наблюдений должно в 6 – 7 раз превышать число рассчитываемых параметров при переменной х. Это означает, что искать линейную регрессию, имея менее 7 наблюдений, вообще не имеет смысла. Если вид функции усложняется, то требуется увеличение объема наблюдений, ибо каждый параметр при линейная регрессия и корреляция: смысл и оценка параметров - student2.ru должен рассчитываться хотя бы по 7 наблюдениям. Значит, если мы выбираем параболу второй степени, то требуется объем информации уже не менее 14 наблюдений. Учитывая, что эконометрические модели часто строятся по данным рядов динамики, ограниченным по протяженности (10, 20, 30 лет), при выборе спецификации модели предпочтительна модель с меньшим числом параметров при линейная регрессия и корреляция: смысл и оценка параметров - student2.ru .

ЛИНЕЙНАЯ РЕГРЕССИЯ И КОРРЕЛЯЦИЯ: СМЫСЛ И ОЦЕНКА ПАРАМЕТРОВ

Линейная регрессия находит широкое применение в эконометрике в виде четкой экономической интерпретации ее параметров. Линейная регрессия сводится к нахождению уравнения вида

линейная регрессия и корреляция: смысл и оценка параметров - student2.ru или линейная регрессия и корреляция: смысл и оценка параметров - student2.ru .

Уравнение вида линейная регрессия и корреляция: смысл и оценка параметров - student2.ru позволяет по заданным значениям фактора линейная регрессия и корреляция: смысл и оценка параметров - student2.ru иметь теоретические значения результативного признака, подставляя в него фактические значения фактора линейная регрессия и корреляция: смысл и оценка параметров - student2.ru . На графике теоретические значения представляют линию регрессии.

Построение линейной регрессии сводится к оценке ее параметров – линейная регрессия и корреляция: смысл и оценка параметров - student2.ru и линейная регрессия и корреляция: смысл и оценка параметров - student2.ru . Оценки параметров линейной регрессии могут быть найдены разными методами. Можно обратиться к полю корреляции и, выбрав на графике две точки, провести через них прямую линию.

Классический подход к оцениванию параметров линейной регрессии основан на методе наименьших квадратов (МНК).

МНК позволяет получить такие оценки параметров линейная регрессия и корреляция: смысл и оценка параметров - student2.ru и линейная регрессия и корреляция: смысл и оценка параметров - student2.ru , при которых сумма квадратов отклонений фактических значений результативного признака линейная регрессия и корреляция: смысл и оценка параметров - student2.ru от расчетных (теоретических) линейная регрессия и корреляция: смысл и оценка параметров - student2.ru минимальна:

линейная регрессия и корреляция: смысл и оценка параметров - student2.ru .

Иными словами, из всего множества линий линия регрессии на графике выбирается так, чтобы сумма квадратов расстояний по вертикали между точками и этой линией была минимальной:

линейная регрессия и корреляция: смысл и оценка параметров - student2.ru ,

следовательно,

линейная регрессия и корреляция: смысл и оценка параметров - student2.ru .

При вычислении экстремумов этой функции через нахождение частных производных и их приравнивание к нулю получим следующую систему нормальных уравнений для оценки параметров линейная регрессия и корреляция: смысл и оценка параметров - student2.ru и линейная регрессия и корреляция: смысл и оценка параметров - student2.ru :

линейная регрессия и корреляция: смысл и оценка параметров - student2.ru

Решая систему нормальных уравнений (11) либо методом последовательного исключения переменных, либо методом определителей, найдем искомые оценки параметров линейная регрессия и корреляция: смысл и оценка параметров - student2.ru и линейная регрессия и корреляция: смысл и оценка параметров - student2.ru . Можно воспользоваться следующими готовыми формулами:

линейная регрессия и корреляция: смысл и оценка параметров - student2.ru

Формула (12) получена из первого уравнения системы (11), если все его члены разделить
на линейная регрессия и корреляция: смысл и оценка параметров - student2.ru .

Кроме этого, получаем следующую формулу расчета оценки параметра линейная регрессия и корреляция: смысл и оценка параметров - student2.ru :

линейная регрессия и корреляция: смысл и оценка параметров - student2.ru

Параметр линейная регрессия и корреляция: смысл и оценка параметров - student2.ru называется коэффициентом регрессии. Его величина показывает среднее изменение результата с изменением фактора на одну единицу. Так, если в функции издержек линейная регрессия и корреляция: смысл и оценка параметров - student2.ru ( линейная регрессия и корреляция: смысл и оценка параметров - student2.ru – издержки (тыс. руб.), линейная регрессия и корреляция: смысл и оценка параметров - student2.ru – количество единиц продукции), то, следовательно, с увеличением объема продукции ( линейная регрессия и корреляция: смысл и оценка параметров - student2.ru ) на 1 ед. издержки производства возрастают в среднем на 2 тыс. руб., т. е. дополнительный прирост продукции на 1 ед. потребует увеличения затрат в среднем на 2 тыс. руб.

Возможность четкой экономической интерпретации коэффициента регрессии сделала линейное уравнение регрессии достаточно распространенным в эконометрических исследованиях.

Формально линейная регрессия и корреляция: смысл и оценка параметров - student2.ru – значение линейная регрессия и корреляция: смысл и оценка параметров - student2.ru при линейная регрессия и корреляция: смысл и оценка параметров - student2.ru . Если признак-фактор линейная регрессия и корреляция: смысл и оценка параметров - student2.ru не имеет и не может иметь нулевого значения, то вышеуказанная трактовка свободного члена линейная регрессия и корреляция: смысл и оценка параметров - student2.ru не имеет смысла. Параметр линейная регрессия и корреляция: смысл и оценка параметров - student2.ru может не иметь экономического содержания. Попытки экономически интерпретировать параметр линейная регрессия и корреляция: смысл и оценка параметров - student2.ru могут привести к абсурду, особенно при линейная регрессия и корреляция: смысл и оценка параметров - student2.ru .

Интерпретировать можно лишь знак при параметре линейная регрессия и корреляция: смысл и оценка параметров - student2.ru . Если линейная регрессия и корреляция: смысл и оценка параметров - student2.ru , то относительное изменение результата происходит медленнее, чем изменение фактора. Иными словами, вариация результата меньше вариации фактора – коэффициент вариации по фактору линейная регрессия и корреляция: смысл и оценка параметров - student2.ru выше коэффициента вариации для результата линейная регрессия и корреляция: смысл и оценка параметров - student2.ru

Парная линейная регрессия используется в эконометрике нередко при изучении функции потребления:

линейная регрессия и корреляция: смысл и оценка параметров - student2.ru ,

где линейная регрессия и корреляция: смысл и оценка параметров - student2.ru – потребление;

линейная регрессия и корреляция: смысл и оценка параметров - student2.ru – доход;

линейная регрессия и корреляция: смысл и оценка параметров - student2.ru и линейная регрессия и корреляция: смысл и оценка параметров - student2.ru – параметры функции.

Данное уравнение линейной регрессии используется обычно в увязке с балансовым равенством:

линейная регрессия и корреляция: смысл и оценка параметров - student2.ru ,

где линейная регрессия и корреляция: смысл и оценка параметров - student2.ru – размер инвестиций;

линейная регрессия и корреляция: смысл и оценка параметров - student2.ru – сбережения.

Для простоты предположим, что доход расходуется на потребление и инвестиции. Таким образом, рассматривается система уравнений

линейная регрессия и корреляция: смысл и оценка параметров - student2.ru

Наличие в данной системе балансового равенства накладывает ограничение на величину коэффициента регрессии, которая не может быть больше единицы, т. е. линейная регрессия и корреляция: смысл и оценка параметров - student2.ru .

Предположим, что функция потребления составила:

линейная регрессия и корреляция: смысл и оценка параметров - student2.ru

Коэффициент регрессии характеризует склонность к потреблению. Он показывает, что из каждой тысячи дохода на потребление расходуется в среднем 650 руб., а 350 руб. инвестируются. Если рассчитать регрессию размера инвестиций от дохода, т. е. линейная регрессия и корреляция: смысл и оценка параметров - student2.ru , то уравнение регрессии составит: линейная регрессия и корреляция: смысл и оценка параметров - student2.ru . Это уравнение можно и не определять, ибо оно выводится из функции потребления. Коэффициенты регрессии этих двух уравнений связаны равенством: линейная регрессия и корреляция: смысл и оценка параметров - student2.ru .

Если коэффициент регрессии оказывается больше 1, то на потребление расходуются не только доходы, но и сбережения.

Коэффициент регрессии в функции потребления используется для расчета мультипликатора:

линейная регрессия и корреляция: смысл и оценка параметров - student2.ru ,

где линейная регрессия и корреляция: смысл и оценка параметров - student2.ru – мультипликатор;

линейная регрессия и корреляция: смысл и оценка параметров - student2.ru – коэффициент регрессии в функции потребления.

В нашем примере линейная регрессия и корреляция: смысл и оценка параметров - student2.ru . Это означает, что дополнительные вложения в размере 1 тыс. руб. на длительный срок приведут при прочих равных условиях к дополнительному доходу в 2,86 тыс. руб.

Уравнение регрессии всегда дополняется показателем тесноты связи. При использовании линейной регрессии в качестве такого показателя выступает линейный коэффициент корреляции линейная регрессия и корреляция: смысл и оценка параметров - student2.ru .

линейная регрессия и корреляция: смысл и оценка параметров - student2.ru

Как известно, линейный коэффициент корреляции находится в границах: линейная регрессия и корреляция: смысл и оценка параметров - student2.ru .

Следует иметь в виду, что величина линейного коэффициента корреляции оценивает тесноту связи рассматриваемых признаков в ее линейной форме. Поэтому близость абсолютной величины линейного коэффициента корреляции к нулю еще не означает отсутствие связи между признаками. При иной спецификации модели связь между признаками может оказаться достаточно тесной.

Для оценки качества подбора линейной функции рассчитывается квадрат линейного коэффициента корреляции линейная регрессия и корреляция: смысл и оценка параметров - student2.ru , называемый коэффициентом детерминации. Коэффициент детерминации характеризует долю дисперсии результативного признака линейная регрессия и корреляция: смысл и оценка параметров - student2.ru , объясняемую регрессией, в общей дисперсии результативного признака:

линейная регрессия и корреляция: смысл и оценка параметров - student2.ru

Соответственно величина линейная регрессия и корреляция: смысл и оценка параметров - student2.ru характеризует долю дисперсии линейная регрессия и корреляция: смысл и оценка параметров - student2.ru , вызванную влиянием остальных не учтенных в модели факторов.

Величина коэффициента детерминации служит одним из критериев оценки качества линейной модели. Чем больше доля объясненной вариации, тем соответственно меньше роль прочих факторов, и, следовательно, линейная модель хорошо аппроксимирует исходные данные, и ею можно воспользоваться для прогноза значений результативного признака.

Наши рекомендации