Тема 1.2. парная линейная регрессия

И КОРРЕЛЯЦИЯ

План лекции

1. Модель линейной парной регрессии. Метод наименьших квадратов.

2. Коэффициент корреляции.

3. Основные положения регрессионного анализа. Теорема Гаусса – Маркова.

4. Оценка значимости уравнения регрессии. Коэффициент детерминации.

5. Построение интервальных прогнозов по модели парной регрессии.

Введение

В экономике в большинстве случаев между переменными величинами существуют зависимости, когда каждому значению одной переменной соответствует множество возможных значений другой переменной. Иначе говоря, каждому значению одной переменной соответствует определенное (условное) распределение другой переменной. Такая зависимость получила название статистической.

В силу неоднозначности статистической зависимости между тема 1.2. парная линейная регрессия - student2.ru и тема 1.2. парная линейная регрессия - student2.ru для исследователя, в частности, представляет интерес усредненная по тема 1.2. парная линейная регрессия - student2.ru схема зависимости. Если зависимость между двумя переменными такова, что каждому значению одной переменной соответствует определенное условное математическое ожидание (среднее значение) другой, то такая статистическая зависимость называется корреляционной. Корреляционная зависимость может быть представлена в виде

тема 1.2. парная линейная регрессия - student2.ru или тема 1.2. парная линейная регрессия - student2.ru .

В регрессионном анализе рассматриваются односторонняя зависимость случайной переменной тема 1.2. парная линейная регрессия - student2.ru от одной (или нескольких) неслучайной независимой переменной тема 1.2. парная линейная регрессия - student2.ru . Такая зависимость может возникнуть, например, в случае, когда при каждом фиксированном значении тема 1.2. парная линейная регрессия - student2.ru соответствующие значения тема 1.2. парная линейная регрессия - student2.ru подвержены случайному разбросу за счет действия ряда неконтролируемых факторов.

Зависимость такого типа, выражаемая соотношением

тема 1.2. парная линейная регрессия - student2.ru (2.1)

называется функцией регрессии тема 1.2. парная линейная регрессия - student2.ru на тема 1.2. парная линейная регрессия - student2.ru . При этом тема 1.2. парная линейная регрессия - student2.ru называется независимой (объясняющей) переменной (регрессором), тема 1.2. парная линейная регрессия - student2.ru – зависимой (объясняемой) переменной. При рассмотрении зависимости двух случайных величин говорят о парной регрессии.

В статистической практике исследователь располагает лишь выборкой пар значений тема 1.2. парная линейная регрессия - student2.ru ограниченного объема п. В этом случае речь может идти об оценке (о приближенном выражении) по выборке функции регрессии. Такой оценкой является выборочное уравнение регрессии:

тема 1.2. парная линейная регрессия - student2.ru ,

где тема 1.2. парная линейная регрессия - student2.ru – условная (групповая) средняя переменной тема 1.2. парная линейная регрессия - student2.ru при фиксированном значении переменной тема 1.2. парная линейная регрессия - student2.ru ; тема 1.2. парная линейная регрессия - student2.ru – параметры регрессии.

При правильно определенной аппроксимирующей функции тема 1.2. парная линейная регрессия - student2.ru с увеличением объема выборки тема 1.2. парная линейная регрессия - student2.ru она будет сходиться по вероятности к функции регрессии тема 1.2. парная линейная регрессия - student2.ru .

Модель линейной парной регрессии.

Метод наименьших квадратов

Если функция регрессии линейна, то говорят, о линейной регрессии.

Линейная регрессия находит широкое применение в эконометрике ввиду четкой экономической интерпретации ее параметров.

Линейная регрессия сводится к нахождению уравнения вида

тема 1.2. парная линейная регрессия - student2.ru или тема 1.2. парная линейная регрессия - student2.ru . (2.2)

Уравнение вида тема 1.2. парная линейная регрессия - student2.ru позволяет по заданным значениям фактора тема 1.2. парная линейная регрессия - student2.ru иметь теоретические знания результативного признака подстановкой в него фактических значений фактора тема 1.2. парная линейная регрессия - student2.ru .

Построение линейной регрессии сводится к оценке ее параметров – тема 1.2. парная линейная регрессия - student2.ru и тема 1.2. парная линейная регрессия - student2.ru . Оценки параметров линейной регрессии могут быть найдены разными методами.

Классический подход к оцениванию параметров линейной регрессии основан на методе наименьших квадратов (МНК).

Метод наименьших квадратов позволяет получить такие оценки параметров тема 1.2. парная линейная регрессия - student2.ru и тема 1.2. парная линейная регрессия - student2.ru , при которых сумма квадратов отклонений фактических значений результативного признака тема 1.2. парная линейная регрессия - student2.ru от расчетных тема 1.2. парная линейная регрессия - student2.ru тема 1.2. парная линейная регрессия - student2.ru минимальна:

тема 1.2. парная линейная регрессия - student2.ru (2.3)

Иными словами, из всего множества линий линия регрессии на графике выбирается так, чтобы сумма квадратов расстояний по вертикали между точками и этой линией была бы минимальной:

тема 1.2. парная линейная регрессия - student2.ru ,

следовательно,

тема 1.2. парная линейная регрессия - student2.ru .

Для того чтобы найти минимум функции (2.3), надо вычислить частные производные по каждому из параметров тема 1.2. парная линейная регрессия - student2.ru и тема 1.2. парная линейная регрессия - student2.ru и приравнять их к нулю.

Обозначим тема 1.2. парная линейная регрессия - student2.ru через тема 1.2. парная линейная регрессия - student2.ru , тогда:

тема 1.2. парная линейная регрессия - student2.ru

тема 1.2. парная линейная регрессия - student2.ru тема 1.2. парная линейная регрессия - student2.ru

тема 1.2. парная линейная регрессия - student2.ru (2.4)

Преобразуя формулу (2.4), получим следующую систему нормальных уравнений для оценки параметров тема 1.2. парная линейная регрессия - student2.ru и тема 1.2. парная линейная регрессия - student2.ru :

тема 1.2. парная линейная регрессия - student2.ru (2.5)

Теперь, разделив обе части уравнений (2.5) на тема 1.2. парная линейная регрессия - student2.ru , получим систему нормальных уравнений в виде:

тема 1.2. парная линейная регрессия - student2.ru , (2.6)

где соответствующие средние определяются по формулам:

тема 1.2. парная линейная регрессия - student2.ru , (2.7)

тема 1.2. парная линейная регрессия - student2.ru , (2.8)

тема 1.2. парная линейная регрессия - student2.ru , (2.9)

тема 1.2. парная линейная регрессия - student2.ru . (2.10)

Подставляя значение

тема 1.2. парная линейная регрессия - student2.ru (2.11)

из первого уравнения системы (2.6) в уравнение регрессии тема 1.2. парная линейная регрессия - student2.ru , получим

тема 1.2. парная линейная регрессия - student2.ru

или

тема 1.2. парная линейная регрессия - student2.ru . (2.12)

Решая систему нормальных уравнений (2.5) либо методом последовательного исключения переменных, либо по формулам Крамера, найдем искомые оценки параметров тема 1.2. парная линейная регрессия - student2.ru и тема 1.2. парная линейная регрессия - student2.ru .

Поскольку ковариация тема 1.2. парная линейная регрессия - student2.ru , а дисперсия признака Х тема 1.2. парная линейная регрессия - student2.ru , получим следующую формулу расчета оценки параметра тема 1.2. парная линейная регрессия - student2.ru :

тема 1.2. парная линейная регрессия - student2.ru = тема 1.2. парная линейная регрессия - student2.ru (2.13)

Параметр тема 1.2. парная линейная регрессия - student2.ru называется коэффициентом регрессии. Его величина показывает среднее изменение результата с изменением фактора на одну единицу. Так, если функция издержек (У, тыс. руб.) выражается как тема 1.2. парная линейная регрессия - student2.ru , ( тема 1.2. парная линейная регрессия - student2.ru – количество единиц продукции), то, следовательно, с увеличением объема продукции тема 1.2. парная линейная регрессия - student2.ru на одну единицу издержки производства возрастают в среднем на 2 тыс. руб., т.е. дополнительный прирост продукции на одну единицу потребует увеличения затрат в среднем на 2 тыс. руб.

Знак при коэффициенте регрессии тема 1.2. парная линейная регрессия - student2.ru показывает направление связи: при тема 1.2. парная линейная регрессия - student2.ru – связь прямая, а при тема 1.2. парная линейная регрессия - student2.ru – связь обратная.

Параметр тема 1.2. парная линейная регрессия - student2.ru может не иметь экономического содержания.

Пример 1.

По группе предприятий выпускающих один и тот же вид продукции, рассматривается функция издержек тема 1.2. парная линейная регрессия - student2.ru . Необходимая для расчета оценок параметров тема 1.2. парная линейная регрессия - student2.ru и тема 1.2. парная линейная регрессия - student2.ru информация представлена в таблице.

Расчетная таблица
Номер предприятия Выпуск продукции, тыс. ед. тема 1.2. парная линейная регрессия - student2.ru Затраты на производство, млн. руб. тема 1.2. парная линейная регрессия - student2.ru тема 1.2. парная линейная регрессия - student2.ru тема 1.2. парная линейная регрессия - student2.ru тема 1.2. парная линейная регрессия - student2.ru тема 1.2. парная линейная регрессия - student2.ru
31,1
67,9
141,6
104,7
178,4
104,7
141,6
Итого

Система нормальных уравнений будет иметь вид:

тема 1.2. парная линейная регрессия - student2.ru .

Решив ее, получим:

тема 1.2. парная линейная регрессия - student2.ru .

Запишем уравнение регрессии:

тема 1.2. парная линейная регрессия - student2.ru

Подставив в уравнение значения тема 1.2. парная линейная регрессия - student2.ru , найдем теоретические значения тема 1.2. парная линейная регрессия - student2.ru (см. последнюю графу таблицы). В данном случае величина параметра тема 1.2. парная линейная регрессия - student2.ru не имеет экономического смысла.

В рассматриваемом примере имеем:

тема 1.2. парная линейная регрессия - student2.ru

Коэффициент корреляции

Перейдем к оценке тесноты корреляционной зависимости. Рассмотрим наиболее важный для практики и теории случай линейной зависимости вида тема 1.2. парная линейная регрессия - student2.ru .

Представим уравнение тема 1.2. парная линейная регрессия - student2.ru в эквивалентном виде:

тема 1.2. парная линейная регрессия - student2.ru

В этой системе величина

тема 1.2. парная линейная регрессия - student2.ru (2.14)

показывает, на сколько величин sу изменится в среднем тема 1.2. парная линейная регрессия - student2.ru , когда тема 1.2. парная линейная регрессия - student2.ru увеличится на одно sх.

Величина тема 1.2. парная линейная регрессия - student2.ru является показателем тесноты линейной связи и называется выборочным коэффициентом корреляции (или просто коэффициентом корреляции).

Две корреляционные зависимости переменной тема 1.2. парная линейная регрессия - student2.ru от тема 1.2. парная линейная регрессия - student2.ru приведены на рис. Очевидно, что в случае а) зависимость между переменными менее тесная и коэффициент корреляции должен быть меньше, чем в случае б), так как точки корреляционного поля а) дальше отстоят от линии регрессии, чем точки поля б).

тема 1.2. парная линейная регрессия - student2.ru

Если тема 1.2. парная линейная регрессия - student2.ru , то корреляционная связь между переменными называется прямой, если тема 1.2. парная линейная регрессия - student2.ru , - обратной. При прямой (обратной) связи увеличение одной из переменных ведет к увеличению (уменьшению) условной (групповой) средней другой.

Учитывая (2.13), формулу для тема 1.2. парная линейная регрессия - student2.ru представим в виде:

тема 1.2. парная линейная регрессия - student2.ru (2.15)

Отметим другие модификации формулы тема 1.2. парная линейная регрессия - student2.ru , полученные из формулы (2.15):

тема 1.2. парная линейная регрессия - student2.ru (2.16)

тема 1.2. парная линейная регрессия - student2.ru (2.17)

Для практических расчетов наиболее удобна формула (2.17), так как по ней тема 1.2. парная линейная регрессия - student2.ru находится непосредственно из данных наблюдений и на значении тема 1.2. парная линейная регрессия - student2.ru не скажутся округления данных, связанные с расчетом средних и отклонений от них.

Выборочный коэффициент корреляции тема 1.2. парная линейная регрессия - student2.ru (при достаточно большом объеме выборки тема 1.2. парная линейная регрессия - student2.ru ) так же, как и коэффициент корреляции двух случайных величин, обладает следующими свойствами.

1. Коэффициент корреляции принимает значения на отрезке [– 1;1], т.е. тема 1.2. парная линейная регрессия - student2.ru . Чем ближе тема 1.2. парная линейная регрессия - student2.ru к единице, тем теснее связь.

2. При тема 1.2. парная линейная регрессия - student2.ru корреляционная связь представляет линейную функциональную зависимость. При этом все наблюдаемые значения располагаются на прямой линии.

3. При тема 1.2. парная линейная регрессия - student2.ru линейная корреляционная связь отсутствует. при этом линия регрессии параллельна оси Ох.

Наши рекомендации