Основы линейного регрессионного анализа

Метод наименьших квадратов, рассмотренный в простейшем случае, допускает различные обобщения. Например, метод наименьших квадратов дает алгоритм расчетов, если исходные данные – по-прежнему набор n пар чисел (tk , xk), k = 1,2,…,n, где tk – независимая переменная (например, время), а xk – зависимая (например, индекс инфляции), а восстанавливать надо не линейную зависимость, а квадратическую:

Основы линейного регрессионного анализа - student2.ru

Следует рассмотреть функцию трех переменных

Основы линейного регрессионного анализа - student2.ru

Оценки метода наименьших квадратов - это такие значения параметров a*, b* и с*, при которых функция f(a,b,с) достигает минимума по всем значениям аргументов. Чтобы найти эти оценки, надо вычислить частные производные от функции f(a,b,с) по аргументам a, b и с, приравнять их 0, затем из полученных уравнений найти оценки: Имеем:

Основы линейного регрессионного анализа - student2.ru

Приравнивая частную производную к 0, получаем линейное уравнение относительно трех неизвестных параметров a,b,c:

Основы линейного регрессионного анализа - student2.ru

Приравнивая частную производную по параметру b к 0, аналогичным образом получаем уравнение

Основы линейного регрессионного анализа - student2.ru

Наконец, приравнивая частную производную по параметру с к 0, получаем уравнение

Основы линейного регрессионного анализа - student2.ru

Решая систему трех уравнений с тремя неизвестными, находим оценки метода наименьших квадратов.

Другие задачи, рассмотренные в предыдущем пункте (доверительные границы для параметров и прогностической функции и др.), также могут быть решены. Соответствующие алгоритмы более громоздки. Для их записи полезен аппарат матричной алгебры (см., например, одну из лучших в этой области монографий [10]). Для реальных расчетов используют соответствующие компьютерные программы.

Раздел эконометрики, посвященный восстановлению зависимостей, называется регрессионным анализом. Термин "линейный регрессионный анализ" используют, когда рассматриваемая функция линейно зависит от оцениваемых параметров (от независимых переменных зависимость может быть произвольной). Теория оценивания неизвестных параметров хорошо развита именно в случае линейного регрессионного анализа. Если же линейности нет и нельзя перейти к линейной задаче, то, как правило, хороших свойств от оценок ожидать не приходится.

Продемонстрируем подходы в случае зависимостей различного вида. Если зависимость имеет вид многочлена (полинома)

Основы линейного регрессионного анализа - student2.ru

то коэффициенты многочлена могут быть найдены путем минимизации функции

Основы линейного регрессионного анализа - student2.ru

Функция от t не обязательно должна быть многочленом. Можно, например, добавить периодическую составляющую, соответствующую сезонным колебаниям. Хорошо известно, например, что инфляция (рост потребительских цен) имеет четко выраженный годовой цикл - в среднем цены быстрее всего растут зимой, в декабре - январе, а медленнее всего (иногда в среднем даже падают) летом, в июле - августе. Пусть для определенности

Основы линейного регрессионного анализа - student2.ru

тогда неизвестные параметры могут быть найдены путем минимизации функции

Основы линейного регрессионного анализа - student2.ru

Пусть I(t) -индекс инфляции в момент t. Принцип стабильности условий приводит к гипотезе о постоянстве темпов роста средних цен, т.е. индекса инфляции. Таким образом, естественная модель для индекса инфляции - это

Основы линейного регрессионного анализа - student2.ru

Эта модель не является линейной, метод наименьших квадратов непосредственно применять нельзя. Однако если прологарифмировать обе части предыдущего равенства:

Основы линейного регрессионного анализа - student2.ru

то получим линейную зависимость, рассмотренную выше.

Независимых переменных может быть не одна, а несколько. Пусть, например, по исходным данным Основы линейного регрессионного анализа - student2.ru требуется оценить неизвестные параметры a и b в зависимости

Основы линейного регрессионного анализа - student2.ru

где Основы линейного регрессионного анализа - student2.ru - погрешность. Это можно сделать, минимизировав функцию

Основы линейного регрессионного анализа - student2.ru

Зависимость от х и у не обязательно должна быть линейной. Предположим, что из каких-то соображений известно, что зависимость должна иметь вид

Основы линейного регрессионного анализа - student2.ru

тогда для оценки пяти параметров необходимо минимизировать функцию

Основы линейного регрессионного анализа - student2.ru

Более подробно рассмотрим пример из микроэкономики. В одной из оптимизационных моделей поведения фирмы используется т.н. производственная функция f(K,L), задающая объем выпуска в зависимости от затрат капитала K и труда L. В качестве конкретного вида производственной функции часто используется так называемая функция Кобба-Дугласа

Основы линейного регрессионного анализа - student2.ru

Однако откуда взять значения параметров Основы линейного регрессионного анализа - student2.ru и Основы линейного регрессионного анализа - student2.ru ? Естественно предположить, что они - одни и те же для предприятий отрасли. Поэтому целесообразно собрать информацию Основы линейного регрессионного анализа - student2.ru где fk - объем выпуска на k-ом предприятии, Kk- объем затрат капитала на k-ом предприятии, Lk - объем затрат труда на k-ом предприятии (в кратком изложении не пытаемся дать точных определений используемым понятиям из экономики предприятия). По собранной информации естественно попытаться оценить параметры Основы линейного регрессионного анализа - student2.ru и Основы линейного регрессионного анализа - student2.ru . Но они входят в зависимость нелинейно, поэтому сразу применить метод наименьших квадратов нельзя. Помогает логарифмирование:

Основы линейного регрессионного анализа - student2.ru

Следовательно, целесообразно сделать замену переменных

Основы линейного регрессионного анализа - student2.ru

а затем находить оценки параметров Основы линейного регрессионного анализа - student2.ru и Основы линейного регрессионного анализа - student2.ru , минимизируя функцию

Основы линейного регрессионного анализа - student2.ru

Найдем частные производные:

Основы линейного регрессионного анализа - student2.ru

Основы линейного регрессионного анализа - student2.ru

Приравняем частные производные к 0, сократим на 2, раскроем скобки, перенесем свободные члены вправо. Получим систему двух линейных уравнений с двумя неизвестными:

 
  Основы линейного регрессионного анализа - student2.ru


Основы линейного регрессионного анализа - student2.ru

Таким образом, для вычисления оценок метода наименьших квадратов необходимо найти пять сумм

Основы линейного регрессионного анализа - student2.ru

Для упорядочения расчета этих сумм может быть использована таблица типа той, что применялась выше. Отметим, что рассмотренная там постановка переходит в разбираемую сейчас при Основы линейного регрессионного анализа - student2.ru

Подходящая замена переменных во многих случаях позволяет перейти к линейной зависимости. Например, если

Основы линейного регрессионного анализа - student2.ru

то замена z=1/y приводит к линейной зависимости z = a + bx. Если y=(a+bx)2, то замена Основы линейного регрессионного анализа - student2.ru приводит к линейной зависимости z = a + bx.

Регрессионному анализу (т.е методам восстановления зависимостей) посвящена огромная литература. Он хорошо представлен в программных продуктах по анализу данных, особенно та его часть, которая связана с методом наименьших квадратов. Обзор современных эконометрических методов и моделей дан в учебнике [1].

Литература

1. Орлов А.И. Эконометрика. – М.: Экзамен, 2002. -576 с.
2. Долан Э.Дж., Линдсей Д.Е. Рынок: микроэкономическая модель. - СПб: СП "Автокомп", 1992. - 496 с.
3. The teaching of statistics / Studies in mathematics education. Vol.7. - Paris, UNESCO, 1989. - 258 pp.
4. Орлов А.И. Устойчивость в социально-экономических моделях. - М.: Наука, 1979. - 296 с.
5. Контроллинг в бизнесе. Методологические и практические основы построения контроллинга в организациях / А.М. Карминский, Н.И. Оленев, А.Г. Примак, С.Г.Фалько. - М.: Финансы и статистика, 1998. - 256 с.
6. Хан Д. Планирование и контроль: концепция контроллинга: Пер. с нем. - М.: Финансы и статистика, 1997. - 800 с.
7. Бэстенс Д.Э., Берт В.М. ван дер, Вуд Д. Нейронные сети и финансовые рынки: принятие решений в торговых операциях. - М.: ТВП, 1998.
8. Орлов А. И. Задачи оптимизации и нечеткие переменные. - М.: Знание, 1980.- 64 с.
9. Большев Л.Н., Смирнов Н.В. Таблицы математической статистики. – М.: Наука, 1983. - 416 с.
10. Себер Дж. Линейный регрессионный анализ. - М.: Мир, 1980. - 456 с.

Контрольные вопросы

1. Расскажите об эконометрике в России и за рубежом.

2. Что такое «высокие статистические технологии»?

3. Почему необходима эконометрическая поддержка принятия решений в менеджменте?

4. Исходные данные – набор n пар чисел (tk , xk), k = 1,2,…,n, где tk – независимая переменная (например, время), а xk – зависимая (например, индекс инфляции). Предполагается, что переменные связаны зависимостью

xk = a tk + b + ek , k = 1,2,…,n,

где a и b – параметры, неизвестные статистику и подлежащие оцениванию, а ek – погрешности, искажающие зависимость.

Таблица 2.

Исходные данные для задачи 4.

tk
xk

Методом наименьших квадратов оцените параметры a и b линейной зависимости. Выпишите восстановленную зависимость.

Вычислите восстановленные значения зависимой переменной, сравните их с исходными значениями (найдите разности) и проверьте условие точности вычислений (при отсутствии ошибок в вычислениях сумма исходных значений должна равняться сумме восстановленных).

Найдите остаточную сумму квадратов и оцените дисперсию погрешностей.

Выпишите точечный прогноз, а также верхнюю и нижнюю доверительные границы для него (для доверительной вероятности 0,95).

Рассчитайте прогнозное значение и доверительные границы для него для момента t = 12.

Как изменятся результаты, если доверительная вероятность будет увеличена? А если она будет уменьшена?

5. Как в методе наименьших квадратов используются преобразования переменных?

Наши рекомендации