Методы линеаризации функции регрессии
Один из подходов оценки параметров нелинейных моделей состоит в линеаризации модели. Линеаризация модели заключается в том, что с помощью подходящих преобразований исходных переменных исследуемую зависимость представляют в виде линейного соотношения между преобразованными переменными. В рамках этого подхода различают два класса нелинейных регрессионных моделей, допускающих линеаризацию: а) модели, нелинейные относительно включенных в модель переменных, но линейных по оцениваемым параметрам; б) модели, нелинейные по оцениваемым параметрам.
Примером нелинейной регрессии, но линейной по оцениваемым параметрам, могут служить следующие функции: полиномы различных степеней, например
;
равносторонняя гипербола:
.
К нелинейным регрессионным моделям, нелинейным по оцениваемым параметрам, относятся: степенная функция
;
показательная функция:
.
Нелинейная регрессионная модель с линейно включенными в нее параметрами не таит каких-либо сложностей в оценке ее параметров. Введение новых переменных позволяет свести её к линейной модели, для оценки параметров которой можно использовать обычный МНК. Так, например, если нужно оценить параметры регрессионной модели
,
то вводя новые переменные , , получим линейную модель
,
параметры которой находятся обычным МНК.
Следует, однако, отметить и недостаток такой замены переменных, связанный с тем, что оценки параметров получаются не из условия минимизации суммы квадратов отклонений для исходной переменной, а из условия минимизации суммы квадратов отклонений для новых переменных, что не одно и то же. К тому же такое преобразование искажает исходные предпосылки МНК, поскольку новые объясняющие переменные, вообще говоря, будут зависимыми. В связи с этим необходимо определенное уточнение полученных оценок.
Более сложной проблемой является нелинейность модели по параметрам, т.к. линеаризация достигается при помощи более сложных преобразований. Например, приведенную выше степенную модель при помощи логарифмического преобразования можно привести к линейному виду
.
К этой модели уже можно применить обычный МНК. Однако следует подчеркнуть, что критерии значимости и интервальные оценки параметров, применяемые для нормальной линейной регрессии, требуют, чтобы нормальный закон распределения в такой модели имел логарифм случайного отклонения (т.е. , а вовсе не e. Другими словами, случайное отклонение e должно иметь логарифмически нормальное распределение.
Заметим попутно, что к модели
,
рассматриваемой в качестве альтернативной к уже рассмотренной, изложенный метод исследования уже непригоден, т.к. ее нельзя привести к линейному виду. В этом случае можно использовать только численные методы нелинейной оптимизации.
Отметим ещё, что при построении нелинейных уравнений более остро, чем в линейном случае, стоит проблема правильной оценки формы зависимости между переменными. Неточности при выборе формы оцениваемой функции существенно сказываются на качестве отдельных параметров уравнений регрессии и, соответственно, на адекватности всей модели в целом (проблема спецификации).
§6.2. ОПИСАНИЕ ОСНОВНЫХ НЕЛИНЕЙНЫХ
РЕГРЕССИОННЫХ МОДЕЛЕЙ
Полиномиальная модель
Модель вида
(6.3)
называется полиномиальной моделью. Как показывает опыт, среди полиномиальных моделей чаще всего используется параболическая и кубическая модели. Ограничение использования полиномов более высоких степеней связана с требованием однородности исследуемой совокупности: чем выше порядок полинома, тем больше изгибов имеет кривая и соответственно менее однородна совокупность по результативному признаку.
Параболическая модель
(6.4)
может отражать зависимость между объемом выпуска и средними или предельными издержками; или между расходами на рекламу и прибыль и т.д. Параболическая модель целесообразна к применению, если для определенного интервала значений фактора меняется характер связи рассматриваемых признаков: прямая связь меняется на обратную и наоборот. Если же исходные данные не обнаруживают изменения направленности связи, то параметры параболической модели становятся трудно интерпретируемыми, поэтому форма связи заменяется другой нелинейной моделью (например, степенной).
При b1>0 и b2<0 парабола симметрична относительно максимума, т.е. точки в которой рост сменяется на падение. Такого рода функции можно наблюдать в экономике труда при изучении зависимости заработной платы работников физического труда от возраста. С увеличение возраста повышается заработная плата ввиду одновременного увеличения опыта и повышения квалификации работника. Однако с определенного возраста ввиду старения организма и снижения производительности труда дальнейшее повышение возраста может привести к снижению заработной платы работника.
Кубическая модель
(6.5)
в микроэкономике может характеризовать зависимость общих издержек от объема выпуска. Использование кубической модели более проблематично, чем параболической модели, поскольку при изменении фактора характер связи рассматриваемых признаков меняется два раза (рост, спад и опять рост).
Степенная модель
Модель вида
(6.6)
называется степенной моделью. Эта модель может отражать зависимость спроса Y на благо от его цены X (тогда b<0) или дохода X (тогда b>0). Функция (6.7) может отражать также зависимость объёма выпуска Y от использования ресурса X (производственная функция), в которой 0<b<1, а также ряд других зависимостей.
Стандартным и широко используемым подходом к анализу моделей подобного вида в эконометрике является логарифмирование. Прологарифмируем обе части равенства (6.6), имеем
.
После замены lna=b0 и lne=e0, получим
. (6.7)
Это есть т.н. двойная логарифмическая модель (и зависимая, и объясняющая переменные заданы в логарифмическом виде).
Заметим, что в случае парной регрессии обоснованность использования логарифмической модели проверить достаточно просто. Вместо наблюдений (xi, yi) рассматриваются наблюдения (lnxi, lnyi). Вновь полученные точки наносятся на корреляционное поле. Если их расположение соответствует прямой линии, то произведённая замена удачна и использование логарифмической модели обосновано.
Степенные производственные функции обладают большими возможностями. Они хорошо моделируют как линейные, так и криволинейные, как возрастающие, так и убывающие зависимости. Поэтому показательные функции довольно часто используются в экономических исследованиях.
Показательная модель
Модель вида
(6.8)
называется показательной моделью. Ей равносильна экспоненциальная модель
. (6.9)
Прологарифмировав выражение (6.9), получим полулогарифмическую (логарифмически-линейную) модель
. (6.10)
Такие модели обычно используются в тех случаях, когда необходимо определять темп роста или прироста каких-либо экономических показателей. Например, при анализе банковского вклада по первоначальному вкладу и процентной ставке, при исследовании зависимости прироста объёма выпуска от относительного (процентного) увеличения затрат ресурса, бюджетного дефицита от темпа роста ВНП, темпа роста инфляции об объёма денежной массы и т.д.
В качестве примера можно примести зависимость, хорошо известную в банковском и финансовом анализе
,
где Y0 – начальная величина переменной Y (например, первоначальный вклад в банке); r – сложный темп прироста величины Y (процентная ставка); Yt – значение величины Y в момент времени t (вклад в банке в момент времени t).
Заметим, что в случае парной регрессии обоснованность использования логарифмической модели проверить достаточно просто. Вместо наблюдений (xi, yi) рассматриваются наблюдения (xi, lnyi). Вновь полученные точки наносятся на корреляционное поле. Если их расположение соответствует прямой линии, то произведённая замена удачна и использование полулогарифмической модели обосновано.
Отметим, что иногда в компьютерных программах используется логарифмическая параболическая модель
, (6.11)
а также модифицированная экспонента
. (6.12)
Константа k носит название асимптоты экспоненты, т.к. значения этой функции неограниченно приближаются (снизу) к величине k. Могут и другие варианты модифицированной экспоненты. Основной недостаток модифицированной экспоненты состоит в том, что она является существенно нелинейной моделью.