Методы оценивания моделей бинарного выбора

3.2.1. Метод максимального правдоподобия.Построение регрессионных моделей с использованием нелинейных зависимостей подобного типа практически исключает применение метода наименьших квадратов. Для оценивания моделей бинарного выбора обычно используется метод максимального правдоподобия [2]. Применение этого метода осуществляется в предположении, что каждое наблюдение может трактоваться как однократный выбор из распределения Бернулли. Таким образом, модель с вероятностью успеха Методы оценивания моделей бинарного выбора - student2.ru и независимыми наблюдениями (эксперты опрашиваются независимо друг от друга) представляет собой вероятность совместного появления всей совокупности ожидаемых событий

Методы оценивания моделей бинарного выбора - student2.ru . (3.17)

Для каждого вектора Методы оценивания моделей бинарного выбора - student2.ru , представляющего собой результаты конкретного экспертного опроса, величина вероятности зависит от вектора оцениваемых параметров Методы оценивания моделей бинарного выбора - student2.ru и может быть записана как функция правдоподобия

Методы оценивания моделей бинарного выбора - student2.ru . (3.18)

В данной форме записи множители произведения селектируются с помощью компонент вектора Методы оценивания моделей бинарного выбора - student2.ru , принимающих всего два значения: 0 или 1.

Удобнее и математически проще максимизировать логарифмическую функцию правдоподобия

Методы оценивания моделей бинарного выбора - student2.ru . (3.19)

Используя сокращенные записи Методы оценивания моделей бинарного выбора - student2.ru и Методы оценивания моделей бинарного выбора - student2.ru , выпишем для логарифмической функции правдоподобия условия максимизации первого порядка

Методы оценивания моделей бинарного выбора - student2.ru . (3.20)

Подставляя в полученное выражение логистическое распределение, получаем после очевидных преобразований следующую систему уравнений:

Методы оценивания моделей бинарного выбора - student2.ru . (3.21)

В случае нормального распределения система уравнений имеет вид

Методы оценивания моделей бинарного выбора - student2.ru . (3.22)

Введение в рассмотрение переменной Методы оценивания моделей бинарного выбора - student2.ru , позволяет переписать эту систему следующим образом:

Методы оценивания моделей бинарного выбора - student2.ru . (3.23)

Полученные системы уравнений нелинейны, и для их решения необходимо применять численные методы. Прежде чем приступить к численному решению следует убедиться в том, что итерационная процедура обеспечивает получение глобального максимума логарифмической функции правдоподобия. Для этого покажем, что эта функция является строго вогнутой, т.е. имеет единственный максимум.

Чтобы убедиться в этом, достаточно показать, что Методы оценивания моделей бинарного выбора - student2.ru и Методы оценивания моделей бинарного выбора - student2.ru являются строго вогнутыми. Из этого, в силу того, что сумма строго вогнутых функций есть строго вогнутая функция, будет следовать, что, и логарифмическая функция правдоподобия строго вогнута.

Основным признаком строгой вогнутости является отрицательность второй производной. Сначала покажем, что этим свойством обладает Методы оценивания моделей бинарного выбора - student2.ru . Последовательно дифференцируя, получаем

Методы оценивания моделей бинарного выбора - student2.ru ; (3.24)

Методы оценивания моделей бинарного выбора - student2.ru . (3.25)

В соответствии с полученными выражениями для логистической функции имеем

Методы оценивания моделей бинарного выбора - student2.ru ; (3.26)

Методы оценивания моделей бинарного выбора - student2.ru

Методы оценивания моделей бинарного выбора - student2.ru ; (3.27)

Методы оценивания моделей бинарного выбора - student2.ru . (3.28)

Строгая вогнутость Методы оценивания моделей бинарного выбора - student2.ru доказана. Так как Методы оценивания моделей бинарного выбора - student2.ru в случае логистической функции симметрична Методы оценивания моделей бинарного выбора - student2.ru , то она тоже строго вогнута. Следовательно, логарифмическая функция правдоподобия, представляющая собой сумму строго вогнутых функций, сама является строго вогнутой, и применение градиентной процедуры приводит к получению единственного решения.

В случае, когда Методы оценивания моделей бинарного выбора - student2.ru является функцией нормального распределения, результат тот же самый – логарифмическая функция правдоподобия строго вогнута. Таким образом, численное решение системы (3.21) или (3.23) приводит к получению оценок, максимизирующих соответствующие функции правдоподобия.

3.2.2. Численное решение с помощью метода Ньютона – Рафсона.Рассмотрим построенную на основе метода Ньютона – Рафсона вычислительную схему решения нелинейной системы уравнений

Методы оценивания моделей бинарного выбора - student2.ru . (3.29)

Все детали этой схемы будут изложены без уточнения, на основе какого распределения была построена функция правдоподобия.

Считая левую часть системы (3.29) дифференцируемой вектор-функцией (для исследуемых здесь распределений это действительно так), запишем отрезок ряда Тейлора, являющегося линейной аппроксимацией этой функции в окрестности некоторой точки Методы оценивания моделей бинарного выбора - student2.ru

Методы оценивания моделей бинарного выбора - student2.ru . (3.30)

Производная по Методы оценивания моделей бинарного выбора - student2.ru обозначает производную по Методы оценивания моделей бинарного выбора - student2.ru , вычисленную в точке Методы оценивания моделей бинарного выбора - student2.ru . Саму точку Методы оценивания моделей бинарного выбора - student2.ru будем считать начальным приближением искомой оценки. Ее значение можно определить как вектор параметров линейной регрессии

Методы оценивания моделей бинарного выбора - student2.ru , (3.31)

оцененных с помощью метода наименьших квадратов, т.е.

Методы оценивания моделей бинарного выбора - student2.ru . (3.32)

Обозначив произвольную точку окрестности через Методы оценивания моделей бинарного выбора - student2.ru и помня, что нашей целью является нахождение такого вектора параметров, который обращает первую производную в ноль, целесообразно записать

Методы оценивания моделей бинарного выбора - student2.ru . (3.33)

Раскрывая круглые скобки и перенося влево член, содержащий Методы оценивания моделей бинарного выбора - student2.ru , а затем, умножая обе части уравнения на обратную матрицу, получаем выражение, задающее итерационный процесс нахождения искомого решения

Методы оценивания моделей бинарного выбора - student2.ru . (3.34)

Вектор Методы оценивания моделей бинарного выбора - student2.ru является первой оценкой искомых параметров. Вычисляя значения производных во вновь получаемых точках, и продолжая итерационный процесс по рекуррентной формуле

Методы оценивания моделей бинарного выбора - student2.ru , (3.35)

получаем последовательность Методы оценивания моделей бинарного выбора - student2.ru . Если предел этой последовательности равен Методы оценивания моделей бинарного выбора - student2.ru , то этот предел есть искомое решение системы, так как соотношение

Методы оценивания моделей бинарного выбора - student2.ru (3.36)

имеет смысл при

Методы оценивания моделей бинарного выбора - student2.ru . (3.37)

Следовательно, полученное решение является также и оценкой максимального правдоподобия.

3.2.3. Итерационная схема обобщенного МНК (метод Берксона).В некоторых ситуациях появляется возможность для оценки параметров логит- и пробит-моделей применять метод наименьших квадратов [16]. Подобная ситуация возникает в случае «повторяющихся» (или группированных) статистических наблюдений, имеющих структуру вида

Методы оценивания моделей бинарного выбора - student2.ru

Методы оценивания моделей бинарного выбора - student2.ru (3.38)

. . . . . . . . . . .

Методы оценивания моделей бинарного выбора - student2.ru

В каждой k-ойгруппе наборы независимых переменных равны между собой, т.е. Методы оценивания моделей бинарного выбора - student2.ru , где Методы оценивания моделей бинарного выбора - student2.ru . Фактически имеет место ситуация, когда в выборке имеется по несколько наблюдений зависимой переменной y соответствующих одним и тем же значениям объясняющих переменных (либо в группе все наборы объясняющих переменных, в силу того, что мало отличаются друг от друга, заменены одним и тем же набором с усредненными значениями Методы оценивания моделей бинарного выбора - student2.ru ).

В этом случае функция правдоподобия приобретает следующий вид:

Методы оценивания моделей бинарного выбора - student2.ru

Методы оценивания моделей бинарного выбора - student2.ru . (3.39)

Если все Методы оценивания моделей бинарного выбора - student2.ru достаточно велики, то можно вместо максимизации логарифмической функции правдоподобия для получения оценок параметров модели применить схему метода взвешенных наименьших квадратов. С этой целью перейдем от исходного набора наблюдений можно к наблюдениям вида

Методы оценивания моделей бинарного выбора - student2.ru , (3.40)

где Методы оценивания моделей бинарного выбора - student2.ru – относительная частота события, состоящего в том, что зависимая переменная примет значение равное единице при значениях объясняющих переменных, равных Методы оценивания моделей бинарного выбора - student2.ru .

В соответствии с теоремой Бернулли относительная частота Методы оценивания моделей бинарного выбора - student2.ru связана с истинным значением вероятности Методы оценивания моделей бинарного выбора - student2.ru неравенством

Методы оценивания моделей бинарного выбора - student2.ru , (3.41)

которое позволяет записать соотношение

Методы оценивания моделей бинарного выбора - student2.ru . (3.42)

Случайная составляющая Методы оценивания моделей бинарного выбора - student2.ru имеет нулевое математическое ожидание Методы оценивания моделей бинарного выбора - student2.ru и дисперсию равную Методы оценивания моделей бинарного выбора - student2.ru .

Таким образом, соотношение для относительной частоты можно рассматривать как нелинейную регрессию с гетероскедастичными (т.е. имеющими не равные дисперсии) остатками. Параметры такой регрессии оцениваются с помощью итерационной вычислительной процедуры минимизирующей взвешенную сумму квадратов

Методы оценивания моделей бинарного выбора - student2.ru Методы оценивания моделей бинарного выбора - student2.ru . (3.43)

Упростить построение нелинейной регрессии можно в том случае, если удается подобрать такое преобразование, которое позволяет заменить нелинейную модель линейной, которая эквивалентна исходной в смысле совпадения оцениваемых параметров. Таким преобразованием является функция Методы оценивания моделей бинарного выбора - student2.ru обратная функции распределения вероятности соответствующего закона. Если операцию обращения применить к (3.42), то получается соотношение

Методы оценивания моделей бинарного выбора - student2.ru , (3.44)

представляющее собой линейную регрессию, обоснованность которой приводится ниже.

Промежуточное представление при переходе от (3.42) к (3.44)

Методы оценивания моделей бинарного выбора - student2.ru (3.45)

можно в окрестности точки Методы оценивания моделей бинарного выбора - student2.ru разложить в ряд Тейлора, и ограничившись точностью первого порядка, записать следующим образом:

Методы оценивания моделей бинарного выбора - student2.ru , (3.46)

где

Методы оценивания моделей бинарного выбора - student2.ru ,

а остаточный член легко преобразуется к виду

Методы оценивания моделей бинарного выбора - student2.ru . (3.47)

В преобразованном остаточном члене величина Методы оценивания моделей бинарного выбора - student2.ru равна значению функции плотности закона распределения вероятности Методы оценивания моделей бинарного выбора - student2.ru в точке Методы оценивания моделей бинарного выбора - student2.ru .

Введение обозначений Методы оценивания моделей бинарного выбора - student2.ru и Методы оценивания моделей бинарного выбора - student2.ru позволяет записать уравнение регрессии (3.44). Зависимая переменная в этом уравнение представляет собой квантиль уровня Методы оценивания моделей бинарного выбора - student2.ru функции распределения Методы оценивания моделей бинарного выбора - student2.ru . Случайные составляющие Методы оценивания моделей бинарного выбора - student2.ru имеют нулевые математические ожидания Методы оценивания моделей бинарного выбора - student2.ru и неравные дисперсии Методы оценивания моделей бинарного выбора - student2.ru .

В результате проведенных преобразований задача построения нелинейных логит- и пробит-моделей свелась к оценке параметров линейной функции регрессии с гетероскедастичными остатками. В качестве зависимых переменных в этих функциях регрессии используются квантили соответствующих распределений. В логит-моделях для расчета квантиля используется функция

Методы оценивания моделей бинарного выбора - student2.ru , (3.48)

которая является решением уравнения

Методы оценивания моделей бинарного выбора - student2.ru (3.49)

относительно Методы оценивания моделей бинарного выбора - student2.ru , т.е. действительно определяет квантиль уровня Методы оценивания моделей бинарного выбора - student2.ru .

В пробит-моделях значения зависимой переменной Методы оценивания моделей бинарного выбора - student2.ru определяются в виде табличных квантилей уровня Методы оценивания моделей бинарного выбора - student2.ru стандартного нормального распределения.

После преобразования моделей к линейному виду их построение осложняется только гетероскедастичностью остатков Методы оценивания моделей бинарного выбора - student2.ru . Как известно, избежать возможного искажения коэффициентов удается путем применения взвешенного метода наименьших квадратов. В качестве весовых коэффициентов в этом методе используются величины, обратные дисперсии соответствующих остатков Методы оценивания моделей бинарного выбора - student2.ru . Для логит-модели весовые коэффициенты определяются из соотношения

Методы оценивания моделей бинарного выбора - student2.ru

Методы оценивания моделей бинарного выбора - student2.ru . (3.50)

Таким образом, оценка параметров логит-модели сводится к решению оптимизационной задачи вида

Методы оценивания моделей бинарного выбора - student2.ru , (3.51)

где Методы оценивания моделей бинарного выбора - student2.ru рассчитано по формуле (5.3.10), Методы оценивания моделей бинарного выбора - student2.ru определяется в соответствии с (3.50).

Оценка параметров Методы оценивания моделей бинарного выбора - student2.ru пробит-модели сводится к решению этой же оптимизационной задачи, но с другими значениями зависимой переменной и другими весовыми коэффициентами. Для пробит-модели значения зависимой переменной Методы оценивания моделей бинарного выбора - student2.ru определяются в виде табличных квантилей уровня Методы оценивания моделей бинарного выбора - student2.ru стандартного нормального распределения, а весовые коэффициенты Методы оценивания моделей бинарного выбора - student2.ru определяются по формуле

Методы оценивания моделей бинарного выбора - student2.ru , (3.52)

в которой Методы оценивания моделей бинарного выбора - student2.ru – функция плотности, а Методы оценивания моделей бинарного выбора - student2.ru – функция распределения стандартного нормального закона вероятности.

При фиксированных значениях весовых коэффициентов Методы оценивания моделей бинарного выбора - student2.ru решение оптимизационной задачи (3.51) легко получается с помощью обобщенной процедуры метода наименьших квадратов. Однако в рассматриваемом здесь случае веса Методы оценивания моделей бинарного выбора - student2.ru зависят от оцениваемых параметров Методы оценивания моделей бинарного выбора - student2.ru и решение оптимизационной задачи можно получить, применив итерационную процедуру. На первом шаге этой процедуры оптимизация (3.51) проводится с помощью обобщенного метода наименьших квадратов при Методы оценивания моделей бинарного выбора - student2.ru . Полученные оценки Методы оценивания моделей бинарного выбора - student2.ru используются для подсчета по соответствующим формулам весовых коэффициентов Методы оценивания моделей бинарного выбора - student2.ru или Методы оценивания моделей бинарного выбора - student2.ru в зависимости от модели (логит-модель или пробит-модель). Эти новые коэффициенты используются в обобщенном методе наименьших квадратов на следующем шаге итерационной процедуры для получения оценок Методы оценивания моделей бинарного выбора - student2.ru . Итерационная процедура продолжается до тех пор, пока пересчитанные весовые коэффициенты очередного шага не совпадут до определенного знака после запятой с весовыми коэффициентами предыдущего шага.

Подобного рода итерационные процедуры используются во многих статистических пакетах. В частности, возможность построения моделей бинарного выбора с использованием итерационной процедуры реализована, например, в пакетах Eviews и Statistica.

Наши рекомендации