Оценка качества пробит- и логит-моделей

3.3.1. Адекватность. Оценка качества регрессионных моделей с бинарной зависимой переменной осуществляется практически по той же схеме, что и качество обычной линейной регрессии: определяется пригодность модели в целом, затем определяется статистическая значимость каждого коэффициента модели и, наконец, проверяются гипотезы (если они имеют место), относительно ограничений, которым могут удовлетворять отдельные группы параметров.

Пригодность модели в целом (адекватность) определяется с помощью двух показателей. В качестве первого рассмотрим предложенный Макфадденом (McFadden) индекс отношения правдоподобия

Оценка качества пробит- и логит-моделей - student2.ru , (3.53)

где Оценка качества пробит- и логит-моделей - student2.ru – максимальное значение логарифмической функции правдоподобия, достигаемое в точке, координаты которой равны оценкам параметров модели Оценка качества пробит- и логит-моделей - student2.ru , а Оценка качества пробит- и логит-моделей - student2.ru – значение логарифмической функции правдоподобия, вычисленное в предположении, что Оценка качества пробит- и логит-моделей - student2.ru . (Во многих пакетах предусмотрен расчет этих значений функции правдоподобия).

Интуиция подсказывает, что значения такого критерия должны быть заключены между 0 и 1. Действительно, в случае, когда все коэффициенты кроме Оценка качества пробит- и логит-моделей - student2.ru , равны нулю, индекс отношения правдоподобия тоже равен нулю. Если же модель оказалась такой, что ее расчетные значения Оценка качества пробит- и логит-моделей - student2.ru в точности совпадают с наблюдаемыми значениями Оценка качества пробит- и логит-моделей - student2.ru , т.е. имеют место только случаи или Оценка качества пробит- и логит-моделей - student2.ru , или Оценка качества пробит- и логит-моделей - student2.ru , то индекс Оценка качества пробит- и логит-моделей - student2.ru . О такой модели принято говорить, что она совершенно согласована. В остальных случаях значение Оценка качества пробит- и логит-моделей - student2.ru заключено между 0 и 1, причем, чем больше совпадений между расчетными и фактическими значениями, тем ближе значение индекса к 1. К сожалению, случаи, когда значения индекса заключены между нулем и единицей, не имеют собственной интерпретации. Даже в случае, когда построенная модель идентична истинной функции распределения вероятностей она не является совершенно согласованной.

Второй критерий принято называть псевдо (pseudo) Оценка качества пробит- и логит-моделей - student2.ru . Его расчет осуществляется по формуле

Оценка качества пробит- и логит-моделей - student2.ru . (3.54)

Как и в случае индекса Оценка качества пробит- и логит-моделей - student2.ru псевдо Оценка качества пробит- и логит-моделей - student2.ru равен 0, когда все коэффициенты модели, кроме Оценка качества пробит- и логит-моделей - student2.ru , равны нулю. Его значение приближается к 1 по мере того, как увеличивается разность между Оценка качества пробит- и логит-моделей - student2.ru и Оценка качества пробит- и логит-моделей - student2.ru , но самой 1 не достигает. Чем ближе к 1 значение псевдо Оценка качества пробит- и логит-моделей - student2.ru , тем точнее модель воспроизводит фактические значения бинарной переменной.

3.3.2. Статистическая значимость коэффициентов. Проверка статистической значимости отдельных коэффициентов модели осуществляется с помощью статистики Вальда. Для вычисления ее значения необходимо иметь стандартные ошибки коэффициентов модели. Стандартные ошибки, как и в случае линейной регрессии, определяются по диагональным элементам ковариационной матрицы оценок Оценка качества пробит- и логит-моделей - student2.ru . Но прежде, чем перейти к определению значимости, исследуем вопрос состоятельности и асимптотической нормальности этих оценок.

Известно, что решение любого из уравнений правдоподобия (3.1) или (3.2), даже если оно существует, не обязательно имеет хорошие асимптотические свойства. Желаемые состоятельность и асимптотическая нормальность обеспечены только в том случае, когда выполняются определенные условия, налагаемые на поведение объясняющих переменных в генеральной совокупности. Существуют два подхода к этой проблеме:

1) полагают, что объясняющие переменные являются стохастическими. Тогда налагаемые на них условия предстают в форме «все хi являются независимыми, одинаково распределенными случайными переменными, для которых существуют моменты достаточно высокого порядка»;

2) полагают, что объясняющие переменные фиксированы. В этом случае условия будут следующими:

§ для зависимой переменной Оценка качества пробит- и логит-моделей - student2.ru существует асимптотическая матрица вариации-ковариации;

§ значения независимых переменных Оценка качества пробит- и логит-моделей - student2.ru ограничены, то есть всегда найдутся такие константы m, M; m > -¥, M < ¥, что: Оценка качества пробит- и логит-моделей - student2.ru

Если одно из этих условий выполнено, то при достаточно больших n оценка Оценка качества пробит- и логит-моделей - student2.ru существует и сходится по вероятности к истинному значению b. Ковариационная матрица этой оценки равняется матрице, обратной к информационной матрице Фишера, которая представляет собой математическое ожидание Гессиана, взятое с обратным знаком

Оценка качества пробит- и логит-моделей - student2.ru . (3.55)

Предполагается, что математическое ожидание здесь берется условно по х .

Таким образом, при выполнении выше сформулированных условий можно считать, что оценка вектора коэффициентов модели, полученная с помощью метода максимального правдоподобия, является асимптотически нормальной, т.е.

Оценка качества пробит- и логит-моделей - student2.ru . (3.56)

Как нетрудно понять асимптотическая матрица ковариации зависит от неизвестного параметра b. Поэтому непосредственное использование ее в практических расчетах исключено. Рекомендации здесь те же самые, что и при использовании обычной регрессии – неизвестные параметры, присутствующие в матрице следует заменить соответствующими оценками. Руководствуясь этим общим правилом, можно записать

Оценка качества пробит- и логит-моделей - student2.ru (3.57)

и использовать в практических расчетах не ковариационную матрицу, а ее оценку.

Рассмотрим детально, каким образом может быть получена оценка этой матрицы. Для этого вычислим матрицу вторых производных (Гессиан)

Оценка качества пробит- и логит-моделей - student2.ru

Оценка качества пробит- и логит-моделей - student2.ru Оценка качества пробит- и логит-моделей - student2.ru (3.58)

где F = F(xib) и f =f(xib).

Для получения информационной матрицы Фишера необходимо Гессиан умножить на минус единицу и взять математическое ожидание. Используя тот факт, что E(yi) = F(xib), и, проведя несложные преобразования, получаем:

Оценка качества пробит- и логит-моделей - student2.ru (3.59)

Соответственно асимптотическая матрица вариации-ковариации Оценка качества пробит- и логит-моделей - student2.ru примет вид:

Оценка качества пробит- и логит-моделей - student2.ru (3.60)

а ее оценка равна

Оценка качества пробит- и логит-моделей - student2.ru (3.61)

Корни квадратные из диагональных элементов этой матрицы Оценка качества пробит- и логит-моделей - student2.ru являются стандартными ошибками соответствующих оценок Оценка качества пробит- и логит-моделей - student2.ru . Их используют для получения статистики Вальда

Оценка качества пробит- и логит-моделей - student2.ru , Оценка качества пробит- и логит-моделей - student2.ru . (3.62)

В случае логит-модели, для которой Оценка качества пробит- и логит-моделей - student2.ru , матрица Фишера упрощается

Оценка качества пробит- и логит-моделей - student2.ru (3.63)

Кроме того, матрицу Фишера можно представить в более компактной и более удобной для расчетов форме.

С этой целью обозначим через Оценка качества пробит- и логит-моделей - student2.ru матрицу наблюдений за экзогенными переменными, дополненную столбцом из единиц и имеющую размер Оценка качества пробит- и логит-моделей - student2.ru . По-прежнему Оценка качества пробит- и логит-моделей - student2.ru будет обозначать Оценка качества пробит- и логит-моделей - student2.ru -ую строку матрицы наблюдений. Далее через Оценка качества пробит- и логит-моделей - student2.ru обозначим диагональную матрицу Оценка качества пробит- и логит-моделей - student2.ru -го порядка, у которой Оценка качества пробит- и логит-моделей - student2.ru -ый элемент диагонали имеет следующий вид:

Оценка качества пробит- и логит-моделей - student2.ru . (3.64)

Тогда информационная матрица Фишера может быть записана следующим образом:

Оценка качества пробит- и логит-моделей - student2.ru . (3.65)

Ковариационная матрица в этом случае равна

Оценка качества пробит- и логит-моделей - student2.ru . (3.66)

Такая форма ковариационной матрицы напоминает обобщенную оценку наименьших квадратов.

3.3.3. Стандартные ошибки предсказанных вероятностей и предельных эффектов. Расчетные значения Оценка качества пробит- и логит-моделей - student2.ru , получаемые с помощью оцененных пробит- и логит моделей, представляют собой вероятности того, что переменная Оценка качества пробит- и логит-моделей - student2.ru примет значение 1 или 0. Возможные изменения этих вероятностей в зависимости от факторов оцениваются частными предельными эффектами

Оценка качества пробит- и логит-моделей - student2.ru . (3.67)

Это именно те характеристики, которые подлежат интерпретации и практическому использованию. Чтобы иметь представление о надежности выводов полученных на основе результатов моделирования необходимо иметь оценки стандартных ошибок этих характеристик. Получить оценки стандартных ошибок можно с помощью дельта метода [63].

Для расчетной вероятности Оценка качества пробит- и логит-моделей - student2.ru дельта-метод позволяет записать асимптотическую величину стандартной ошибки в виде

Оценка качества пробит- и логит-моделей - student2.ru , (3.68)

где Оценка качества пробит- и логит-моделей - student2.ru – асимптотическая ковариационная матрица оценки Оценка качества пробит- и логит-моделей - student2.ru и производная вычислена в точке, компоненты которой совпадают с компонентами оценки Оценка качества пробит- и логит-моделей - student2.ru .

Заметим, что доступность практического использования данной формулы гарантируется тем, что асимптотическую ковариационную матрицу в ней, следуя рекомендациям предыдущего параграфа, можно заменить оценкой Оценка качества пробит- и логит-моделей - student2.ru

Чтобы сделать эту формулу более удобной для расчетов, проведем ее преобразование. С этой целью введем обозначение: Оценка качества пробит- и логит-моделей - student2.ru . Тогда вектор производных может быть представлен следующим образом:

Оценка качества пробит- и логит-моделей - student2.ru . (3.69)

Замена в (3.68) вектора производных на (3.69) позволяет записать выражение для стандартной ошибки расчетной вероятности Оценка качества пробит- и логит-моделей - student2.ru в более компактной форме

Оценка качества пробит- и логит-моделей - student2.ru . (3.70)

Стандартная ошибка зависит от вектора, по которому рассчитывалась вероятность.

Теперь перейдем к рассмотрению предельных эффектов. Для удобства введем обозначение Оценка качества пробит- и логит-моделей - student2.ru . Тогда асимптотическая ковариационная матрица предельных эффектов может быть записана в виде:

Оценка качества пробит- и логит-моделей - student2.ru . (3.71)

Для дальнейших преобразований матрицу производных представим в виде суммы

Оценка качества пробит- и логит-моделей - student2.ru . (3.72)

В полученном выражении вычисление производной Оценка качества пробит- и логит-моделей - student2.ru привело к единичной матрице, а вычисление Оценка качества пробит- и логит-моделей - student2.ru – к вектор-строке Оценка качества пробит- и логит-моделей - student2.ru .

Для пробит-модели, если учесть, что Оценка качества пробит- и логит-моделей - student2.ru , (3.72) переписывается следующим образом:

Оценка качества пробит- и логит-моделей - student2.ru . (3.73)

В случае логит-модели плотность вероятности Оценка качества пробит- и логит-моделей - student2.ru может быть записана через функцию распределения Оценка качества пробит- и логит-моделей - student2.ru как Оценка качества пробит- и логит-моделей - student2.ru . Для краткости мы будем писать Оценка качества пробит- и логит-моделей - student2.ru , полагая Оценка качества пробит- и логит-моделей - student2.ru . Дифференцируя это выражение по Оценка качества пробит- и логит-моделей - student2.ru , получаем

Оценка качества пробит- и логит-моделей - student2.ru . (3.74)

Подставляя полученное выражение в (3.72), получаем стандартные ошибки предельных эффектов логит-модели

Оценка качества пробит- и логит-моделей - student2.ru . (3.75)

Стандартные ошибки предельных эффектов, так же как и стандартные ошибки расчетных вероятностей зависят от вектора экзогенных переменных.

3.3.4. Тесты для проверки линейных гипотез.Описанные выше алгоритмы дают оценки, которые являются асимптотически нормальными при стремлении размера выборки к бесконечности. Асимптотическая нормальность оценок обеспечивает корректность проверки линейных гипотез относительно коэффициентов модели. Опорным элементом всех статистиках, используемых в этих тестах, является информационная матрица Фишера. Способ получения асимптотической оценки этой матрицы был рассмотрен выше. Поэтому в дальнейшем изложении предполагается, что матрица Фишера нам известна.

Во всех тестах проверяется нулевая гипотеза, формальная запись которой имеет следующий вид:

Оценка качества пробит- и логит-моделей - student2.ru , (3.76)

где Оценка качества пробит- и логит-моделей - student2.ru – вектор тестируемых параметров;

Оценка качества пробит- и логит-моделей - student2.ru – матрица (размером Оценка качества пробит- и логит-моделей - student2.ru ), задающая структуру ограничений,

Оценка качества пробит- и логит-моделей - student2.ru – вектор (размером Оценка качества пробит- и логит-моделей - student2.ru ) правой части ограничивающих условий.

Все ниже рассматриваемые тесты асимптотически эквивалентны и, следовательно, обеспечивают получение одних и тех же выводов. Поэтому выбор того или иного теста диктуется только конкретной ситуацией и удобством применения в ней.

Тест Вальда. В соответствии спредположением, лежащим в основе теста Вальда, вектор оценок Оценка качества пробит- и логит-моделей - student2.ru при выполнении нулевой гипотезы должен быть близок к Оценка качества пробит- и логит-моделей - student2.ru .

В силу асимптотической нормальности Оценка качества пробит- и логит-моделей - student2.ru в тех случаях, когда имеет место нулевая гипотеза ( Оценка качества пробит- и логит-моделей - student2.ru ), случайное отклонение Оценка качества пробит- и логит-моделей - student2.ru нормально распределено, т.е.

Оценка качества пробит- и логит-моделей - student2.ru , (3.77)

где Оценка качества пробит- и логит-моделей - student2.ru – матрица вариации-ковариации Оценка качества пробит- и логит-моделей - student2.ru , вычисляемая как обратная к информационной матрице Фишера.

Статистика Вальда в этом случае имеет вид

Оценка качества пробит- и логит-моделей - student2.ru . (3.78)

В силу свойств нормального распределения статистика Оценка качества пробит- и логит-моделей - student2.ru имеет распределение Оценка качества пробит- и логит-моделей - student2.ru , и проверка нулевой гипотезы осуществляется по правилу

Оценка качества пробит- и логит-моделей - student2.ru

Рассмотрим пример, иллюстрирующий технику проверки предположений относительно коэффициентов модели с помощью теста Вальда. Пусть, например, методом максимального правдоподобия получен вектор оценок Оценка качества пробит- и логит-моделей - student2.ru и требуется проверить предположение о том, что Оценка качества пробит- и логит-моделей - student2.ru , а Оценка качества пробит- и логит-моделей - student2.ru . В этом случае нулевая гипотеза записывается следующим образом:

Оценка качества пробит- и логит-моделей - student2.ru

Если проверяется статистическая значимость отдельного коэффициента модели, например Оценка качества пробит- и логит-моделей - student2.ru , то, как нетрудно понять, нулевая гипотеза записывается в виде

Оценка качества пробит- и логит-моделей - student2.ru ,

и статистика Вальда после выполнения всех перемножений оказывается равной квадрату t–статистики

Оценка качества пробит- и логит-моделей - student2.ru Оценка качества пробит- и логит-моделей - student2.ru , (3.79)

где Оценка качества пробит- и логит-моделей - student2.ru – соответствующий диагональный элемент матрицы Оценка качества пробит- и логит-моделей - student2.ru .

Есть и другая схема вычисления статистики Вальда. Ее использование удобно в тех случаях, когда проверяется только статистическая значимость некоторых коэффициентов, т.е. проверяется гипотеза о равенстве их нулю.

Будем считать, что независимые переменные упорядочены таким образом, что проверка этой гипотезы касается первых Оценка качества пробит- и логит-моделей - student2.ru коэффициентов. Для дальнейшего изложения этой схемы разделим вектор коэффициентов на две группы

Оценка качества пробит- и логит-моделей - student2.ru ,

где b1 – q-мерный вектор, а b2 включает (m – q) элементов. В этом случае проверяется нуль-гипотеза вида

H0: {b1 =0}. (3.80)

Проверке подвергаются оценки, полученные путем максимизации функции правдоподобия Оценка качества пробит- и логит-моделей - student2.ru без каких-либо ограничений на оцениваемые коэффициенты модели. Полученные оценки, как отмечалось выше, состоятельны и асимптотически нормальны, т.е.

Оценка качества пробит- и логит-моделей - student2.ru (3.81)

Обращая информационную матрицу, представленную в блочном виде, по частям, получаем для подвектора Оценка качества пробит- и логит-моделей - student2.ru матрицу вариации-ковариации

Оценка качества пробит- и логит-моделей - student2.ru (3.82)

Статистика Вальда в этом случае рассчитывается по формуле

Оценка качества пробит- и логит-моделей - student2.ru , (3.83)

и нуль-гипотеза отвергается или нет по результатам сравнения с критическим значением Оценка качества пробит- и логит-моделей - student2.ru .

Особенность теста Вальда в том, что в нем используются оценки, которые вычислены без учета ограничений, которые постулируются в нуль-гипотезе. Это безусловное достоинство теста, так как для его реализации не требуется проведения дополнительных расчетов.

Тест отношения правдоподобия. В отличие от процедуры Вальда, реализация этого теста требует расчетов, связанных с максимизацией функции правдоподобия без учета ограничений и с учетом ограничений на коэффициенты модели.

Вектор оценок с учетом ограничений имеет вид

Оценка качества пробит- и логит-моделей - student2.ru (3.84)

где Оценка качества пробит- и логит-моделей - student2.ru является результатом максимизации Оценка качества пробит- и логит-моделей - student2.ru по b2. Полученная таким образом оценка является состоятельной и асимптотически нормальной:

Оценка качества пробит- и логит-моделей - student2.ru (3.85)

Используемая в тесте статистика основана на сравнении двух оценок максимального правдоподобия, полученных максимизацией ограниченной (с учетом ограничений) и неограниченной (без учета ограничений) функции правдоподобия, т.е.

Оценка качества пробит- и логит-моделей - student2.ru . (3.86)

Статистика имеет распределение Оценка качества пробит- и логит-моделей - student2.ru . Поэтому решение о том, отвергнуть или нет нулевую гипотезу, принимается аналогично тому, как это делалось в процедуре Вальда.

Тест множителей Лагранжа. Применение этого теста не вызывает затруднений в случае линейных регрессионных моделей. Там понятно, как определить множители Лагранжа и использовать их для расчета статистики. В случае бинарных моделей определение множителей Лагранжа не совсем простая процедура. Поэтому построение статистики основано на других принципах.

Если нулевая гипотеза верна, то две оценки неограниченная Оценка качества пробит- и логит-моделей - student2.ru и ограниченная Оценка качества пробит- и логит-моделей - student2.ru должны быть очень близки. Из близости оценок следует близость уравнений правдоподобия, решение которых позволило получить эти оценки.

Причем, неограниченная оценка Оценка качества пробит- и логит-моделей - student2.ru получена как решение системы уравнений

Оценка качества пробит- и логит-моделей - student2.ru

(3.87)

а ограниченная Оценка качества пробит- и логит-моделей - student2.ru – как решение той же самой системы, но с учетом ограничения Оценка качества пробит- и логит-моделей - student2.ru

Оценка качества пробит- и логит-моделей - student2.ru (3.88)

Обе системы уравнений представляют собой математические ожидания соответствующих уравнений правдоподобия. Взятие математического ожидания в данном случае эквивалентно замене каждой случайной величины Оценка качества пробит- и логит-моделей - student2.ru ее ожидаемым значением Оценка качества пробит- и логит-моделей - student2.ru или Оценка качества пробит- и логит-моделей - student2.ru , соответственно. Причем, значения самих производных вычислены в точке Оценка качества пробит- и логит-моделей - student2.ru .

Для рассматриваемого случая статистика множителей Лагранжа записывается следующим образом:

Оценка качества пробит- и логит-моделей - student2.ru . (3.89)

Она является асимптотически эквивалентной статистике Вальда Оценка качества пробит- и логит-моделей - student2.ru и статистике отношения правдоподобия Оценка качества пробит- и логит-моделей - student2.ru и имеет распределение Оценка качества пробит- и логит-моделей - student2.ru . Решение, отвергнуть нулевую гипотезу или нет, принимается по результатам сравнения с критическим значением Оценка качества пробит- и логит-моделей - student2.ru , т.е. процедура сравнения проводится точно так же, как это описано в тесте Вальда.

Можно значительно упростить процедуру расчета статистики множителей Лагранжа, сведя ее к построению регрессионного уравнения. Правда, для этого необходимо провести ряд не совсем простых преобразований, которые приведут к упрощенной схеме. Начнем с того, что Оценка качества пробит- и логит-моделей - student2.ru являясь частью матрицы, обратной информационной матрице Фишера, позволяет записать статистику множителей Лагранжа в эквивалентном виде

Оценка качества пробит- и логит-моделей - student2.ru (3.90)

Теперь вставим индивидуальные наблюдения в уравнение правдоподобия, которое после этой операции будет записываться как сумма логарифмов

Оценка качества пробит- и логит-моделей - student2.ru (3.91)

Если наблюдения не коррелированны между собой, то можно показать, что информационная матрица Фишера представима в виде произведения производных первого порядка. Первая производная равна

Оценка качества пробит- и логит-моделей - student2.ru

Оценка качества пробит- и логит-моделей - student2.ru . (3.92)

Соответственно вторая производная может быть записана как

Оценка качества пробит- и логит-моделей - student2.ru

Оценка качества пробит- и логит-моделей - student2.ru Оценка качества пробит- и логит-моделей - student2.ru . (3.93)

Выполним операцию взятия математического ожидания путем замены Оценка качества пробит- и логит-моделей - student2.ru на Оценка качества пробит- и логит-моделей - student2.ru ( Оценка качества пробит- и логит-моделей - student2.ru )

Оценка качества пробит- и логит-моделей - student2.ru .

В результате проведенного преобразования взаимно уничтожаются слагаемые, содержащие Оценка качества пробит- и логит-моделей - student2.ru

Оценка качества пробит- и логит-моделей - student2.ru .

Если в преобразованном выражении убрать оператор ожидания, т.е. в числителе снова вернуться к Оценка качества пробит- и логит-моделей - student2.ru

Оценка качества пробит- и логит-моделей - student2.ru

то получаем выражение, отрицательное значение которого представимо в виде суммы произведений

Оценка качества пробит- и логит-моделей - student2.ru =

Оценка качества пробит- и логит-моделей - student2.ru . (3.94)

Возможность такого представления непосредственно следует из того, что Оценка качества пробит- и логит-моделей - student2.ru и Оценка качества пробит- и логит-моделей - student2.ru , а правильность проверяется непосредственным перемножением.

Таким образом, состоятельная оценка информационной матрицы Фишера может быть представлена в виде

Оценка качества пробит- и логит-моделей - student2.ru . (3.95)

Используя полученную оценку информационной матрицы, запишем статистику множителей Лагранжа

Оценка качества пробит- и логит-моделей - student2.ru

Оценка качества пробит- и логит-моделей - student2.ru . (3.96)

Упрощенный расчет этой статистики можно осуществить следующим образом. Обозначим через Оценка качества пробит- и логит-моделей - student2.ru матрицу (размером n x q) из соответствующих значений частных производных первого порядка

Оценка качества пробит- и логит-моделей - student2.ru (3.97)

и через е n-мерный вектор из единиц.

Тогда искусственная линейная регрессия

Оценка качества пробит- и логит-моделей - student2.ru (3.98)

с вектором коэффициентов

Оценка качества пробит- и логит-моделей - student2.ru (3.99)

может использоваться для расчета статистики Оценка качества пробит- и логит-моделей - student2.ru . Коэффициенты такой регрессии легко рассчитываются с помощью любого статистического пакета, а значение статистики равно сумме расчетных значений этой регрессии.

Наши рекомендации