Интервальные оценки коэффициентов регрессии

По аналогии с парной регрессией после опре­деления точечных оценок Интервальные оценки коэффициентов регрессии - student2.ru коэффициентов Интервальные оценки коэффициентов регрессии - student2.ru - (j =0,1,…,m) теоретического уравнения регрессии могут быть рассчитаны ин­тервальные оценки указанных коэффициентов. Для построения интервальной оценки коэффициента Интервальные оценки коэффициентов регрессии - student2.ru строится Интервальные оценки коэффициентов регрессии - student2.ru -статистика

Интервальные оценки коэффициентов регрессии - student2.ru (6.26)

имеющая распределение Стюдента с числом степеней свободы v= n — т — 1 (n— объем выборки, т - количество объясняю­щих переменных в модели)

Пусть необходимо построить 100(1 — Интервальные оценки коэффициентов регрессии - student2.ru )%-й доверительный интервал для коэффициента Интервальные оценки коэффициентов регрессии - student2.ru Тогда по таблице критических точек распределения Стьюдента по требуемому уровню значи­мости а и числу степеней свободы Интервальные оценки коэффициентов регрессии - student2.ru находят критическую точку Удовлетворяющую условию

Интервальные оценки коэффициентов регрессии - student2.ru

Подставляя (6.26) в (6.27), получаем

Интервальные оценки коэффициентов регрессии - student2.ru

или после преобразования

Интервальные оценки коэффициентов регрессии - student2.ru

Напомним, что Интервальные оценки коэффициентов регрессии - student2.ru рассчитывается по формуле

Интервальные оценки коэффициентов регрессии - student2.ru

Таким образом, доверительный интервал, накрывающий с надежностью (1 – Интервальные оценки коэффициентов регрессии - student2.ru ) неизвестное значение параметра Интервальные оценки коэффициентов регрессии - student2.ru Интервальные оценки коэффициентов регрессии - student2.ru , опре­деляется неравенством

Интервальные оценки коэффициентов регрессии - student2.ru

Отметим, что по аналогии с парной регрессией (может быть построена интервальная оценки для среднего значения предсказания:

Интервальные оценки коэффициентов регрессии - student2.ru

В матричной форме это неравенство имеет вид:

Интервальные оценки коэффициентов регрессии - student2.ru

17)Коэффициент детерминации R2. Отличие скорректированного коэффициента детерминации от обычного.

После проверки значимости каждого коэффициента регрес­сии обычно проверяется общее качество уравнения регрессии. Для этой цели, как и в случае парной регрессии, используется

коэффициент детерминации R , который в общем случае рас­считывается по формуле

Интервальные оценки коэффициентов регрессии - student2.ru

Как отмеча­лось, в общем случае Интервальные оценки коэффициентов регрессии - student2.ru . Чем ближе этот коэффициент к единице, тем больше уравнение регрессии объясняет поведение У. Поэтому естественно желание построить регрессию с наи­большим R2.

Для множественной регрессии коэффициент детерминации является неубывающей функцией числа объясняющих пере­менных. Добавление новой объясняющей переменной никогда не уменьшает значение R2. Действительно, каждая следующая объясняющая переменная может лишь дополнить, но никак не сократить информацию, объясняющую поведение зависимой переменной. Это уменьшает (в худшем случае не увеличивает) область неопределенности в поведении У.

Иногда при расчете коэффициента детерминации для полу­чения несмещенных оценок в числителе и знаменателе вычи­таемой из единицы дроби делается поправка на число степеней свободы. Вводится так называемый скорректированный (ис­правленный) коэффициент детерминации:

Интервальные оценки коэффициентов регрессии - student2.ru (6.35)

Можно заметить, что Интервальные оценки коэффициентов регрессии - student2.ru является несмещенной оценкой общей дисперсии — дисперсии отклонений значений переменной У от Интервальные оценки коэффициентов регрессии - student2.ru . При этом число ее степеней сво­боды равно (n — 1). Одна степень свободы теряется при вычис­лении Интервальные оценки коэффициентов регрессии - student2.ru .

В свою очередь Интервальные оценки коэффициентов регрессии - student2.ru является несмещенной оцен­кой остаточной дисперсии — дисперсии случайных отклонений (отклонений точек наблюдений от линии регрессии). Ее число степеней свободы равно (n - m -1). Потеря (m + 1) степени свобо­ды связана с необходимостью решения системы (m + 1) линейно­го уравнения при определении коэффициентов эмпирического уравнения регрессии. Попутно заметим, что несмещенная оцен­ка объясненной дисперсии (дисперсии отклонений точек на ли­нии регрессии от Интервальные оценки коэффициентов регрессии - student2.ru ) имеет число степеней свободы, равное разно­сти степеней свободы общей дисперсии и остаточной дисперсии (n — 1) — (n- m -1) = m.

Соотношение (6.35) может быть представлено в следую­щем виде:

Интервальные оценки коэффициентов регрессии - student2.ru (6.36)

Из (6.36) очевидно, что Интервальные оценки коэффициентов регрессии - student2.ru < R2 для m > 1. С ростом значения m скорректированный коэффициент детерминации Интервальные оценки коэффициентов регрессии - student2.ru рас­тет медленнее, чем (обычный) коэффициент детерминации R2. Другими словами, он корректируется в сторону уменьшения с ростом числа объясняющих переменных. Нетрудно заметить, что Интервальные оценки коэффициентов регрессии - student2.ru = R2 только при R2 = 1. Интервальные оценки коэффициентов регрессии - student2.ru может принимать отрица­тельные значения (например, при R2 = 0).

Доказано, что R увеличивается при добавлении новой объ­ясняющей переменной тогда и только тогда, когда t-статистика для этой переменной по модулю больше единицы. Поэтому до­бавление в модель новых объясняющих переменных осуществ­ляется до тех пор, пока растет скорректированный коэффици­ент детерминации.

Обычно приводятся данные как по R2, так и по Интервальные оценки коэффициентов регрессии - student2.ru , яв­ляющиеся суммарными мерами общего качества уравнения регрессии. Однако не следует абсолютизировать значимость коэффициентов детерминации. Существует достаточно приме­ров неправильно специфицированных моделей, имеющих высо­кие коэффициенты детерминации (обсудим данную ситуацию позже). Поэтому коэффициент детерминации в настоящее вре­мя рассматривается лишь как один из ряда показателей, кото­рый нужно проанализировать, чтобы уточнить строящуюся модель.

18)Анализ статистической значимости коэффициента детерминации R2.

на практике чаще вместо указанной гипотезы про­веряют тесно связанную с ней гипотезу о статистической значи­мости коэффициента детерминации R2:

Интервальные оценки коэффициентов регрессии - student2.ru

Для проверки данной гипотезы используется следующая F-статистика:

Интервальные оценки коэффициентов регрессии - student2.ru (6.38)

Величина F при выполнении предпосылок МНК и при спра­ведливости Но имеет распределение Фишера, аналогичное рас­пределению F-статистики (6.37). Действительно, разделив чис­литель и знаменатель дроби в (6.37) на общую сумму квадратов отклонений Интервальные оценки коэффициентов регрессии - student2.ru , мы получим формулу(6.38);

Интервальные оценки коэффициентов регрессии - student2.ru

Из (6.38) очевидно, что показатели F и R2 равны или не равны нулю одновременно. Если F = 0, то R2 = 0, и линия регрессии Y = Интервальные оценки коэффициентов регрессии - student2.ru является наилучшей по МНК, и, следова­тельно, величина Y линейно не зависит от Интервальные оценки коэффициентов регрессии - student2.ru .Для проверки нулевой гипотезы Интервальные оценки коэффициентов регрессии - student2.ru при заданном уровне значимости Интервальные оценки коэффициентов регрессии - student2.ru по таблицам критических точек распределения Фишера находится критическое значение Интервальные оценки коэффициентов регрессии - student2.ru . Нуле­вая гипотеза отклоняется, если Fнабл > Fкр, Это равносильно тому, что R2 > 0, т.е. R статистически значим.

Анализ статистики F позволяет сделать вывод о том, что для принятия гипотезы об одновременном равенстве нулю всех коэффициентов линейной регрессии коэффициент детермина­ции R2 не должен существенно отличаться от нуля. Его критическое значение уменьшается при росте числа наблюдений и может стать сколь угодно малым.

Пусть, например, при оценке регрессии с двумя объясняющими переменными по 30 наблюдениям R2 = 0,65. Тогда Fнабл= Интервальные оценки коэффициентов регрессии - student2.ru .

По таблицам критических точек распределения Фишера найдем . Интервальные оценки коэффициентов регрессии - student2.ru =3,36; Интервальные оценки коэффициентов регрессии - student2.ru = 5,49. = 25,07 > Fкр как при 5% -м, так и при 1%-м уровне значимости, то нулевая гипотеза в обоих случаях отклоняется.

Если в той же ситуации Интервальные оценки коэффициентов регрессии - student2.ru , то Интервальные оценки коэффициентов регрессии - student2.ru . Предположение о незначимости связи отвергается и здесь.

Отметим, что в случае парной регрессии проверка нулевой гипо­тезы для F-статистики равносильна проверке нулевой гипотезы для t-статистики Интервальные оценки коэффициентов регрессии - student2.ru коэффициента корреляции.

В этом случае F-статистика равна квадрату t-статистики. Самостоятельную значимость коэффициент R2 приобретает в случае множественной линейной регрессии.

Наши рекомендации