Использование F-cтатистики
Однако оценка параметров конкретного уравнения является лишь отдельным этапом длительного и сложного процесса построения эконометрической модели. Первое же оцененное уравнение очень редко является удовлетворительным во всех отношениях. Обычно приходится постепенно подбирать формулу связи и состав объясняющих переменных, анализируя на каждом этапе качество оцененной зависимости. Этот анализ качества включает статистическую и содержательную составляющую. Проверка статистического качества оцененного уравнения состоит из следующих элементов:
• проверка статистической значимости каждого коэффициента уравнения регрессии;
• проверка общего качества уравнения регрессии;
• проверка свойств данных, выполнение которых предполагалось
при оценивании уравнения.
Под содержательной составляющей анализа качества понимается рассмотрение экономического смысла оцененного уравнения регрессии: действительно ли значимыми оказались объясняющие факторы, важные с точки зрения теории; положительны или отрицательны коэффициенты, показывающие направление воздействия этих факторов; попали ли оценки коэффициентов регрессии в предполагаемые из теоретических соображений интервалы. Рассмотрим оценку общего качества уравнения.
Если существует статистически значимая линейная связь величин х и у, то коэффициент R2 близок к единице. Однако он может быть близким к единице просто в силу того, что обе эти величины имеют выраженный временной тренд, не связанный с их причинно-следственной взаимозависимостью. Точную границу приемлемости показателя R2 указать сразу для всех случаев невозможно. Нужно принимать во внимание и число степеней свободы уравнения, и наличие трендов переменных, и содержательную интерпретацию уравнения. Для определения статистической значимости коэффициента детерминации R2 проверяется нулевая гипотеза для F-статистики, рассчитываемой по формуле:
F= , где m - число объясняющих переменных, n- число наблюдений.
Смысл проверяемой гипотезы заключается в том, что все коэффициенты линейной регрессии, за исключением свободного члена, равны нулю. Если они действительно равны нулю для генеральной совокупности, то уравнение регрессии должно иметь вид , а коэффициент детерминации R2 и F-статистика Фишера также равны нулю. При этом их оценки для случайной выборки, конечно, отличаются от нуля, но чем больше такое отличие, тем менее оно вероятно. Логика проверки нулевой гипотезы заключается в том, что если произошло событие, которое было бы слишком маловероятным в том случае, если данная гипотеза действительно была бы верна, то эта гипотеза отвергается.
Величина F, если предположить, что выполнены предпосылки относительно отклонений еi, имеет распределение Фишера с (т; п-т-1) степенями свободы.
Если F > F(a, n1, n2 ), то гипотеза о равенстве нулю всех коэффициентов линейной регрессии отвергается.
Форма проведения: Решение данных задач студентами самостоятельно на местах и при необходимости у доски.
Тема № 9Изучение взаимосвязей непараметрическими методами
Задача 1
Найти выборочный коэффициент ранговой корреляции Спримена по данным ранга объектов выборки объема n = 10:
х | ||||||||||
у |
Методические рекомендации:
1. Найти разности рангов, возвести их в квадрат.
2. Определить искомый коэффициент ранговой корреляции Спирмена
Задача 2
При уровне значимости 0,05 проверить, является ли ранговая корреляционная связь, вычисленная в задаче1 , значимой.
Методические рекомендации:
1. Найти критическую точку двусторонней области распределения Стьюдента при α=0,05 и степенями свободы n-2.
2. Вычислить критическую точку и сравнить с коэффициентом ранговой корреляции.
Задача 3
Найти выборочный коэффициент ранговой корреляции Кендалла по данным ранга объектов выборки объема n = 10:
х | ||||||||||
у |
Методические рекомендации:
1. Найти сумму рангов.
2. Определить искомый коэффициент ранговой корреляции Кендалла
Задача 4
При уровне значимости 0,05 проверить, является ли ранговая корреляционная связь, вычисленная в задаче 3 , значимой.
Методические рекомендации:
1. Найти критическую точку по таблице функции Лапласа.
2. Вычислить критическую точку и сравнить с коэффициентом ранговой корреляции Кендалла.
Форма проведения: Решение данных задач студентами самостоятельно на местах и при необходимости у доски.
Основная литература: [5, С.281-343], [7, С.73-114], [11, С.34-54.], [12,С.65-79],[13] [14]
Дополнительная литература: [20] [32]