Вопрос: Понятие статистической гипотезы. Процедура проверки статистической гипотезы

КОНТРОЛЬНАЯ РАБОТА №1

по дисциплине «Эконометрика»

Вариант: 10

Студент: Яренкова Валерия Алексеевна

Факультет: Бух. учёт АиА

Направление: экономика

Группа: СМЛС14-1Б-ЭК03

№ зачетной книжки: 100.25/1403030

Руководитель: Гусарова Ольга Михайловна

Смоленск 2016

Вопрос: Понятие статистической гипотезы. Процедура проверки статистической гипотезы

Статистическая гипотеза – любое предположение, касающееся неизвестного распределения случайных величин (элементов), соответствующее некоторым представлениям об изучаемом явлении. В частном случае это может быть утверждение о значениях параметров распределения генеральной совокупности.

Различают нулевую и альтернативную гипотезы. Нулевая гипотеза – гипотеза, подлежащая проверке. Альтернативная гипотеза – каждая допустимая гипотеза, отличная от нулевой. Нулевую гипотезу обозначают Н0, альтернативную – Н1 (от Hypothesis – «гипотеза» (англ.)).

Конкретная задача проверки статистической гипотезы полностью описана, если заданы нулевая и альтернативная гипотезы. При обработке реальных данных большое значение имеет правильный выбор гипотез. Принимаемые предположения, например, нормальность распределения, должны быть тщательно обоснованы, в частности, статистическими методами. Необходимо помнить, что в подавляющем большинстве конкретных прикладных задач распределение результатов наблюдений в той или иной степени отлично от нормального.

Процедура проверки гипотез обычно проводится по следующей схеме:

1. Формулируются гипотезы Н0 и Н1.

2. Выбирается уровень значимости критерия.

3. По выборочным данным вычисляется значение некоторой случайной величины, называемой статистикой критерия, или просто статистическим критерием, который имеет известное стандартное распределение (нормальное, Т-распределение Стьюдента и т.п.)

4. Вычисляется критическая область и область принятия гипотезы. То есть находят критическое (граничное) значение критерия при выбранном уровне значимости.

5. Найденное значение критерия сравнивается с критическим и по результатам сравнения делается вывод: отвергнуть гипотезу или не отвергнуть. Если вычисленное по выборке значение критерия меньше чем критическое, то нулевую гипотезу Но не отвергают на заданном уровне значимости.

В этом случае наблюдаемое по экспериментальным данным различие генеральных совокупностей можно объяснить только случайностью выборки. Однако это совсем не означает доказательства равенства параметров генеральных совокупностей. Просто имеющийся в распоряжении статистический материал не дает оснований для отклонения гипотезы о том, что эти параметры одинаковы. Возможно, появится другой экспериментальный материал, на основании которого эта гипотеза будет отклонена.

Если вычисленное значение критерия больше критического, то гипотеза Н0 отклоняется в пользу гипотезы Н1 при данном уровне значимости.

В этом случае наблюдаемое различие генеральных совокупностей уже нельзя объяснить только случайностями и говорят, что наблюдаемое различие значимо (статистически значимо) на выбранном уровне значимости.

Следует подчеркнуть разницу между статистической значимостью и практической значимостью. Заключение о практической значимости всегда делается человеком, изучающим данное явление. И здесь истинным критерием является опыт и интуиция исследователя, а статистические критерии значимости — лишь формально точный инструмент, используемый в исследовании. Чем больше исследователь знает об изучаемом явлении, тем точнее будет сформулированная им гипотеза и тем точнее будут выводы, сделанные с помощью критериев значимости.

В настоящее время при проверке гипотез, особенно с использованием специализированных программных средств, уровень значимости до эксперимента точно не устанавливается, а по экспериментальным данным вычисляется вероятность Р того, что критерий (статистика критерия) выйдет за пределы значения, рассчитанного по выборке. Таким образом, Р — это экспериментальный (эмпирический уровень значимости. Точное значение Р обычно не указывают, а окончательные результаты приводят, сравнивая вычисленное значение критерия со стандартными значениями. Если, например, Р не превосходит 0,05, то на уровне значимости 5% различие считается статистически незначимым.

Критерии значимости подразделяются на три типа:

1. Критерии значимости, которые служат для проверки гипотез о параметрах распределений генеральной совокупности (чаще всего нормального распределения). Эти критерии называются параметрическими.

2. Критерии, которые для проверки гипотез не используют предположений о распределении генеральной совокупности. Эти критерии не требуют знания параметров распределений, поэтому называются непараметрическими.

3. Особую группу критериев составляют критерии согласия, служащие для проверки гипотез о согласии распределения генеральной совокупности, из которой получена выборка, с ранее принятой теоретической моделью (чаще всего нормальным распределением).

· Задача 1. Построение модели парной регрессии

1. Рассчитайте матрицу парных коэффициентов корреляции; оцените статистическую значимость коэффициентов корреляции.

2. Постройте поле корреляции результативного признака и наиболее тесно связанного с ним фактора.

3. Рассчитайте параметры линейной парной регрессии от ведущего фактора.

4. Оцените качество уравнения парной регрессии через коэффициент детерминации, среднюю ошибку аппроксимации и F-критерий Фишера.

5. Осуществите прогнозирование среднего значения показателя при уровне значимости , если прогнозное значения фактора составит 80% от его максимального значения. Представьте графически: фактические и модельные значения, точки прогноза.

По тринадцати коммерческим банкам имеются данные, характеризующие зависимость годовой прибыли от размера собственного капитала, общей суммы привлеченных средств и среднегодовых ставок по рублевым депозитам и краткосрочным кредитам:

№ банка Прибыль (млн. руб.) Собственный капитал (млн. руб.) Привлеченные средства (млн. руб.) Депозитная ставка (% годовых) Кредитная ставка (% годовых)
12,5 17,7
11,7 18,2
11,2 19,1
9,7 15,2
13,5 18,5
10,8 18,6
12,1 15,7
11,7 16,6
13,7 17,3
12,5 19,3
12,8 17,8
11,2 14,5
10,4 13,7

1) построили в excel матрицу парных корреляций

Вводим исходные данные

Для построения матрицы парных коэффициентов корреляции воспользуемся инструментом Корреляции. Данные-Анализ данных-корреляция.

Заполняем необходимые поля диалогового меню

Для анализа матрицы парных корреляций нужно выполнить следующее:

1. Выберем главный ведущий фактор.

В нашей матрице наибольшее значение 0,6465

1.2. установим фактор наличия мультиколлинеарности.

В данной области отсутствуют коэффициенты большие по модулю 0.8, следовательно, в матрице отсутствуем мультиколлинеарность, следовательно, все эти факторы можно внести в модель регрессии.

2. Построим поля корреляции результативного признака (Y) и наиболее тесно связанного с ним фактора (х1)

3. Строим модель парной регрессии. Для этого воспользуемся инструментом Регрессия Данные-анализ данных-регрессия

Выбираем данные.

Результат построения регрессии

Параметрами регрессии являются значения в 3 таблице, коэффициенты.

Y= – 17,3204

X1= 0,0395

На основании полученных данных можно записать уравнение парной регрессии

Y= – 17,3204 + 0,0395*x1

4. Коэффициент детерминации, среднюю ошибку аппроксимации мы получили в результате расчётов, приведенных в пункте 3.

Коэффициент детерминации определяет какая доля вариации признака (Y) учтена в модели и обусловлена влиянием на него фактора (X1). Чем больше значение коэффициента детерминации, тем теснее связь между признаками в построенной математической модели

R2 =0,418 следовательно качество построенного уравнения регрессии – удовлетворительное.

F-расчетное =7,897, а F-табличное F= 4,84 это значит, что уравнение регрессии является статистически значимым. Такое уравнение целесообразно использовать для анализа и прогнозирования.

Среднюю ошибку аппроксимации рассчитаем по формуле:

Среднее значение прибыли рассчитаем в Excelс помощью функции СРЗНАЧ.

= 186,4615385

А » 0,34 %

В формульном выражении:

5. Для прогнозирования результативного показателя подставим в уравнение значение фактического показателя, равного 80% от его максимального значения

  Хmax=8254 х(t)=0,8*Хmax=0,8*8254=6603,2 у = – 17,3204 + 0,0395*x1
у = – 17,3204 + 0,0395*x1*6603,2=243,788

Для отображения прогнозного значения результативного признака нужно воспользоваться мастером диаграмм. В качестве входных диапазонов необходимо взять данные для факторного признака Х1, для результативного признака –Y, на полученном графике отразить линию тренда.

Для отображения на графике прогноза прибыли (Y) необходимо:

Выделить полученный график, щелкнуть правой кнопкой мыши и выбрать исходные данные, добавить новый ряд и ввести прогнозные значения X,Y, рассчитанные ранее., т.е. Х=6603.2, Y=243.788

Для расчета коэффициента воспользуемся функцией Excel СТЬЮДЕНТ.ОБР.2Х, вероятность возьмем равную 0,1, число степеней свободы 12

Т табл.(t х1 ) = 1,7958848 Т расч. = 2,81 Трасч. является больше Т табл., следовательно, соответствующий факторный признак признается статистически значимым.Такой фактор рекомендуется в модели регрессии оставить.

Рассчитаем доверительный прогнозный интервал по формуле:

- стандартная ошибка S=70,5704(таблица «Регрессионная статистика» итогов применения инструмента «Регрессия» пакета «Анализ данных»);

- по столбцу данных Х1 найдем среднее значение = 5153,46

- определим 187,21429

tα – коэффициент Стьюдента для уровня значимости α=0.1 = 10% и числа степеней свободы k=11. tα=1,7958848 (функция СТЬЮДЕНТ.ОБР.2Х).

Тогда, предельная ошибка прогноза:

Определим верхнюю и нижнюю границу интервала.

243,788+136,528 = 380,316

243,788 – 136,528= 107,261

Таким образом, прогнозное значение Y =243,788 будет находиться между нижней границей = 107,261 и верхней = 380,316.

· Задача 2. Построение модели множественной регрессии

1. Осуществите анализ матрицы парных корреляций на предмет мультиколлинеарности.

2. Используя пошаговую множественную регрессию (метод исключения или метод включения), постройте модель множественной регрессии. Дайте экономическую интерпретацию коэффициентов модели регрессии.

3. Осуществите проверку выполнения предпосылок МНК.

4. Оцените качество построенной модели. Улучшилось ли качество модели по сравнению с однофакторной моделью? Дайте оценку влияния значимых факторов на результат с помощью коэффициентов эластичности, b - и D - коэффициентов.

5. Постройте (по лучшей модели) прогноз результативного признака, если предположить, что значения факторных признаков увеличатся относительно средних значений на 10 %.

6. Внесите рекомендации по совершенствованию управления процессом (организацией).

По тринадцати коммерческим банкам имеются данные, характеризующие зависимость годовой прибыли от размера собственного капитала, общей суммы привлеченных средств и среднегодовых ставок по рублевым депозитам и краткосрочным кредитам:

№ банка Прибыль (млн. руб.) Собственный капитал (млн. руб.) Привлеченные средства (млн. руб.) Депозитная ставка (% годовых) Кредитная ставка (% годовых)
12,5 17,7
11,7 18,2
11,2 19,1
9,7 15,2
13,5 18,5
10,8 18,6
12,1 15,7
11,7 16,6
13,7 17,3
12,5 19,3
12,8 17,8
11,2 14,5
10,4 13,7

1. Построили в excel матрицу парных корреляций

Вводим исходные данные

Для построения матрицы парных коэффициентов корреляции воспользуемся инструментом Корреляции. Данные-Анализ данных-корреляция

Заполняем необходимые поля диалогового меню

Для анализа матрицы парных корреляций нужно выполнить следующее:

1. Выберем главный ведущий фактор.

Ведущим признается факторный признак, оказывающий наибольшее влияние на результативный показатель (анализируется 1 столбец матрицы и выбирается наибольшее значение по модулю)

В нашей матрице наибольшее значение 0,6465

1.2 установим фактор наличия мультиколлинеарности.

Необходимо смотреть всю оставшуюся часть матрицы кроме 1 столбца. В этой области необходимо определить есть ли коэффициент по модулю больше 0.8

В данной области отсутствуют коэффициенты большие по модулю 0.8, следовательно, в матрице отсутствуем мультиколлинеарность, следовательно, все эти факторы можно внести в модель регрессии.

2. Строим модель множественной регрессии

Для этого воспользуемся инструментом Регрессия.

Данные-анализ данных-регрессия

Выбираем данные

Результат построения регрессии

На основании полученных данных можно записать уравнение множественной регрессии

у=316,235 + 0,0387*X1-0,0356*X2+28,153*X3-30,563*X4

Оценим качество построенной модели множественной регрессии по следующим направлениям:

Коэффициент детерминации R2=0,799, достаточно близок к единице, следовательно качество модели можно признать хорошим.

Критерий Фишера=7,963

Fтабл=3,84, Fрасч.=7,963, это значит, что уравнение регрессии является статистически значимым. Такое уравнение целесообразно использовать для анализа и прогнозирования.

Оценим качество построенной модели множественной регрессиис помощью коэффициента эластичности b и △коэффициентов. эластичности определяется:

,

где - среднее значение соответствующего факторного признака,

- среднее значение результативного признака.

bi – коэффициенты регрессии соответствующих факторных признаков.

ß-коэффициент определяется по следующей формуле:

,

где - среднеквадратическое отклонение (СКО) соответствующего факторного признака (рассчитывается как корень квадратный из дисперсии признака),

- СКО результативного признака.

∆-коэффициент определяется по следующей формуле:

,

где -коэффициент парной корреляции результативного и соответствующего факторного признаков,

- коэффициент детерминации.

Необходимо определить среднее значение всех признаков: Мастер функций

= >СРЗНАЧ.

Коэффициент biдля всех значений возьмем из таблицы 3 «Вывода итогов»

Для расчета дисперсии всех значений необходимо: Мастер функций =>ДИСП.

Расчет эластичности показывает на сколько % изменится значение у при изменении значения фактора на 1 %.

Возьмем значения из таблицы матрицы парной корреляции результативного и соответствующего факторного признаков.

Произведенные расчеты представлены на рисунке:

Частый коэффициент эластичности показывает на сколько процентов изменится среднее значение результативного признака, если среднее значение конкретного факторного признака изменится на 1%. Т.е. при увеличении на 1% собственного капитала (Х1) прибыль (Y) возрастает на 1,07%

- при увеличении на 1% привлеченных средств (Х2) прибыль (Y) уменьшится на 0.75%

- при увеличении на 1% депозитной ставки (Х3) прибыль (Y) увеличится на 1,786%

- при увеличении на 1% кредитной ставки (Х4) прибыль (Y) снизится на 2,802%

В-коэффициент показывает на какую величину изменится СКО результативного признака, если СКО конкретного факторного признака изменится на 1 единицу, т.е.при увеличении на 1 единицу собственного капитала (Х1), СКО прибыль (Y) увеличивается на 0,038 единиц;

- при увеличении на 1 единицу привлеченных средств (Х2), СКО прибыль (Y) уменьшится на 0,49 единицы;

- при увеличении на 1 единицу депозитной ставки (Х3), СКО прибыль (Y) увеличится на 0,375 единиц;

- при увеличении на 1 единицу кредитной ставки (Х4), СКО прибыль (Y) уменьшится на 0,624 единиц;

Δ-коэффициент показывает удельный вес влияния конкретного факторного признака в совместном влиянии всех факторных признаков на результативный показатель, т.е. удельный вес влияния собственного капитала (Х1) на прибыль (Y) составляет 0,512%

- удельный вес влияния привлеченных средств (Х2) на прибыль (Y) составляет 0,108%

- удельный вес влияния депозитной ставки (Х3) на прибыль (Y) составляет -0,108%

- удельный вес влияния кредитной ставки (Х4) на прибыль (Y) составляет 0,488%

- для оценки статистической значимости факторных признаков модели множественной регрессии используется t-критерий Стьюдента.

С помощью функции СТЬЮДРАСПОБР(0,05;10) определим табличное значение=2,20

Сравним расчетные значения t-статистики, взятые по модулю, с табличным значением этого критерия.

Tx1= 3,125>2.31

Tx2= -2,91>2.31

Tx3=1,899<2.31

Tx4= -3,1>2.31

Для анализа возьмем Х2 т.к. он наиболее приближен к табличному значению.

4) построим регрессионную модель со статистически значимыми факторами (Х2)

Так как по условию задачи значения факторных признаков увеличиваются относительно средних значений на 10%, то получаем.

Запишем уравнение зависимости прибыли от привлеченных средств (Х2):

Y = -0,01237*Х2+236,591497

Качество этой модели может быть оценено по коэффициенту детерминации =0,031 следовательно, прибыль на 3,1 % зависит от привлеченных средств.

При сравнении качества регрессии y=f (X1) =0,418 с качеством регрессии y = f (X1,X2, X3,X4)) = 0.799, можно утверждать, что улучшение качества модели значительно не произошло.

Значение F-критерия Фишера составляет 7,96 >Fтабл=3,58, следовательно, построенное уравнение регрессии признается статистически значимым и может быть использовано для анализа и прогнозирования процессов.

Построение точечного прогноза прибыли кредитного учреждения (результативного показателя) может быть осуществлено по уравнению множественной регрессии,

Воспользуемся уравнением множественной регрессии:

Y=316,235 + 0,0387*X1-0,0356*X2+28,153*X3-30,563*X4

Для построения точечного прогноза результативного признака необходимо рассчитать точечные прогнозы факторных признаков (пробегу и сроку эксплуатации). Для этого построим графики X1(t), X2(t), X3(t), X4(t) и тренд по каждому из факторов

В полученное уравнение тренда

Х1 = 200,6*х + 3749,

в котором в качестве факторного признака выступает «время», необходимо подставить следующий момент времени. Так как временной ряд факторного признака Х1 представлен 13 наблюдениями, то следующий момент времени будет представлен числом 14.

Получим:

X1Прогн.=200,6*14+3749 = 6356,8

В полученное уравнение тренда

Х1 = 200,6*х + 3749 ,

в котором в качестве факторного признака выступает «время», необходимо подставить следующий момент времени. Так как временной ряд факторного признака Х1 представлен 13 наблюдениями, то следующий момент времени будет представлен числом 14.

Получим:

X1Прогн.=200,6*14+3749 = 6557,4

В полученное уравнение тренда

Х2 = 3,137*х + 3913,

в котором в качестве факторного признака выступает «время», необходимо подставить следующий момент времени. Так как временной ряд факторного признака Х2 представлен 13 наблюдениями, то следующий момент времени будет представлен числом 14.

Получим:

X2Прогн.=3,137*14+3913 = 3956,92

Федеральное государственное образовательное бюджетное учреждение

высшего профессионального образования

«Финансовый университет при Правительстве Российской Федерации»

(Финуниверситет)

Смоленский филиал Финуниверситета

Кафедра Математики и информатики

КОНТРОЛЬНАЯ РАБОТА №2

по дисциплине «Эконометрика»

Вариант: 10

Студент: Яренкова Валерия Алексеевна

Факультет: Бух. учёт АиА

Направление: экономика

Группа: СМЛС14-1Б-ЭК03

№ зачетной книжки: 100.25/1403030

Руководитель: Гусарова Ольга Михайловна

Смоленск 2016

Вопрос: Авторегрессионные модели (на примере модели корректировки уровня сбережений)

Авторегрессионная модель — это динамическая эконометриче-ская модель, в которой в качестве факторных переменных содержатся лаговые значения результативной переменной. Примером модели авторегрессии является:

y, =00 +01 хX, + 4 хy,-1 + е.

В авторегрессионной модели коэффициент в1 характеризует краткосрочное изменение переменной y под влиянием изменения переменной x на единицу своего измерения.

Коэффициент 41 характеризует изменение переменной y под влиянием своего изменения в предыдущий момент времени ( ' 1). Произведение регрессионных коэффициентов (в1х41) называется промежуточным мультипликатором. Этот показатель характеризует общее абсолютное изменение результативной переменной y в момент времени ( ' + 1).

Показатель

0 = 01 + 01 х41 + 01 х42 + 01 х43 + ...

называется долгосрочным мультипликатором. Он характеризует общее абсолютное изменение результативной переменной y в долгосрочном периоде.

В большинство моделей авторегрессии вводится условие стабильности, которое состоит в том, что |41| < 1. При наличии бесконечного лага будет выполняться следующее равенство:

0=01 х(4 +412+43 + ^)= ї-04-.

Нормальная линейная регрессионная модель строится исходя из предпосылки о том, что все факторные переменные являются величинами независимыми от случайной ошибки модели.

В случае авторегрессионных моделей данное условие нарушается, так как переменная y t 1 частично зависит от случайной ошибки модели еґ Применение метода наименьших квадратов для оценивания неизвестных параметров авторегрессионного уравнения невозможно, так как это приводит к получению смещенной оценки коэффициента при переменной y 1.

Для оценивания параметров авторегрессионного уравнения применяется метод инструментальных переменных (IV — Instrumental variables). Его суть состоит в следующем.

Переменная y 1 из правой части уравнения, для которой нарушается предпосылка МНК, заменяется на новую переменную Z, удовлетворяющую следующим требованиям:

она должна тесно коррелировать с переменной yt 1: cov(yt 1, z) * 0;

она не должна коррелировать со случайной ошибкой еt: cov(z, е) = 0.

Далее оценивают регрессию с новой инструментальной переменной z с помощью обычного метода наименьших квадратов. Оценка коэффициента регрессии определяется так:

Рассмотрим пример применения метода инструментальных переменных для модели авторегрессии вида:

y, =00 +01 х X, + 4 х y, -1 + е.

В данной модели переменная yt зависит от переменной xt, из чего можно сделать вывод, что переменная y 1 зависит от переменной x 1. Выразим эту зависимость через обычную парную регрессионную модель:

y,-1 = k + k х X'-1 + и,,

где k0, k1 — неизвестные коэффициенты регрессии; и ' — случайная ошибка регрессионного уравнения. Обозначим выражение k0 + k1 х x,-1 через переменную z,t 1. Регрессия для y 1 записывается:

y ,-1 = z,-1 + и,.

Новая переменная z,t 1 удовлетворяет свойствам, предъявляемым к инструментальным переменным: она тесно коррелирует с переменной yt 1, т. е. cov(zt 1, yt 1) ^ 0, и не коррелирует со случайной ошибкой исходной авторегрессионной модели et, т. е. cov(£p Z, 1).

Исходная модель авторегрессии может быть записана так: У, =00 +01 x x, +($1 x(k0 + k1 x,-1 + u,) + є, = = 00 +01 x x, + 3l X z,-1 + V|,

где vt =dx xut +єІ.

Оценки неизвестных коэффициентов преобразованной модели находятся с помощью обычного метода наименьших квадратов. Они являются оценками неизвестных коэффициентов исходной авторегрессионной модели.

Наши рекомендации