Порядок выполнения задания. Робинзон Крузо уже несколько лет живет на необитаемом острове
ЗАДАНИЯ ДЛЯ ПРАКТИЧЕСКИХ ЗАНЯТИЙ
Робинзон Крузо уже несколько лет живет на необитаемом острове. Пытаясь выжить и
наметив для этого огромное количество работы, он понимает, что ему необходимо каким-то
образом упорядочить свою жизнь. Для этого он решает оптимизировать свою повседневную
деятельность, а наше дело – помочь ему! Используя при этом методы эконометрики…
Ситуация 1: «Робинзон на охоте». Каждый раз, отправляясь охотиться на уток,
Робинзон берет с собой флягу пива собственного приготовления, так как в условиях
субтропиков ему постоянно хочется пить. При этом он отмечает среднюю температуру в день
охоты (в градусах Цельсия, X3), количество убитых уток (в штуках, X2) и сколько при этом было
выпито пива (в процентах от объема фляги, X1).
ЗАДАНИЕ 1.
ПЕРВИЧНЫЙ ЭКОНОМЕТРИЧЕСКИЙ АНАЛИЗ.
КОРРЕЛЯЦИОННЫЙ АНАЛИЗ
Цель: закрепить знания по теории вероятностей и математической статистике, касающиеся
первичной обработки экспериментальных данных; ознакомиться с основными положениями,
понятиями и методами проведения корреляционного анализа данных.
Вариант 43 | X1 | X2 | X3 |
Порядок выполнения задания
1. По имеющимся результатам наблюдений для каждого показателя определить
основные статистические характеристики (среднее, медиану, дисперсию,
среднеквадратическое отклонение, коэффициенты асимметрии и эксцесса,
коэффициент вариации, используя стандартные функции Excel – СРЗНАЧ(),
МЕДИАНА(), ДИСП(), СТАНДОТКЛОН(), СКОС() и ЭКСЦЕСС()
соответственно), сделать предварительные выводы о свойствах выборки.
2. Провести разбиение выборок на классы однородности, построить
кумулятивные линии эмпирического распределения и гистограммы.
Проанализировать полученные графики.
3. Сформулировать и проверить гипотезу согласии выборочных данных с
нормальным распределением на основе критерия χ2-Пирсона. Сделать выводы.
4. Нанести исходные данные на координатную плоскость и сделать обоснованное
предварительное заключение о наличии (отсутствии) связи между всеми
парами факторов, а также о ее характере (положительная или отрицательная) и
форме (линейная или нелинейная).
5. Рассчитать парные коэффициенты корреляции для каждой пары показателей.
Построить корреляционную матрицу. Используя t-критерий Стьюдента,
проверить значимость полученных коэффициентов корреляции. Сделать
выводы о тесноте связи между факторами.
6. Для каждой пары показателей вычислить частный коэффициент корреляции и
проверить его на значимость. Для значимых коэффициентов построить 95%
доверительные интервалы. Сделать выводы.
7. Вычислить все возможные множественные коэффициенты корреляции.
Сделать выводы.
8. По результатам работы сделать общие выводы и сформулировать
рекомендации для Робинзона.
Используя стандартные функции Exel мы рассчитали основные статистические характеристики:
1. Среднее значение
X1 | X2 | X3 | |
Среднее значение | 59,04 | 9,12 | 31,86 |
Вывод: Среднее значение для X1 говорит о том что Робинзон выпивает 59,04 % пива от всего объёма фляги, среднее значение X2 говорит о том что Робинзон Крузо убивает 9 уток и средняя температура в день охоты составляет 33 градуса Цельсия.
2.Медиана
X1 | X2 | X3 | |
Медиана | 61,5 |
В половине случаев Робинзон Крузо выпивает более 61% от объема фляги, а в других менее. А уток в половине случаев убивает более 9, а в другой половине менее 9. Так же в одной половине случаев температура превышает 31, а в другой половине не превышает 31 градус.
3.Дисперсия
X1 | X2 | X3 | |
Дисп | 599,8351 | 20,51592 | 25,55143 |
Вывод: Наибольшая дисперсия у первого признака, показатели не интерпретируются, так измеряются в разных единицах.
4.Среднеквадратическое (стандартное) отклонение
X1 | X2 | X3 | |
СТАНДОТКЛОН | 24,49153 | 4,52945 | 5,054842 |
Вывод: Робинзон выпивает в интервале от 34.55 % до 83.53 %. Убивает уток в интервале от 4 до 13. Средняя температура в интервале от 26 до 36 градусов.
5. Коэффициент асимметрии
X1 | X2 | X3 | |
СКОС | -0,15946 | 0,205437 | 0,07357 |
Вывод: Робинзон выпивает пива больше на 15 процентов чем среднее значение, убивает уток меньше на 20 процентов, а температура воздуха в день охоты меньше на 7 процентов, чем среднее значение.
6. Коэффициент эксцесса
X1 | X2 | X3 | |
ЭКСЦЕСС | -1,14947 | -0,33219 | -0,92744 |
Вывод: Робинзон Крузо не может спрогнозировать, сколько он выпьет пива, сколько убьет уток и среднюю температуру, потому что коэффициенты эксцесса отрицательные.
7. Коэффициент вариации
X1 | X2 | X3 | |
СТАНДОТКЛОН | 41,48295 | 49,66502 | 15,86579 |
Вывод: коэффициент вариации показывает средний разброс выпитого пива от общего объема, средний разброс от убитых уток, и средний разброс температуры воздуха.
Совокупность считается однородной, если коэффициент вариации не превышает 33 %.
Задача 2
Для того что бы, провести разбиение выборок на классы однородности воспользуемся формулой Стрёрджеса:
К= [1+3.32 lgN] = [1+3.32 lg50]=6 (т.е выборку необходимо разбить на 6 классов)
Далее рассчитываем ширину интервалов (b):
, где — размах вариации
Пиво(Х1):
=100-12=88 => b= 14,67
Утки(Х2):
=21-0=21 =>b= 3,5
Температура(Х3):
=40-23=17 => b= 2,833
Х1 | Х2 | Х3 |
14,67 | 3,5 | 2,833 |
Данные для построения графиков:
Объем выпитого пива
№ класса | Границы интервала[ ) | Среднее значение | Наблюдаемая частота | Кумулятивная частота |
[12 ;26,67) | 19,3 | |||
[26,67; 41,33) | 34,0 | |||
[41,33; 56,00) | 48,7 | |||
[56,00; 66,67) | 63,3 | |||
[66,67; 83,33) | 78,0 | |||
[83,33; 100,00] | 92,7 | |||
∑ | - | - | - |
Количество убитых уток
№ класса | Границы интервала[ ) | Среднее значение | Наблюдаемая частота | Кумулятивная частота |
[0; 3) | 1,33 | |||
[3; 5) | 4,0 | |||
[5; 8) | 6,67 | |||
[8; 11) | 9,33 | |||
[11; 13) | 12,0 | |||
[13; 16) | 14,67 | |||
∑ | - | - |
Температура
№ класса | Границы интервала[ ) | Среднее значение | Наблюдаемая частота | Кумулятивная частота |
[20 ; 23,3) | 21,7 | |||
[23,3; 26,7) | 25,0 | |||
[26,7; 30) | 28,3 | |||
[30; 33,3) | 31,7 | |||
[33,3; 36,7) | 35,0 | |||
[36,7; 40) | 38,3 | |||
∑ | - | - |
Кумулятивные линии эмпирического распределения:
Кумулятивные линии эмпирического распределения показывают, сколько значений попадет в определенный интервал по накопленным частотам.
Гистограммы:
По ним можно судить о нормальности распределения.
Объем выпитого пива:
Вывод: наибольшее количество пива Робинзон Крузо выпивает в интервале от 67 до 83% от объема фляги.
Количество убитых уток:
Вывод: наибольшее количество уток Робинзон Крузо убивает в интервале от 5 до 8 уток.
Температура:
Вывод: наиболее часто встречающаяся температура на острове находится в интервале от 27 до 30 градусов по Цельсию.
Задача 3
Сформулируем и проверим гипотезу о согласии выборочных данных с
нормальным распределением на основе критерия χ2-Пирсона. Сделаем выводы.
Значение статистики Пирсона вычисляется по формуле:
где Bi– наблюдаемая абсолютная частота (число выборочных значений,попавших в i -й интервал), Ei – ожидаемая частота, вычисляемая впредположении о нормальном распределении значений фактора x. Ожидаемая частота попадания в i -й интервал вычисляется как
где – значение функции нормального распределения, вычисленное в точке z. Для этого используется стандартная функция Excel
Сформулируем гипотезу:
H0:F(x) = F0(x)
H1:F(x) ≠F0(x)
Основная гипотеза состоит в предположении о согласии выборочных данных с нормальным распределением. Если эта гипотеза не отвергается, то мы можем считать, что возможно распределение является нормальным. Если отвергается, то распределение не является нормальным.
Уровень значимости а=0,05;
Число степеней свободы v = K – 3= 6 – 3 = 3;
Если χрасч > χкрит(0,05; 1; 48), то гипотеза Н0 отвергается.
Если χрасч < χкрит(0,05; 1; 48), то гипотеза Н0 не отвергается.
Построим вспомогательные таблицы для вычисления :
Объем выпитого пива:
№ класса | Границы интервала[ ) | Наблюдаемая частота, | Теоретическая частота, | |
[12 ;26,67) | 3,29 | 2,24 | ||
[26,67; 41,33) | 7,09 | 0,52 | ||
[41,33; 56,00) | 10,79 | 0,30 | ||
[56,00; 66,67) | 11,59 | 4,97 | ||
[66,67; 83,33) | 8,80 | 5,89 | ||
[83,33; 100,00] | 4,71 | 0,35 | ||
∑ | - | 46,27 | 14,27 |
Вывод: рассчитанное значение > , гипотеза согласия выборочных данных с нормальным распределением отвергается.
Количество убитых уток:
№ класса | Границы интервала[ ) | Наблюдаемая частота, | Теоретическая частота, | |
[0; 3) | 4,27 | 0,02 | ||
[3; 5) | 10,63 | 0,18 | ||
[5; 8) | 14,99 | 0,00 | ||
[8; 11) | 11,98 | 0,08 | ||
[11; 13) | 5,43 | 0,46 | ||
[13; 16) | 1,39 | 0,11 | ||
∑ | - | 48,68 | 0,84 |
Вывод: рассчитанное значение < , гипотеза согласия выборочных данных с нормальным распределением не отвергается.
Температура:
№ класса | Границы интервала[ ) | Наблюдаемая частота, | Теоретическая частота, | |
[20 ; 23,3) | 3,84 | 2,61 | ||
[23,3; 26,7) | 7,36 | 0,76 | ||
[26,7; 30) | 10,39 | 3,03 | ||
[30; 33,3) | 10,80 | 3,12 | ||
[33,3; 36,7) | 8,27 | 0,01 | ||
[36,7; 40) | 4,66 | 4,04 | ||
∑ | - | 45,33 | 13,55 |
Вывод: рассчитанное значение > , гипотеза согласия выборочных данных с нормальным распределением отвергается.
Задача 4
Нанесем исходные данные на координатную плоскость и сделаем обоснованное предварительное заключение о наличии (отсутствии) связи между всеми парами факторов, а также о ее характере (положительная или отрицательная) и форме (линейная или нелинейная).
Утки и пиво:
Вывод: Есть линейная зависимость, т.к. поле вытянуто вдоль одного направления. Зависимость отрицательная, т.к. с увеличением выпитого пива уменьшается количество убитых уток.
Температура и утки:
Вывод: Есть линейная зависимость, т.к. поле вытянуто вдоль одного направления. Зависимость отрицательная, т.к. с увеличением температуры уменьшается количество убитых уток.
Температура и пиво:
Вывод: Есть линейная зависимость, т.к. поле вытянуто вдоль одного направления. Зависимость положительная, т.к. с увеличением температуры увеличивается количество выпитого пива.