Представить ряд распределения графически в виде гистограммы, полигона и кумулятивного полигона типа “больше, чем” или “меньше, чем”
Статистика
Домашнее задание 1.
Тема: Сбор данных в статистическом анализе. Группировка и графическое представление данных. Измерение центральных тенденций.
Востриков А.А., Группа 204.
1.
Индексы цен производителей добычи полезных ископаемых
По Российской Федерации за 2001-2014 гг. (на конец периода в %)
Январь | 108,6 | 100,6 | 99,3 | 98,2 | 113,3 | 95,7 | 96,2 | 107,5 | 104,2 | 80,4 | 92,7 | 104,7 | 101,8 | 99,9 | 103,6 |
Февраль | 103,2 | 98,3 | 94,8 | 99,1 | 104,5 | 98,4 | 106,6 | 94,7 | 95,4 | 112,6 | 101,3 | 105,1 | 104,5 | 102,5 | 95,7 |
Март | 102,5 | 99,1 | 97,7 | 98,7 | 101,2 | 109,6 | 108,0 | 95,5 | 94,4 | 119,9 | 103,7 | 102,8 | 107,8 | 101,4 | 106,7 |
Апрель | 102,7 | 101,0 | 100,6 | 99,4 | 103,7 | 108,9 | 100,6 | 110,7 | 107,3 | 115,3 | 106,2 | 106,6 | 100,5 | 95,0 | 100,2 |
Май | 101,3 | 101,7 | 104,1 | 97,5 | 102,4 | 109,7 | 100,8 | 115,7 | 106,3 | 105,3 | 104,6 | 102,4 | 91,2 | 97,2 | 99,4 |
Июнь | 101,0 | 109,0 | 109,0 | 97,6 | 105,7 | 99,3 | 101,4 | 106,8 | 110,6 | 105,3 | 90,0 | 92,7 | 96,4 | 102,8 | 101,5 |
Июль | 104,4 | 100,5 | 108,3 | 106,5 | 102,9 | 101,2 | 103,2 | 99,9 | 111,7 | 107,1 | 101,9 | 93,6 | 92,4 | 104,5 | 102,0 |
Август | 101,3 | 99,0 | 103,7 | 105,1 | 103,9 | 108,0 | 103,9 | 105,5 | 100,4 | 102,9 | 109,9 | 109,3 | 114,6 | 104,4 | 98,0 |
Сентябрь | 103,2 | 97,9 | 101,1 | 102,2 | 105,0 | 109,0 | 102,9 | 97,4 | 84,2 | 100,4 | 93,4 | 100,8 | 115,9 | 104,3 | 94,2 |
Октябрь | 108,2 | 100,0 | 104,5 | 100,6 | 103,6 | 102,6 | 89,7 | 96,1 | 79,2 | 95,9 | 103,2 | 100,8 | 92,4 | 96,1 | 100,2 |
Ноябрь | 101,3 | 99,6 | 103,4 | 97,4 | 104,5 | 96,3 | 87,4 | 105,6 | 83,1 | 95,8 | 110,3 | 103,6 | 96,5 | 94,3 | 95,3 |
Декабрь | 103,4 | 97,8 | 97,8 | 100,1 | 100,8 | 90,9 | 103,1 | 110,0 | 83,8 | 105,8 | 101,1 | 102,6 | 98,5 | 105,6 | 102,3 |
Источник: http://www.gks.ru/free_doc/new_site/prices/prom/tab-prom1.htm
2.
Выпишем только массив чисел для того, чтобы было удобнее работать с вышеприведённой таблицей.
108,6 | 100,6 | 99,3 | 98,2 | 113,3 | 95,7 | 96,2 | 107,5 | 104,2 | 80,4 | 92,7 | 104,7 | 101,8 | 99,9 | 103,6 |
103,2 | 98,3 | 94,8 | 99,1 | 104,5 | 98,4 | 106,6 | 94,7 | 95,4 | 112,6 | 101,3 | 105,1 | 104,5 | 102,5 | 95,7 |
102,5 | 99,1 | 97,7 | 98,7 | 101,2 | 109,6 | 108,0 | 95,5 | 94,4 | 119,9 | 103,7 | 102,8 | 107,8 | 101,4 | 106,7 |
102,7 | 101,0 | 100,6 | 99,4 | 103,7 | 108,9 | 100,6 | 110,7 | 107,3 | 115,3 | 106,2 | 106,6 | 100,5 | 95,0 | 100,2 |
101,3 | 101,7 | 104,1 | 97,5 | 102,4 | 109,7 | 100,8 | 115,7 | 106,3 | 105,3 | 104,6 | 102,4 | 91,2 | 97,2 | 99,4 |
101,0 | 109,0 | 109,0 | 97,6 | 105,7 | 99,3 | 101,4 | 106,8 | 110,6 | 105,3 | 90,0 | 92,7 | 96,4 | 102,8 | 101,5 |
104,4 | 100,5 | 108,3 | 106,5 | 102,9 | 101,2 | 103,2 | 99,9 | 111,7 | 107,1 | 101,9 | 93,6 | 92,4 | 104,5 | 102,0 |
101,3 | 99,0 | 103,7 | 105,1 | 103,9 | 108,0 | 103,9 | 105,5 | 100,4 | 102,9 | 109,9 | 109,3 | 114,6 | 104,4 | 98,0 |
103,2 | 97,9 | 101,1 | 102,2 | 105,0 | 109,0 | 102,9 | 97,4 | 84,2 | 100,4 | 93,4 | 100,8 | 115,9 | 104,3 | 94,2 |
108,2 | 100,0 | 104,5 | 100,6 | 103,6 | 102,6 | 89,7 | 96,1 | 79,2 | 95,9 | 103,2 | 100,8 | 92,4 | 96,1 | 100,2 |
101,3 | 99,6 | 103,4 | 97,4 | 104,5 | 96,3 | 87,4 | 105,6 | 83,1 | 95,8 | 110,3 | 103,6 | 96,5 | 94,3 | 95,3 |
103,4 | 97,8 | 97,8 | 100,1 | 100,8 | 90,9 | 103,1 | 110,0 | 83,8 | 105,8 | 101,1 | 102,6 | 98,5 | 105,6 | 102,3 |
Построим ранжированный ряд.
79,2 | 92,7 | 95,5 | 97,4 | 98,5 | 100,0 | 100,8 | 101,3 | 102,4 | 103,2 | 103,9 | 104,6 | 106,2 | 108,0 | 110,0 |
80,4 | 92,7 | 95,7 | 97,4 | 98,7 | 100,1 | 100,8 | 101,3 | 102,5 | 103,2 | 103,9 | 104,7 | 106,3 | 108,2 | 110,3 |
83,1 | 93,4 | 95,7 | 97,5 | 99,0 | 100,2 | 100,8 | 101,4 | 102,5 | 103,2 | 104,1 | 105,0 | 106,5 | 108,3 | 110,6 |
83,8 | 93,6 | 95,8 | 97,6 | 99,1 | 100,2 | 100,8 | 101,4 | 102,6 | 103,2 | 104,2 | 105,1 | 106,6 | 108,6 | 110,7 |
84,2 | 94,2 | 95,9 | 97,7 | 99,1 | 100,4 | 101,0 | 101,5 | 102,6 | 103,4 | 104,3 | 105,1 | 106,6 | 108,9 | 111,7 |
87,4 | 94,3 | 96,1 | 97,8 | 99,3 | 100,4 | 101,0 | 101,7 | 102,7 | 103,4 | 104,4 | 105,3 | 106,7 | 109,0 | 112,6 |
89,7 | 94,4 | 96,1 | 97,8 | 99,3 | 100,5 | 101,1 | 101,8 | 102,8 | 103,6 | 104,4 | 105,3 | 106,8 | 109,0 | 113,3 |
90,0 | 94,7 | 96,2 | 97,9 | 99,4 | 100,5 | 101,1 | 101,9 | 102,8 | 103,6 | 104,5 | 105,5 | 107,1 | 109,0 | 114,6 |
90,9 | 94,8 | 96,3 | 98,0 | 99,4 | 100,6 | 101,2 | 102,0 | 102,9 | 103,6 | 104,5 | 105,6 | 107,3 | 109,3 | 115,3 |
91,2 | 95,0 | 96,4 | 98,2 | 99,6 | 100,6 | 101,2 | 102,2 | 102,9 | 103,7 | 104,5 | 105,6 | 107,5 | 109,6 | 115,7 |
92,4 | 95,3 | 96,5 | 98,3 | 99,9 | 100,6 | 101,3 | 102,3 | 102,9 | 103,7 | 104,5 | 105,7 | 107,8 | 109,7 | 115,9 |
92,4 | 95,4 | 97,2 | 98,4 | 99,9 | 100,6 | 101,3 | 102,4 | 103,1 | 103,7 | 104,5 | 105,8 | 108,0 | 109,9 | 119,9 |
Построим интервальный ряд.
1. Объем выборки:
n = 180
2. Количество интервалов:
k = 1+3,322 lg n = 1 + 3,322lg 180 ≈ 1+ 3,322*2,26 ≈ 9
3. Размах вариации:
R = xmax – xmin = 119,9 - 79,2= 40,7
4. Длина интервала:
h = = ≈ 4,52 ≈ 5
Нижняя граница – 79,2 (xmin) ; Верхняя граница – 124,2
Номер интервала | Границы интервалов [xi;xi+5) | Частоты групп, ni | Относительные частоты; Частости (частоты, выраженные в процентах к итогу) | Накопленные частоты | |
Нижняя; xi | Верхняя; xi+5 | ||||
79,2 | 84,2 | ||||
84,2 | 89,2 | ||||
89,2 | 94,2 | ||||
94,2 | 99,2 | ||||
99,2 | 104,2 | ||||
104,2 | 109,2 | ||||
109,2 | 114,2 | ||||
114,2 | 119,2 | ||||
119,2 | 124,2 | ||||
*Цветом выделены числа, попадающие в тот или иной интервал, таким образом:
Интервал № 1:
Интервал № 2:
Интервал № 3:
Интервал № 4:
Интервал № 5:
Интервал № 6:
Интервал № 7:
Интервал № 8:
Интервал № 9:
Представить ряд распределения графически в виде гистограммы, полигона и кумулятивного полигона типа “больше, чем” или “меньше, чем”.
Полигон типа «больше чем…»
Полигон типа «меньше чем…»:
4. Сгруппированные данные:
1)Конкретное значение моды для интервального ряда рассчитывается по формуле:
где хМo – нижняя граница модального интервала,
h–величина модального интервала,
fMo – частота модального интервала,
fMo-1 – частота интервала, предшествующего модальному,
fMo+1 – частота интервала, следующего за модальным.
Согласно таблице модальным интервалом построенного ряда является интервал 99,2 - 104,2, так как его частота максимальна и равна 70.
M0 = 99,2 + 5× ≈ 101,8613
Для рассматриваемой совокупности наиболее распространенное значение характеризуется средней величиной 101,8613.
2)Конкретное значение медианы для интервального ряда рассчитывается по формуле:
,
где хМе– нижняя граница медианного интервала,
h – величина медианного интервала,
– сумма всех частот,
fМе – частота медианного интервала,
SMе-1 – кумулятивная (накопленная) частота интервала, предшествующего медианному.
Me = 99,2 + 5× ≈ 101,843
3) Средняя арифметическая взвешенная для сгруппированных данных:
Интервал | Частоты групп, ni | Середина интервала, | Произведение середины интервала на частоту. | ||
79,2 – 84,2 | 81,7 | 326,8 | |||
84,2 –89,2 | 86,7 | 173,4 | |||
89,2–94,2 | 91,7 | ||||
94,2– 99,2 | 96,7 | 3577,9 | |||
99,2– 104,2 | 101,7 | ||||
104,2 –109,2 | 106,7 | 4374,7 | |||
109,2 – 114,2 | 111,7 | 1228,7 | |||
114,2 – 119,2 | 116,7 | 466,7 | |||
119,2 – 124,2 | 121,7 | 121,7 | |||
Итого | 18305,9 | ||||
Не сгруппированные данные:
1) Для не сгруппированных данных мода будет равна 104,5, так как данное значение повторяется больше всего, чем остальные.
2) Для не сгруппированных данных медиана будет равна среднему значению 90-го и 91-го признаков: = 101,75
3) Для не сгруппированных данных среднюю арифметическую определим по формуле простой арифметической:
, следовательно средняя арифметическая будет равна = ≈ 101,52
Сравнение центральных тенденций сгруппированных и не сгруппированных данных:
1) Сравним моды сгруппированных и не сгруппированных данных:
101,8613 < 104,5 ( для интервального ряда мода меньше )
2) Сравним медианы сгруппированных и не сгруппированных данных:
101,843 > 101,75 ( для интервального ряда медиана будет меньше )
3) Сравним средние арифметические сгруппированных и не сгруппированных данных:
101,6994>101,52 ( для интервального ряда средняя арифметическая больше )