Выполнение работы с использованием программы STATISTICA
Описание выполнения работы с русифицированным пакетом Statistica 6.0 (в скобках приводятся опции на английском для Statistica 5.0).
Для расчета основных статистик в рамках выполнении данной работы используется модуль «Основная статистика/таблицы» («Basic Statistics/Tables»), которая вызывается через основное меню (крайне верхняя строка) используя опцию «Статистика» (Descriptive statistics). В выпавшем меню нажимается кнопка «Correlation matrices» и в появившемся меню нажимается кнопка «Итог.матрица корреляций» («Correlations») после чего в новом окне появится матрица взаимных коэффициентов корреляции (см. рис. 4.3), устанавливающие тесноту линейной связи между переменными. Дополнительно результаты расчета могут быть представлены в графическом виде, путем нажатие на кнопку «Вычерчивание разброса для выбранных переменных», см. рис.4.2.
Решение задачи.
В приведенном ниже примере решения задачи в таблице 4.1 начальная строка и крайний левый столбец, выделенные серым цветом, соответствуют координатной сетки Excel. В таблицах 4.2 и 4.3 крайние столбцы, выделенные серым цветом, также соответствуют координатной сетке Excel.
Таблица 4.1
Исходные данные (вариант №1)
A | B | C | D | E | F | G | H | I | J | |
№ периода | Уровень безработицы, % | Уровень инфляции, % | Реальный ВВП, трлн.руб | Объм произв, трлн.руб | Объм капстроительства, трлн.руб | Средняя З/П, трлд.руб | Распологаемый доход, млрд.руб | Потребительский расзод, млрд.руб | Количество туристов за рубежом | |
10,74 | 0,94 | 206,19 | 1,374 | 0,171 | 9,401 | 1422,97 | 922,08 | |||
10,92 | 0,94 | 207,25 | 1,267 | 0,192 | 9,505 | 1315,67 | 905,18 | |||
10,91 | 1,11 | 212,98 | 1,25 | 0,225 | 10,151 | 1445,67 | 910,51 | |||
12,18 | 1,36 | 244,5 | 1,56 | 0,151 | 7,402 | |||||
12,07 | 1,19 | 238,8 | 1,624 | 0,146 | 7,884 | |||||
12,09 | 1,44 | 1,648 | 0,154 | 7,65 | ||||||
11,51 | 0,48 | 204,96 | 1,152 | 0,191 | 10,067 | 1172,12 | 906,05 | |||
11,27 | 0,06 | 206,37 | 1,317 | 0,23 | 10,782 | 917,32 | ||||
Средние | 11,46 | 0,94 | 219,88 | 1,40 | 0,18 | 9,11 | 1187,05 | 866,52 | 311,63 | |
Размах | 1,44 | 1,38 | 39,54 | 0,50 | 0,08 | 3,38 | 481,67 | 136,08 | 369,00 | |
Среднее линейное | 0,50 | 0,34 | 15,41 | 0,16 | 0,03 | 1,09 | 160,77 | 57,14 | 108,22 | |
Дисперсия | 0,35 | 0,21 | 298,87 | 0,04 | 0,0011 | 1,66 | 38799,4 | 4017,97 | 17791, | |
Средеквад. откл-ие | 0,59 | 0,46 | 17,29 | 0,19 | 0,03 | 1,29 | 196,98 | 63,39 | 133,39 | |
Коэф. вариации | 5,15 | 49,31 | 7,86 | 13,41 | 17,93 | 14,13 | 16,59 | 7,32 | 42,80 |
Таблица 4.2
Коэффициенты парной корреляции
Cov(j,i) | Уровень безработицы, % | Уровень инфляции, % | Реальный ВВП, трлн.руб | Объем произв, трлн.руб | Объм капстроительства, трлн.руб | Средняя З/П, трлд.руб | Распологаемый доход, млрд.руб | Потребительский расзод, млрд.руб | Количество туристов за рубежом | |||||
Уровень безработицы, % | 0,43 | 0,88 | 0,75 | -0,68 | -0,78 | -0,98 | -0,93 | -0,83 | ||||||
Уровень инфляции, % | 0,43 | 0,74 | 0,67 | -0,71 | -0,84 | -0,33 | -0,71 | -0,52 | ||||||
Реальный ВВП, трлн.руб | 0,88 | 0,74 | 0,91 | -0,76 | -0,93 | -0,83 | -0,98 | -0,82 | ||||||
Объм произв, трлн.руб | 0,75 | 0,67 | 0,91 | -0,78 | -0,89 | -0,74 | -0,9 | -0,89 | ||||||
Объм капстроительства, трлн.руб | -0,68 | -0,71 | -0,76 | -0,78 | 0,92 | 0,68 | 0,8 | 0,89 | ||||||
Средняя З/П, трлд.руб | -0,78 | -0,84 | -0,93 | -0,89 | 0,92 | 0,75 | 0,94 | 0,86 | ||||||
Распологаемый доход, млрд.руб | -0,98 | -0,33 | -0,83 | -0,74 | 0,68 | 0,75 | 0,89 | 0,84 | ||||||
Потребительский расзод, млрд.руб | -0,93 | -0,71 | -0,98 | -0,9 | 0,8 | 0,94 | 0,89 | 0,87 | ||||||
Количество туристов за рубежом | -0,83 | -0,52 | -0,82 | -0,89 | 0,89 | 0,86 | 0,84 | 0,87 | ||||||
Множественный коэффициент корреляции: | 0,94 | - связь сильная | ||||||||||||
Таблица 4.3
Нормированные данные
№ периода | Уровень безработицы, % | Уровень инфляции, % | Реальный ВВП, трлн.руб | Объм произв, трлн.руб | Объм капстроительства, трлн.руб | Средняя З/П, трлд.руб | Распологаемый доход, млрд.руб | Потребительский расзод, млрд.руб | Количество туристов за рубежом | |
0,88 | 0,65 | 0,84 | 0,83 | 0,74 | 0,87 | 0,98 | 1,00 | 0,64 | ||
0,90 | 0,65 | 0,85 | 0,77 | 0,83 | 0,88 | 0,91 | 0,98 | 0,88 | ||
0,90 | 0,77 | 0,87 | 0,76 | 0,98 | 0,94 | 1,00 | 0,99 | 1,00 | ||
1,00 | 0,94 | 1,00 | 0,95 | 0,66 | 0,69 | 0,67 | 0,85 | 0,46 | ||
0,99 | 0,83 | 0,98 | 0,99 | 0,63 | 0,73 | 0,69 | 0,86 | 0,25 | ||
0,99 | 1,00 | 0,97 | 1,00 | 0,67 | 0,71 | 0,68 | 0,86 | 0,31 | ||
0,94 | 0,33 | 0,84 | 0,70 | 0,83 | 0,93 | 0,81 | 0,98 | 0,71 | ||
0,93 | 0,04 | 0,84 | 0,80 | 1,00 | 1,00 | 0,83 | 0,99 | 0,81 | ||
Средние | 0,94 | 0,65 | 0,90 | 0,85 | 0,80 | 0,84 | 0,82 | 0,94 | 0,63 | |
Размах | 0,11822 | 0,95833 | 0,1617 | 0,301 | 0,36522 | 0,31349 | 0,3331 | 0,1475 | 0,75 | |
Среднее линейное | 0,04 | 0,23 | 0,06 | 0,10 | 0,12 | 0,10 | 0,11 | 0,06 | 0,22 | |
Дисперсия | 0,0023 | 0,1036 | 0,0050 | 0,0130 | 0,0202 | 0,0142 | 0,0186 | 0,0047 | 0,0735 | |
Средеквад. откл-ие | 0,05 | 0,32 | 0,07 | 0,11 | 0,14 | 0,12 | 0,14 | 0,07 | 0,27 |
Рис. 4.1
Рис. 4.2.
Выводы по результатам расчета статистических показателей.
Анализ средних макро-экономических показателей показывают, что средние значения кроме «Уровня безработицы» и «Количество туристов» находятся в близи максимального значения (0,8 -0,95, см. табл. 4.3), следовательно, вероятность появления значений в максимальной области выше чем в минимальной.
Анализ размаха показателей позволяет установить, что наибольший уровень вариации признака (изменчивость) имеют показатели «Уровень инфляции, %» и «Количество туристов за рубежом» 0,95 и 0,75 соответственно, см. табл. 4.3. Высокую вариативность этих подателей подтверждается и наибольшими значениями ихдисперсии (0,1 и 0,07) и средне квадратичного отклонения (0,32 и 0,27). Учитывая, что коэффициент взаимной корреляции между ними -0,52, то связь признается как умеренная и соответственно опираться на эти показатели в прогнозах нецелесообразно.
Рассчитанный множественный коэффициент корреляции (0,94) говорит о сильной прямой связи между результативным фактором «Количеством туристов за рубежом» и факторными признаками «Объем производства» и «Объем капстроительства». Эту связь дополнительно подтверждается графиком разброса между этими показателями и «Количеством туристов за рубежом», см. рис. 4.2. Таким образом, эти факторы могут использоваться для прогнозирования объема спроса на путевки.
Визуализация путем нормирования данных подтверждает наличие сильной связи между результативным фактором «Количеством туристов за рубежом» и факторными признаками «Объем производства» и «Объем капстроительства» см. рис. 4.1.
5. Статистический анализ вариационных
(интервальных) данных (Задача №3)
Совокупность значений изучаемого признака с указанием числа их различных значений называется распределением признака. Распределение представляют в форме вариационного ряда. В соотношении значений признака (вариантов) и числа единиц (частот) проявляется закономерность распределения. Она описывается различными статистическими показателями в частности:
· частотные показатели;
· показатели центра распределения;
· показатели степени вариации;
· показатели формы распределения.
Частотными показателями любого ряда распределения являются абсолютная численность i- и группы – частота fi и относительная частота – частость di , где , а , или 100%.
Кумулятивная (накопленная) частота Si (частость Sd) характеризует объем совокупности со значениями вариантов, не превышающих Xi,. Кумулятивные частотные показатели образуются последовательным суммированием абсолютных или относительных частот, например: S1=fi; S2=f1+f2; S3=f1+f2+f3 и т. д.
Плотность частоты (частости) представляет собой частоту, приходящуюся на единицу интервала, т.е. qi=fi/hi или qi=di/hi, где hi, - величина i-го интервала. Данный показатель используют, если интервалы вариационного ряда неравные и необходимо графически изобразить этот ряд в виде гистограммы, а так же при расчете моды.
Показатели центра распределения. К показателям центра распределения относят среднюю, моду и медиану.
Средняя величина характеризует типичный уровень признака в совокупности. По данным вариационного ряда распределения средняя рассчитывается как арифметическая взвешенная:
· на основе частот:
· на основе частостей
Если используется интервальный ряд распределения то, допуская, что распределение в границах i-го интервала является равномерным, как вариант хi, - используют середину интервала (х'). При этом величину открытого интервала условно считают такой же, как и величину соседнего закрытого интервала.
Пример. Провести анализ данных о результатах деятельности предприятия по оказанию услуг. В таблице 5.1 приводится данные о частоте с которой встречается дневная реализация в соответствующем диапазоне.
Таблица 5.1
Результаты деятельности предприятии
по оказанию услуг населению
Возраст оборудования, тас. руб | Количество дней (fi) | Середина интервала хi | хifi | Накопленная частота, Si | [xi-xср] | [xi-xср]*fi | [xi-xср]2 *fi | (xi-xср)3 *fi | (xi-xср)4 *fi |
До 5 | 2,5 | 11,2 | 112,0 | 1254,4 | -14049 | ||||
5 – 10 | 7,5 | 142,5 | 6,2 | 117,8 | 730,4 | -4528,2 | |||
10 – 15 | 12,5 | 1,2 | 36,0 | 43,2 | -51,8 | 62,2 | |||
15 – 20 | 17,5 | 3,8 | 91,2 | 346,6 | 1316,9 | 5004,3 | |||
20 - 25 | 22,5 | 8,8 | 105,6 | 929,3 | 8177,7 | 71963,4 | |||
25 - 30 | 27,5 | 137,5 | 13,8 | 69,0 | 952,2 | ||||
å | - | 531,6 | 4256,0 | 4005,6 |
Внимание!В контрольных заданиях, исходные данные могут задаваться в виде величины дневной реализации, см. табл. 5.2 и рис. 5.1. В этом случае необходимо преобразовать исходные данные в частотные. Для этого необходимо провести группировку (см. выше) исходных данных с равными группировочными интервалами. В ниже приведенном примере, интервал принимается равным 0,4 тыс. руб., а весь диапазон разбивается на 10 групп (то есть необходимо сощитать количество дней, в которые реализация находилась в заданных границах).
Таблица 5.2