Расчет характеристик ряда распределения
Для расчета характеристик ряда распределения , σ, σ2, Vσ на основе табл. 5 строим вспомогательную таблицу 6 (– середина интервала).
Таблица 6
Расчетная таблица для нахождения характеристик ряда распределения
Группы предприятий по среднегодовой стоимости основных производственных фондов, млн.руб. | Середина интервала, | Число предприятий, fj | ||||
20,0-28,0 | 24,0 | -16,0 | 256,0 | |||
28,0-36,0 | 32,0 | -8,0 | 64,0 | |||
36,0-44,0 | 40,0 | 0,0 | 0,0 | |||
44,0-52,0 | 48,0 | 8,0 | 64,0 | |||
52,0-60,0 | 56,0 | 16,0 | 256,0 | |||
ИТОГО | - | - | - |
Рассчитаем среднюю арифметическую взвешенную:
млн.руб.
Рассчитаем среднее квадратическое отклонение:
млн.руб.
Рассчитаем дисперсию:
σ2= 8,52= 72,5
Рассчитаем коэффициент вариации:
Вывод. Анализ полученных значений показателей и σ говорит о том, что средняя величина среднегодовой стоимости основных производственных фондов составляет 40,0 млн.руб., отклонение от этой величины в ту или иную сторону составляет в среднем 8,5 млн.руб. (или 21,3%), наиболее характерная Среднегодовая стоимость основных производственных фондов находится в пределах от 31,5 до 48,5 млн.руб. (диапазон ).
Значение Vσ = 21,3% не превышает 33%, следовательно, вариация среднегодовой стоимости основных производственных фондов в исследуемой совокупности предприятий незначительна и совокупность по данному признаку однородна. Расхождение между значениями , Мо и Ме незначительно ( =40,0 млн.руб., Мо=41,0 млн.руб., Ме=40,4 млн.руб.), что подтверждает вывод об однородности совокупности предприятий. Таким образом, найденное среднее значение среднегодовой стоимости основных производственных фондов (40,0 млн.руб.) является типичной, надежной характеристикой исследуемой совокупности предприятий.
Вычисление средней арифметической по исходным данным о среднегодовой стоимости основных производственных фондов предприятий
Для расчета применяется формула средней арифметической простой:
млн.руб.
Причина расхождения средних величин, рассчитанных по исходным данным (39,6 млн.руб.) и по интервальному ряду распределения (40,0 млн.руб.), заключается в том, что в первом случае средняя определяется по фактическим значениям исследуемого признака для всех 30-ти предприятий, а во втором случае в качестве значений признака берутся середины интервалов и, следовательно, значение средней будет менее точным. Вместе с тем, при округлении обеих рассматриваемых величин их значения совпадают (40,0 млн.руб.), что говорит о достаточно равномерном распределении среднегодовой стоимости основных производственных фондов внутри каждой группы интервального ряда.
Задание 2
По исходным данным табл. 1 с использованием результатов выполнения Задания 1 необходимо выполнить следующее:
1. Установить наличие и характер корреляционной связи между признаками Среднегодовая стоимость основных производственных фондови Выпуск продукции, используя метод аналитической группировки.
2. Оценить тесноту и силу корреляционной связи, используя коэффициент детерминации и эмпирическое корреляционное отношение.
3. Оценить статистическую значимость показателя силы связи.
Сделать выводы по результатам выполнения Задания 2.
Выполнение задания 2
Целью выполнения данного Задания является выявление наличия корреляционной связи между факторным и результативным признаками, установление направления связи, оценка тесноты и силы связи.
Факторный и результативный признаки либо задаются в условии задания, либо определяются путем проведения предварительного теоретического анализа. Лишь после того, как выяснена экономическая сущность явления и определены факторный и результативный признаки, приступают к проведению корреляционного анализа данных.
По условию Задания 2 факторным является признак Среднегодовая стоимость основных производственных фондов (X), результативным – признак Выпуск продукции(Y).
1. Установление наличия и характера корреляционной связи между признаками Среднегодовая стоимость основных производственных фондов и Выпуск продукции методом аналитической группировки
Аналитическая группировка строится по факторному признаку Х и для каждой j-ой группы ряда определяется среднегрупповое значение результативного признака Y. Если с ростом значений фактора Х от группы к группе средние значения систематически возрастают (или убывают), между признаками X и Y имеет место корреляционная связь.
Используя разработочную таблицу 3, строим аналитическую группировку, характеризующую зависимость между факторным признаком Х- среднегодовая стоимость основных производственных фондов и результативным признаком Y - выпуск продукции. Макет аналитической таблицы имеет следующий вид (табл. 7):
Таблица 7
Зависимость выпуска продукции от среднегодовой стоимости основных производственных фондов
Номер группы | Группы предприятий по среднегодовой стоимости основных производственных фондов, млн.руб., x | Число предприятий, fj | Выпуск продукции, млн руб. | |
всего | в среднем на одно предприятие, | |||
5=4:3 | ||||
ИТОГО |
Групповые средние значения получаем из таблицы 3 (графа 4), основываясь на итоговых строках «Всего». Построенную аналитическую группировку представляет табл. 8:
Таблица 8
Зависимость выпуска продукции от среднегодовой стоимости основных производственных фондов
Номер группы | Группы предприятий по среднегодовой стоимости основных производственных фондов, млн.руб., x | Число предприятий, fj | Выпуск продукции, млн. руб. | |
всего | в среднем на одно предприятие, | |||
5=4:3 | ||||
20,0-28,0 | 29,0 | |||
28,0-36,0 | 35,0 | |||
36,0-44,0 | 39,0 | |||
44,0-52,0 | 46,0 | |||
52,0-60,0 | 53,0 | |||
ИТОГО | 40,0 |
Вывод. Анализ данных табл. 8 показывает, что с увеличением среднегодовой стоимости основных производственных фондов от группы к группе систематически возрастает и средний выпуск продукции по каждой группе предприятий, что свидетельствует о наличии прямой корреляционной связи между исследуемыми признаками.
2. Измерение тесноты корреляционной связи с использованием коэффициента детерминации и эмпирического корреляционного отношения
Коэффициент детерминации характеризует силу влияния факторного (группировочного) признака Х на результативный признак Y и рассчитывается как доля межгрупповой дисперсии признака Y в его общей дисперсии :
где – общая дисперсия признака Y,
– межгрупповая (факторная) дисперсия признака Y.
Общая дисперсия характеризует вариацию результативного признака, сложившуюся под влиянием всех действующих наY факторов (систематических и случайных) и вычисляется по формуле
где yi – индивидуальные значения результативного признака;
– общая средняя значений результативного признака;
n – число единиц совокупности.
Межгрупповая дисперсия измеряет систематическую вариацию результативного признака, обусловленную влиянием признака-фактора Х (по которому произведена группировка) и вычисляется по формуле
где –групповые средние,
– общая средняя,
–число единиц в j-ой группе,
k – число групп.
Для расчета показателей и необходимо знать величину общей средней , которая вычисляется как средняя арифметическая простая по всем единицам совокупности:
Значения числителя и знаменателя формулы имеются в табл. 8 (графы 3 и 4 итоговой строки). Используя эти данные, получаем общую среднюю :
= =40,0 млн. руб.
Для расчета общей дисперсии применяется вспомогательная таблица 12.
Таблица 12
Вспомогательная таблица для расчета общей дисперсии
Номер предприятий | Выпуск продукции, млн. руб. | ||
-12,0 | 144,0 | ||
-11,0 | 121,0 | ||
-10,0 | 100,0 | ||
-9,0 | 81,0 | ||
-5,0 | 25,0 | ||
-5,0 | 25,0 | ||
-5,0 | 25,0 | ||
-4,0 | 16,0 | ||
-4,0 | 16,0 | ||
-4,0 | 16,0 | ||
-3,0 | 9,0 | ||
-2,0 | 4,0 | ||
-2,0 | 4,0 | ||
-1,0 | 1,0 | ||
-1,0 | 1,0 | ||
-1,0 | 1,0 | ||
0,0 | 0,0 | ||
1,0 | 1,0 | ||
1,0 | 1,0 | ||
2,0 | 4,0 | ||
2,0 | 4,0 | ||
4,0 | 16,0 | ||
5,0 | 25,0 | ||
5,0 | 25,0 | ||
6,0 | 36,0 | ||
6,0 | 36,0 | ||
8,0 | 64,0 | ||
11,0 | 121,0 | ||
13,0 | 169,0 | ||
15,0 | 225,0 | ||
Итого | - | 1316,0 |
Рассчитаем общую дисперсию:
=
Для расчета межгрупповой дисперсии строится вспомогательная таблица 13. При этом используются групповые средние значения из табл. 8 (графа 5).
Таблица 13
Вспомогательная таблица для расчета межгрупповой дисперсии
Группы предприятий по среднегодовой стоимости основных производственных фондов, млн.руб., x | Число предприятий, fj | Среднее значение выпуска продукции в группе, млн руб. | ||
20,0-28,0 | 29,0 | -11,0 | 363,0 | |
28,0-36,0 | 35,0 | -5,0 | 150,0 | |
36,0-44,0 | 39,0 | -1,0 | 11,0 | |
44,0-52,0 | 46,0 | 6,0 | 288,0 | |
52,0-60,0 | 53,0 | 13,0 | 338,0 | |
ИТОГО | 40,0 | - | 1150,0 |
Рассчитаем межгрупповую дисперсию:
Определяем коэффициент детерминации:
или 87,2%
Вывод. 87,2% вариации Выпуска продукции обусловлено вариацией Среднегодовой стоимости основных производственных фондов по продажам, а 12,8 % – влиянием прочих неучтенных факторов.
Эмпирическое корреляционное отношение оценивает тесноту связи между факторным и результативным признаками и вычисляется по формуле
Рассчитаем показатель :
Вывод: согласно шкале Чэддока связь между среднегодовой стоимостью основных производственных фондов и выпуском продукции является весьма тесной.
3. Оценка статистической значимости коэффициента детерминации .
Показатели и рассчитаны для выборочной совокупности, т.е. на основе ограниченной информации об изучаемом явлении. Поскольку при формировании выборки на первичные данные могли иметь воздействии какие-либо случайные факторы, то есть основание полагать, что и полученные характеристики связи , несут в себе элемент случайности. Ввиду этого, необходимо проверить, насколько заключение о тесноте и силе связи, сделанное по выборке, будет правомерными и для генеральной совокупности, из которой была произведена выборка.
Проверка выборочных показателей на их неслучайность осуществляется в статистике с помощью тестов на статистическую значимость (существенность) показателя. Для проверки значимости коэффициента детерминации служит дисперсионный F-критерий Фишера, который рассчитывается по формуле
,
где n – число единиц выборочной совокупности,
m – количество групп,
– межгрупповая дисперсия,
– дисперсия j-ой группы (j=1,2,…,m),
– средняя арифметическая групповых дисперсий.
Величина рассчитывается, исходя из правила сложения дисперсий:
,
где – общая дисперсия.
Для проверки значимости показателя рассчитанное значение F-критерия Fрасч сравнивается с табличным Fтаблдля принятого уровня значимости и параметров k1, k2,зависящих от величин n и m : k1=m-1, k2=n-m. Величина Fтабл для значений , k1, k2 определяется по таблице распределения Фишера, где приведены критические (предельно допустимые) величины F-критерия для различных комбинаций значений , k1, k2. Уровень значимости в социально-экономических исследованиях обычно принимается равным 0,05 (что соответствует доверительной вероятности Р=0,95).
Если Fрасч>Fтабл, коэффициент детерминации признается статистически значимым, т.е. практически невероятно, что найденная оценка обусловлена только стечением случайных обстоятельств. В силу этого, выводы о тесноте связи изучаемых признаков, сделанные на основе выборки, можно распространить на всю генеральную совокупность.
Если Fрасч<Fтабл, то показатель считается статистически незначимым и, следовательно, полученные оценки силы связи признаков относятся только к выборке, их нельзя распространить на генеральную совокупность.
Фрагмент таблицы Фишера критических величин F-критерия для значений =0,05; k1=3,4,5; k2=24-35 представлен ниже:
k2 | ||||||||||||
k1 | ||||||||||||
3,01 | 2,99 | 2,98 | 2,96 | 2,95 | 2,93 | 2,92 | 2,91 | 2,90 | 2,89 | 2,88 | 2,87 | |
2,78 | 2,76 | 2,74 | 2,73 | 2,71 | 2,70 | 2,69 | 2,68 | 2,67 | 2,66 | 2,65 | 2,64 | |
2,62 | 2,60 | 2,59 | 2,57 | 2,56 | 2,55 | 2,53 | 2,52 | 2,51 | 2,50 | 2,49 | 2,48 |
Расчет дисперсионного F-критерия Фишера для оценки =87,2%, полученной при =43,9, =38,3:
Fрасч
Табличное значение F-критерия при = 0,05:
n | m | k1=m-1 | k2=n-m | Fтабл ( ,5, 25) |
2,76 |
Вывод: поскольку Fрасч>Fтабл, то величина коэффициента детерминации =87,2% признается значимой (неслучайной) с уровнем надежности 95% и, следовательно, найденные характеристики связи между признаками Среднегодовая стоимость основных производственных фондов и Выпуск продукции правомерны не только для выборки, но и для всей генеральной совокупности предприятий.
Задание 3
По результатам выполнения задания 1 с вероятностью 0,683 необходимо определить:
1) ошибку выборки среднегодовой стоимости основных производственных фондов предприятия и границы, в которых будет находиться среднегодовая стоимость основных производственных фондов для генеральной совокупности предприятий.
2) ошибку выборки доли предприятий со среднегодовой стоимостью основных производственных фондов 44 млн руб. и более и границы, в которых будет находиться генеральная доля.
Выполнение задания 3
Целью выполнения данного Задания является определение для генеральной совокупности предприятий границ, в которых будет находиться средняя величина среднегодовой стоимости основных производственных фондов, и доля предприятий со среднегодовой стоимостью основных производственных фондов 44 млн.руб. и более.