Средняя кубическая взвешенная
Средние квадратическая и кубическая имеют ограниченное применение в практике статистики. Более используется в статистике средняя квадратическая, но не из самих вариантов x, а из их отклонений от средней при расчете показателей вариации.
Особым видом средних величин являются структурные средние. Они применяются для изучения внутреннего строения и структуры рядов распределения значений признака. Это мода и медиана.
Мода (Мо)– значение признака, наиболее часто встречающееся в совокупности, т.е. варианта, имеющая наибольшую частоту.
Например, имеются следующие данные по бригаде:
Выработка деталей за смену одним рабочим, шт. | Число рабочих |
Итого |
В данном случае модальное значение выработки равно 20 деталей, т.к. ему соответствует наибольшая частота f = 5.
В интервальных рядах распределения с равными интервалами мода вычисляется по формуле:
, где
х Мо – нижняя граница модального интервала
i Мо – величина модального интервала
f Мо – частота модального интервала
f Мо-1 – частота интервала, стоящего перед модальным
f Мо+1 – частота интервала, следующего за модальным
Модальный интервал – это интервал, которому соответствует наибольшая частота f.
Например, имеются данные по предприятиям региона:
Группы предприятий по стоимости основных фондов, млн. руб | Число предприятий |
14-16 | |
16-18 | |
18-20 | |
20-22 | |
22-24 | |
Итого |
Модальным значением стоимости основных фондов предприятий региона является стоимость равная 18,8 млн. руб.
Медиана (Ме)– это варианта, находящаяся в середине ранжированного вариационного ряда. Медиана делит ряд на две равные (по числу единиц) части – со значениями признака меньше медианы и со значениями признака больше медианы.
Если вариационный дискретный ряд нечетный, то номер медианы вычисляется по формуле:
, где n – число членов ряда.
Например, имеются данные по бригаде:
Табельный № рабочего | Выработка за месяц, тыс. руб |
Ранжируем выработку по возрастанию признака:
№ по ранжиру | |||||||
Выработка, тыс. руб. |
Определяем номер медианового показателя , таким образом, медиана равна 690 тыс. руб., т.е. одна половина рабочих бригады имела выработку менее 690 тыс. руб., а другая – более 690 тыс. руб.
В случае четного вариационного дискретного ряда медиана равна средней из двух вариантов, находящихся в середине ряда.
Например, имеется заработная плата по 8 рабочим завода:
Табельный номер | Зарплата, тыс. руб. |
5,3 | |
4,8 | |
5,2 | |
5,0 | |
5,5 | |
6,0 | |
4,9 | |
5,5 |
Проранжируем ряд по возрастанию зарплаты:
Номер по ранжиру | Зарплата, тыс. руб. |
4,8 | |
4,9 | |
5,0 | |
5,2 | |
5,3 | |
5,5 | |
5,5 | |
6,0 |
В середине стоят 4 и 5 рабочие по ранжиру, значит
Медианная зарплата равна 5,25 тыс. руб.
В интервальных рядах распределения медианное значение (поскольку оно делит совокупность на две равные по численности части) оказывается в каком-то из интервалов. Этот интервал характерен тем, что его кумулятивная частота (накопленная сумма частот) равна или превышает полусумму всех частот ряда. Значение медианы вычисляется по формуле:
, где
х Ме – нижняя граница медианного интервала
i Ме – медианный интервал
- полусумма всех частот ряда
S Ме – сумма частот интервалов, стоящих перед медианным
fМе – частота медианного интервала
Например, имеются данные по предприятиям региона:
Группы предприятий по стоимости основных фондов, млн. руб. | Число предприятий |
14-16 | |
16-18 | |
18-20 | |
20-22 | |
22-24 | |
Итого |
Прежде всего найдем медианный интервал, , т.е. медианное значение будет средним из значений у 12-го и 13-го предприятий в ранжированном ряду. Очевидно, что эти предприятия находятся в третьем интервале (18-20 млн. руб.), поскольку его кумулятивная частота равна 18(2+6+10), что превышает половину суммы всех частот ( ).
Из 25 предприятий региона 12 предприятий имеют стоимость основных фондов менее 18 млн. руб., а 12 предприятий – более 18 млн. руб.
Показатели вариации
Вариация – это различие в значениях какого – либо признака у разных единиц данной совокупности в один и тот же период или момент времени.
Например работники СХПК различаются по доходам, затратам времени на работу, росту, весу, образованию, профессии и т.д.
Средняя величина дает обобщающую характеристику признака изучаемой совокупности, но она не раскрывает строение совокупности, не показывает, как располагаются около нее варианты осредняемого признака. Чем больше варианты отдельных единиц совокупности различаются между собой, тем больше они отличаются от своей средней, и наоборот, - чем меньше варианты отличаются друг от друга, тем меньше они отличаются от средней, которая в таком случае будет более реально представлять всю совокупность. Поэтому возникает необходимость измерять вариацию признака в совокупностях с помощью ряда обобщающих показателей. К ним относятся: размах вариации, среднее линейное отклонение, дисперсия и среднее квадратическое отклонение, коэффициент вариации.
Размах вариации R –разность между максимальным и минимальным значениями признака
R = Xmax - Xmin
Однако размах вариации показывает лишь крайние отклонения признака и не отражает отклонений всех вариант в ряду. Для более точного анализа вариации необходимы показатели, которые отражают все колебания варьирующего признака и дают обобщенную характеристику. Простейший из показателей такого типа – среднее линейное отклонение .Оно определяется как среднее арифметическое из отклонений индивидуальных значений от средней без учета знака этих отклонений.
или
Среднее линейное отклонение как меру вариации признака применяют в статистической практике в тех случаях, когда суммирование показателей без учета знаков имеет экономический смысл (например, анализ состава работающих, ритмичность производства, оборот внешней торговли).
Дисперсия в зависимости от исходных данных вычисляется по формулам простой и взвешенной.
или
Дисперсия представляет собой средний квадрат отклонений вариантов от их средней величины.
Среднее квадратическое отклонение равно корню квадратному из дисперсии. Оно показывает, на сколько в среднем отклоняются конкретные варианты от их среднего значения. Среднее квадратическое отклонение является абсолютной мерой колеблемости признака и выражается в тех же единицах, что и варианты.
Чем меньше значение дисперсии и среднего квадратического отклонения, тем качественно однороднее совокупность и тем более типичной будет средняя величина.
Для сравнения вариаций различных признаков, а также колеблемости одного и того же признака в нескольких совокупностях используют относительный показатель вариации – коэффициент вариации V.
Коэффициент вариации характеризует, на сколько процентов в среднем отклоняются индивидуальные показатели от их среднего значения.
Коэффициент вариации используют не только для сравнительной оценки вариации единиц совокупности, но и как характеристику однородности совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33%.
Например, имеются данные о сменной выработке рабочих бригады, которые представлены интервальным рядов распределения:
Группы рабочих по сменной выработке изделий, шт. | Число рабо- чих f | Середина интервала x | Расчетные значения | |||
X f | ||||||
170-190 | -36 | |||||
190-210 | -16 | |||||
210-230 | ||||||
230-250 | ||||||
Итого | X | X | X |
Исчислим среднюю выработку на одного работника:
(шт.)
Среднеквадратическое отклонение:
(шт.)
Коэффициент вариации:
Таким образом, индивидуальные выработки рабочих за смену колеблются вокруг средней выработки в среднем на 216 изделий или 8%. Данная бригада рабочих по выработке достаточно однородна, поскольку вариация признака составляет лишь 8%, что меньше 33%.
Вариация признака обусловлена различными факторами. Определить их влияние на колеблемость индивидуальных значений признака можно при помощи трех видов дисперсий:
1) общей дисперсии
2) межгрупповой дисперсии
3) средней из внутригрупповых дисперсий
Общая дисперсия измеряет вариацию признакапо всейсовокупности под влиянием всех факторов, обусловивших эту вариацию. Она может быть вычислена по простой или взвешенной формуле:
или
Межгрупповая дисперсия характеризует систематическую вариацию результативного признака, обусловленную влиянием факторного признака, положенного в основу группировки.
,т.е. она равна среднему квадрату отклонений групповых средних от общей средней по всей совокупности .
Внутригрупповая дисперсия отражает случайную вариацию, т.е. часть вариации, обусловленную влиянием неучтенных факторов и не зависящую от группировочного признака. Она исчисляется внутри каждой группы:
или
На основании внутригрупповых дисперсий вычисляют среднюю из внутригрупповых дисперсий:
Согласно правилу сложения дисперсий общая дисперсия равна сумме межгрупповой дисперсии и средней из внутригрупповых дисперсий, т.е.
Например, при изучении влияния квалификации (тарифного разряда) рабочих на уровень производительности труда в цехе были получены данные, представленные в таблице:
NN п/п | Рабочие 4-го разряда | N п/п | Рабочие 5-го разряда | ||||
Выработка, шт. | Выработка, шт. | ||||||
-3 | -1 | ||||||
-1 | -1 | ||||||
-1 | |||||||
-2 | |||||||
Итог | X | X |
Результативный признак – выработка рабочего – варьирует под влиянием факторного признака (квалификации), а также под влиянием других неучтенных случайных факторных признаков. Задача заключается в измерении этих вариаций с помощью дисперсий: общей, межгрупповой и внутригрупповых.
1. Для расчета групповых дисперсий исчислим средние выработки по каждой группе и общую среднюю выработку, шт.:
по первой группе
по второй группе
в целом по десяти рабочим
2 .Исчислим общую дисперсию по формуле
Общая дисперсия отражает суммарное влияние всех возможных факторов на общую вариацию выработки изделий в среднем рабочими цеха.
3. Исчислим межгрупповую дисперсию
Межгрупповая дисперсия характеризует вариацию групповых средних, обусловленную различиями групп рабочих по квалификационному разряду.
4. Данные для расчета внутригрупповых дисперсий представлены в таблице.
Внутригрупповые дисперсии
- по первой группе
- по второй группе
Средняя из внутригрупповых дисперсий:
отражает вариацию выработки, обусловленную всеми факторами, кроме квалификации рабочих.
5. Проверим правило сложения дисперсий:
Очевидно, чем больше доля межгрупповой дисперсии в общей, тем сильнее влияние группировочного признака (квалификационного разряда) на результативный признак (количество изделий на рабочего).
Для определения этой доли используется эмпирический коэффициент детерминации
показывает долю вариации результативного признака под влиянием факторного признака.
или 66,6%
Это означает, что на 66,6% вариация производительности труда рабочих обусловлена различиями в их квалификации и на 33,4% (100% - 66,6% = 33,4%) – влиянием прочих факторов.
6. Контрольные вопросы и тесты
1. Что такое абсолютные статистические величины и какого их значение? Приведите примеры абсолютных величин.
2. Назовите виды статистических показателей. Приведите примеры.
3. В каких единицах измерения выражаются абсолютные статистические величины?
4. Что называется относительными величинами?
5. В какой форме могут быть выражены относительные величины?
6. Какие виды относительных величин вы знаете? Приведите примеры.
7. Дайте определение средней.
8. В чем смысл научно обоснованного использования средних величин?
9. Какие виды средних величин применяются в статистике?
10. Как исчисляются средняя арифметическая простая и взвешенная и в каких случаях они применяются?
11. Что представляет собой вариация признака?
12. Перечислите показатели, характеризующие вариацию.
13. Охарактеризуйте коэффициент вариации и его значение для экономического анализа.
14. Что характеризует межгрупповая дисперсия?
15. Что собой представляет правило сложения дисперсий?
16. Перечислите абсолютные показатели:
а) валовой внутренний продукт России в 2002 году составил 10 трлн рублей
б) темп роста урожайности зерна на предприятии составил 101%
в) средняя урожайность овощей в регионе составила 115 ц/га
г) объем совокупности составил 300 единиц
17. Грузооборот на предприятии составил 200 тысяч тонно-километров. Это:
а) натуральная абсолютная величина
б) условно-натуральная абсолютная величина
в) комбинированная абсолютная величина
г) относительная величина
18. Верно ли утверждение: «Абсолютный показатель всегда является именованным числом»:
а) да, всегда
б) нет, никогда
в) в некоторых случаях является, в некоторых – нет
19. Что является базой сравнения при расчете относительного показателя:
а) числитель
б) знаменатель
в) частное от деления
г) сомножитель
20. Относительная величина структуры определяется как отношение:
а) факта текущего периода к факту базисного периода
б) плана текущего периода к факту базисного периода
в) факта текущего периода к плану
г) части совокупности к общему объему совокупности
21. Соотношение мужчин и женщин в регионе сложилось как 1:2. Это:
а) относительная величина интенсивности
б) относительная величина координации
в) относительная величина сравнения
г) относительная величина структуры
22. Установить соответствие:
1) План выполнен на 20% 2) По сравнению с прошлым годом в текущем прибыль увеличилась на 3% 3) Плотность населения составила в регионе 50 человек на 4) Удельный вес мужчин на предприятии составил 46% | а) относительная величина интенсивности б) относительная величина планового задания в) относительная величина выполнения плана г) относительная величина структуры д) относительная величина динамики |
23. При определении среднего темпа роста следует применять:
а) среднюю арифметическую
б) среднюю хронологическую
в) среднюю геометрическую
г) среднюю кубическую
24. Имеются данные по предприятию:
Бригада | Площадь зерновых, га | Урожайность, ц/га |
№ 1 № 2 | 15,0 22,0 |
Какой вид средней следует применять при определении урожайности зерна в целом по предприятию:
а) средняя арифметическая простая
б) средняя арифметическая взвешенная
в) средняя гармоническая
г) любую из степенных средних
25. Мода – это:
а) одна из степенных средних
б) структурная средняя, наиболее часто встречающаяся в совокупности
в) структурная средняя, величина которой делит совокупность пополам
26. Из перечисленных показателей отметить показатели степени вариации:
а) средняя арифметическая
б) размах вариации
в) мода
г) медиана
д) дисперсия
е) коэффициент вариации
ж) показатель эксцесса
27. Установить соответствие:
1) Размах вариации 2)Среднее квадратическое отклонение 3) Коэффициент осцилляции 4) Коэффициент вариации | а) квадратный корень из дисперсии б) разность между наибольшим и наименьшим значениями признака в) размах вариации / г) среднее квадратическое отклонение / |
28. Коэффициент вариации = 50%. Вывод:
а) совокупность однородна
б) совокупность неоднородна
в) коэффициент вариации не может быть равен 50%
г) размах вариации составляет 50% от средней величины
29. Индивидуальные значения признака варьируют вокруг среднего его значения в среднем на 9 единиц. Об этом говорит:
а) размах вариации
б) среднее квадратическое отклонение
в) коэффициент осцилляции
г) коэффициент вариации
30. Межгрупповая дисперсия характеризует:
а) вариацию признака под влиянием всех обусловивших ее факторов
б) вариацию признака под влиянием группировочного показателя
в) часть вариации, происходящую под влиянием неучтенных в данной группировке факторов
г) правильного варианта нет
7. Задачи для самостоятельного решения
ЗАДАЧА 1
За отчетный квартал потребление топлива на производственные нужды по предприятию следующее: уголь – 1200 т, газ – 380 тыс. , нефть – 210 т. Определите, какую долю в общем объеме потребленного топлива занимает уголь, если коэффициенты пересчета в условное топливо следующие: уголь – 0,9 т; газ – 1,2 тыс. ; нефть – 1,3 т.
ЗАДАЧА 2
За отчетный период фабрика выпустила тетрадей: 12 – листных – 50000 штук, 24 – листных – 20000 штук, 60 – листных – 10000 штук, 96 – листных – 50000 штук. Определите общий выпуск тетрадей в условно – натуральном виде ( в пересчете на 12 – листные ).
ЗАДАЧА 3
Годовой план по реализации готовой продукции выполнен группой предприятий следующим образом:
Номер предприятий | План реализации, тыс. руб. | Фактически реализовано, тыс. руб. |
1. | ||
2. | ||
3. | ||
4. | ||
ИТОГО |
Вычислите степень выполнения плана по реализации готовой продукции по каждому предприятию и группе предприятий в целом.
ЗАДАЧА 4
Планом предусматривалось снизить себестоимость продукции на 5%, фактически она снижена на 6% по сравнению с уровнем прошлого года. Определите, на сколько процентов перевыполнен план по снижению себестоимости.
ЗАДАЧА 5
По фирме имеются данные о выпуске продукции за квартал:
№ отделения фирмы | Выпуск продукции по плану, млн. руб. | Процент выполнения плана по выпуску продукции |
1. | 103,5 | |
2. | ||
3. |
Определите: а) процент выполнения плана по выпуску продукции в целом на фирме;
б) удельный вес отделений в общем объеме фактического выпуска продукции фирмы.
ЗАДАЧА 6
Имеются данные по городу:
Показатели | 2005г. | 2006г. | 2007г. |
Весь жилой фонд на начало года, тыс. | |||
Численность населения на начало года, тыс. чел. | 14,6 | 14,5 | 14,2 |
1) охарактеризуйте изменение обеспеченности населения города жилой площадью;
2) перечислите, какие виды относительных величин использовались.
ЗАДАЧА 7
По грузовому автотранспортному предприятию имеются следующие данные:
№ автоколонны | Объем грузовых перевозок, тыс. т | ||
Базисный год | Отчетный год | ||
план | Факт | ||
1. | |||
2. | |||
3. |
Рассчитайте относительные величины планового задания, выполнения плана, динамики, сравнения, структуры.
ЗАДАЧА 8
Имеются данные о пяти с.-х. предприятиях района, специализирующихся на производстве зерна:
Наименования с.-х. предприятия | Посевная площадь, га | Урожайность с 1 га, ц | Валовой сбор, ц |
СХПК «Заря» | 14,5 | ||
ТОО «Рассвет» | 13,8 | ||
СПК «Колос» | 14,2 | ||
ТОО им. Мичурина | 16,8 | ||
СПК «Победа» | 12,2 | ||
ИТОГО | X |
Определите для данной совокупности с.-х. предприятий следующие средние показатели: 1) посевную площадь; 2) урожайность с 1 га;
3) валовой сбор.
ЗАДАЧА 9
Определите средний вес ( в % ) бракованной продукции за 3 квартал по следующим данным:
Показатели | Июль | Август | Сентябрь |
Выпуск годной продукции, млн. руб. | |||
Удельный вес бракованной продукции, % | 6,0 | 3,3 | 4,1 |
ЗАДАЧА 10
Определите среднюю рентабельность фермерских хозяйств района:
№ п/п | Прибыль, млн. руб. | Рентабельность, % |
1. | ||
2. | ||
3. | ||
4. |
ЗАДАЧА 11
Известно распределение работников предприятия по возрасту:
Возраст, лет | Число работников |
До 25 | |
25-30 | |
30-40 | |
40-50 | |
50-60 | |
60 и более | |
ИТОГО |
Рассчитайте средний, модальный и медианный возраст работников предприятию. Сделайте вывод.
ЗАДАЧА 12
Имеются следующие данные специального статистического обследования потоков покупателей в один из дней работы универмага:
Часы работы: до 11 11-13 13-15 15-17 17-19 19 и позже ИТОГО
Число посетителей,
% к итогу 6 10 14 18 30 22 100
Определите моду.
ЗАДАЧА 13
Имеются следующее распределение рабочих завода по числу обслуживаемых станков:
Количество
обслуживаемых
станков 2-4 4-6 6-8 7-10 10-12 ИТОГО
Численность
рабочих, чел. 230 360 840 420 150 2000
Определите медиану.
ЗАДАЧА 14
Имеются данные о распределении семей города по размеру:
Численн.
семьи, чел. 2 3 4 5 ВСЕГО
Число семей 7200 23405 15100 3560 49265
Рассчитайте средний, модальный и медианный размер семьи.
ЗАДАЧА 15
Распределение работающих женщин предприятия по количеству времени, затрачиваемого на домашнюю работу за день, характеризуется следующими данными:
Количество часов до 1 1-2 2-3 3-4 4-5 5-6 ВСЕГО
Число женщин 3 16 42 30 8 1 100
Определите среднее количество часов, затрачиваемых на домашнюю работу за день, и показатели вариации.
ЗАДАЧА 16
Имеются следующие данные:
Показатели | Число рабочих | Месячная заработная плата каждого за март, руб. |
Токари | 3252; 3548; 3600; 3400 | |
Слесари | 3450; 3380; 3260; 3700; 3250; 3372 |
Проверьте правило сложения дисперсий и определите, велико ли влияние профессии на различие в уровне заработной платы.