Тема 5. средние величины
5.1. Сущность и значение средних величин
5.2. Степенные средние
5.3. Структурные средние
5.1. Средние величины, наиболее распространённая форма статистических показателей, используемых в исследованиях социально-экономических явлениях.
Средняя величина – это показатель, выражающий типичные черты и дающий обобщающую количественную характеристику уровня по однородным общественным явлениям.
Сущность средних величин заключается в том, что в них происходит взаимопогашение, растворение возможных отклонений признака, обусловленных действием случайных факторов, учитываются изменения вызванные действием основных факторов. Это даёт возможность отражать типичный уровень признака, абстрагироваться от индивидуальных особенностей, свойственных отдельным единицам. В процессе осреднения проявляется основное свойство средней – отражать то общее, что присуще всем единицам изучаемой совокупности.
Объективность и типичность средней обеспечивается при условии, что: а) средняя должна вычисляться для качественно однородной совокупности, расчёт которой должен сочетаться с методом группировок; б) при вычислении средней необходимы массовые данные.
Средняя – величина именованная, имеющая ту же размерность, что и признак у отдельных единиц совокупности.
В статистико-экономических расчётах применяются две категории средних величин: степенные и структурные.
5.2. К категории степенных относят: среднюю арифметическую, среднюю гармоническую, среднюю геометрическую, среднюю квадратическую и кубическую.
Указанные средние величины могут быт вычислены, когда каждый вариант в данной совокупности встречается один раз, при этом средняя, называется простой, а когда варианты повторяются различное число раз, то в данном случае называют - средней арифметической взвешенной.
Обозначения: xi - варианта или отдельное значение изучаемого признака;
f (ƒ; t) – частота, статистический вес, повторяемость индивидуальных значений признака;
х – средняя (черта вверху – знак осреднения);
n - количество единиц изучаемой совокупности;
W – объём изучаемого признака (W = x ∙ t)
Средняя арифметическая – наиболее распространённый вид средней. Различают простую и взвешенную.
Хср = ∑х/n(простая) – применяется в случаях, если известны только индивидуальные значения варьирующего признака.
Хср = ∑х ∙ ƒ / ∑ƒ(взвешенная) - применяется, когда то или иное значение изучаемого признака совокупности повторяется неодинаковое число раз. В данной ситуации расчёт средней производится по сгруппированным данным.
Средняя арифметическая обладает рядом свойств характеризующих её более полнее.
1. Произведение средней на сумму частот равно сумме произведений отдельных вариантов на соответствующие им частоты: х Σf = Σ x ∙ f
2. Сумма отклонений индивидуальных значений признака от средней арифметической равно нулю: Σ(x - х) ∙ f = 0
3. Сумма квадратов отклонений индивидуальных значений признака от средней арифметической меньше, чем сумма квадратов их отклонений от любой другой произвольной величины.
4. Если все осредняемые варианты изменить на постоянной число А, то средняя арифметическая соответственно изменится на ту же величину:
Σ(x ± А)∙ f / Σ f = х ± А
5. Если все варианты значений варьирующего признака изменить в А раз, то средняя изменится во столько же раз: Σ(x :(∙)А)∙ f / Σ f = х ↑или ↓ в А раз;
6. Если все статистические веса изменить в А раз, то средняя арифметическая от этого не изменится: Σ(x ∙ (f ↕ в А раз)/ Σ f ↕ в А раз = х
Средняя гармоническая – величина обратно пропорциональная средней арифметической. Различают простую и взвешенную.
Простая – хср = n / ∑1/х - применяется в случае, когда индивидуальные значения признака выражены в форме обратных значений
Взвешенная – хср = ∑W / ∑W/х - исчисляется, когда известны значения осредняемого признака и объёма изучаемого явления (используется более чаще), но неизвестны весы.
Средняя геометрическая используется для анализа развития явления в динамике, В частности, средних значений коэффициентов и темпов роста. Исчисляют по несгруппированным и по сгруппированным данным соответственно: хср = n-1√х1 · х2 · х3 · хn = n-1√Σ∏хи хср= n-1√х1f1 · х2f2 · х3f3 · хnfn
Кроме того эту среднюю можно рассчитать двумя способами:
а) если при расчёте средней геометрической индивидуальные значения признака представляют собой относительные показатели динамики (коэффициенты роста), построенные в виде цепных величин, как отношение каждого уровня ряда к предыдущему: kср = n-1√k1 · k 2 · k 3 · k n = n-1√Σ∏ k;
б) через эмпирические (фактические) уровни ряда динамики:
Ý = n-1√ Ý n : Ý0
Средняя квадратическая – наиболее широко используется при расчёте вариации признаков, в частности, расчёта линейных мер и среднего квадратического отклонения, а также применяется в технических отраслях (при сооружении трубопроводов). Данную среднюю также исчисляют по несгруппированным и сгруппированным значениям: хср = √ Σх2 / n –простая;
Хср = √ Σх2 · f / Σf- взвешенная.
5.3. Наряду с рассмотренными выше средними степенными величинами в качестве статистической характеристики рядов распределения рассчитывают структурные средние: моду и медиану.
В отличие от первых, структурные средние не являются абстрактными, а выступают как конкретные величины, совпадающие с вполне определёнными вариантами совокупности.
Для расчёта моды и медианы необходимо уяснить такие понятия, как дискретный ряд, интервальный ряд, накопление частот.
Дискретный – такое преобразование ранжированного ряда, при котором перечисляются отдельные значения признака и указывается его частота.
Интервальный ряд – имеет место в случае, если число вариантов велико и объединение их возможно лишь за базе интервала, - группы, имеющей пределы значений варьирующих признаков.
Накопление частот – число единиц совокупности, полученных суммированием частот всех предшествующих интервалов.
Мода - значение признака, наиболее часто встречающееся в вариационном ряду. Во многих случаях вокруг неё концентрируется большая часть вариантов. При изменении распределения в его концах, мода не меняется, она обладает определённой устойчивостью к вариации. Поэтому её удобно определять при изучении рядов с неопределёнными границами.
Для дискретных рядов модой будет значение варианты с наибольшей частотой. Для интервальных – по наибольшей частоте (из суммы частот выбирают большее значение). Далее по формуле: Мо = х0 + i · (∆1/(∆1 + ∆2)),
где: х0 – нижняя граница интервала; i -размер интервала; ∆1 -разность между частотой модального и предшествующего ряда; ∆2 -разность между частотой модального и последующего ряда
Медиана – значение признака, расположенного в средине ранжированно-го ряда, и делящее этот ряд на две равные части.
Ранжирование - процесс упорядочивания объектов изучения в порядке возрастания или убывания.
Если же ряд чётный, то медианой будет являться средняя из двух центра-льных значений. В дискретном ряду вначале определяют номер медианной единицы по формуле: NМе = (n+1)/2,
где: n – объём единиц совокупности. Далее по наколенным частотам.
В интервальном – вначале накапливают частоты, далее определяют полусумму частот (1/2Σ Sm), затем устанавливают медианный интервал (что соответствует первому значению накопленной частоты, превысившей полусумму общего числа). Далее по формуле: Me = x0 – i ∙ (1/2ΣSm–Sm-1)/fm
где: х0 – нижняя граница интервала; i -размер интервала; 1/2Σ Sm – полусумма накопленныхчастот; Sm-1 -частота, накопленная до медианного ряда; fm – значение медианного ряда.
Главное свойство медианы в том, что сумма абсолютных отклонений значений признака от медианы меньше, чем от любой другой величины:
Σ│xi -Me│ = min