Средние величины в статистике
Средние величины — это обобщающие показатели, в которых находят выражение действие общих условий, закономерность изучаемого явления. Сущность средней величины состоит в том, что она отражает общие черты, закономерности, тенденции, присущие данной совокупности, погашая влияние индивидуальных (случайных факторов) и поэтому является обобщающей характеристикой варьирующего признака качественно однородной совокупности.
Признак, по которому находится средняя, называется осредняемымпризнаком.
Все виды средних величин, используемые в статистических исследованиях, подразделяются на 2 категории: степенные и структурные.
Математикой доказано, что большую часть средних, которыми мы пользуемся, можно выразить в общем виде формулой средней степенной
А. Степенные средние
Наиболее распространены следующие виды степенных средних:
- средняя арифметическая
- средняя гармоническая
- средняя геометрическая
- средняя квадратическая
v Средняя арифметическая исчисляется в тех случаях, когда объем осредняемого признака образуется как сумма его значений у отдельных единиц изучаемой статистической совокупности.
Некоторые свойства средней арифметической:
1. Сумма отклонений индивидуальных значений признака от их средней величины равна нулю.
2. Сумма квадратов отклонений индивидуальных значений признака от их средней величины есть величина минимальная.
3. Если все частоты разделить на одно и то же число, средняя арифметическая останется без изменений. Т.е. для расчета средней можно воспользоваться не только значениями частот, но и значениями частостей.
Средняя арифметическая простая применяется в случаях, когда имеются отдельные значения признака, т.е. данные не сгруппированы. Равна сумме отдельных значений признака, деленной на число этих значений.
Средняя арифметическая взвешенная в дискретном ряду распределения применяется в случаях, когда данные представлены в виде рядов распределения или группировок. Одни и те же значения признака повторяются несколько раз.
где f - число одинаковых значений признака в рядах распределения, т.е. частота, или вес.
Средняя арифметическая взвешенная зависит не только от значений признака, но и от частот, т.е. от состава совокупности, от ее структуры.
Средняя арифметическая взвешенная в интервальном ряду распределения. В интервальном ряду распределения с закрытыми интервалами варианты осредняемого признака представлены не одним числом, а виде интервала «от - до». Таким образом, каждая группа ряда распределения имеет нижнее и верхнее значение вариант. Исчисление средней по сгруппированным данным производится по формуле средней арифметической взвешенной.
Чтобы применить эту формулу, варианты признака надо выразить одним числом (дискретным). За такое число принимается средняя арифметическая простая из верхнего и нижнего значения интервала. Дальнейший расчет производится обычным методом определения средней арифметической взвешенной.
v Средняя гармоническая — это величина, обратная средней арифметической. Когда статистическая информация не содержит частот по отдельным вариантам, а представлена как их произведение, применяется формула средней гармонической взвешенной. В том случае, когда объемы явлений (т.е. произведения) по каждому признаку равны, применяется средняя гармоническая простая.
Средняя гармоническая простая
Средняя гармоническая взвешенная
Где Wсложный вес, объем события по группе, по конкретному значению.
Иногда возникает проблема: какую формулу использовать – среднюю гармоническую или среднюю арифметическую? Подходит та формула, у которой и в числителе и знаменателе будут величины, обладающие смыслом.
Подсказка:
• Если неизвестен числитель, то используется САВ.
• Если неизвестен знаменатель, то используется СГВ
v Средняя геометрическая — это величина, используемая как средняя из отношений. Этой средней удобно пользоваться, когда уделяется внимание не абсолютным разностям, а отношениям двух чисел, т.е. когда индивидуальные значения признака — относительные величины. Например, средняя геометрическая используется при расчете среднего коэффициента роста.
v Средняя хронологическая.Эта формула средней применяется для ряда моментных показателей. Широко применяется в рядах динамики, в социально-экономической статистике для определения средней численности населения и среднего размера остатков, а также для других показателей, исчисляемых на определенные моменты времени.
Необходимо взять половину первого и последнего показателя, плюс моментные показатели, находящиеся в середине ряда, полученную сумму разделить на (количество моментных показателей минус 1.
Широко применяется в рядах динамики, в социально-экономической статистике для определения средней численности населения и среднего размера остатков, а также для других показателей, исчисляемых на определенные моменты времени
Б. Структурные средние
Для характеристики структуры совокупности применяются особые показатели, которые называются структурными средними. К таким показателям относятся мода и медиана.
Мода— величина признака (варианта), наиболее часто повторяющаяся в изучаемой совокупности. Другими словами, модой называется то значение признака, которое соответствует максимальной точке теоретической кривой распределения. Мода отражает типичный, наиболее распространенный вариант значения признака.
В дискретном ряду распределения мода — это варианта, которой соответствует наибольшая частота.
В интервальном ряду распределения сначала определяют модальный интервал (т.е. интервал, содержащий моду), которому соответствует наибольшая частота. Конкретное значение моды определяется формулой:
xMo — начальное значение модального интервала
hMo — величина модального интервала
fMo — частота модального интервала (f2)
fMo-1— частота интервала, предшествующего модальному(f1 - предмодальный)
fMo+1 — частота интервала, следующего за модальным (f3 - послемодальный)
При этом мода будет несколько неопределенной, т.к. ее значение будет зависеть от величины групп, точного положения границ групп.
Медиана — это величина, которая делит численность упорядоченного вариационного ряда на две равные части: одна часть имеет значения, не большие, чем средний вариант, а другая — не меньшие. Справедливо соотношение: сумма абсолютных отклонений членов ряда от медианы есть величина наименьшая
∑ |х-Ме| < ∑ |х-A| , гдеА=Ме(т.е. А — любое число, отличное от Ме)
Для ранжированного (выстроенного в порядке возрастания или убывания значения признака) ряда с нечетным числом членов медианой является варианта, расположенная в центре ряда. Для ранжированного ряда с четным числом членов медиана рассчитывается как средняя арифметическая из двух вариант, расположенных в центре ряда.
Для дискретного ряда медиана рассчитывается с помощью накопленных частот: медианой является варианта, которой соответствует накопленная частота, впервые превысившая половину общей суммы частот.
Для интервального ряда с помощью накопленных частот определяют медианный интервал (т.е. интервал, содержащий медиану), которому соответствует накопленная частота, впервые превысившая половину общей суммы частот. Затем конкретное значение медианы рассчитывают по формуле
где хМе-начальное значение медианного интервала
hMe-величина медианного интервала
SMe-1—сумма накопленных частот, предшествующих медианному интервалу
fMe — частота медианного интервала
Контрольные вопросы
1. Что подразумевается под средней величиной?
2. Что представляет собой средний показатель?
3. Какие виды средних величин существуют?
4. Что такое средняя арифметическая?
5. Назовите виды средней арифметической.
6. Что представляет собой средняя гармоническая?
7. Что называется средней геометрической?
8. Что представляют собой средняяквадратическая и средняя кубическая?
9. Что такое структурные средние?
10. Что представляет собой медиана?
11. Какие свойства медианы вам известны?
12. Что представляет понятие «мода»?
3. Показатели вариации в статистике
Различие индивидуальных значений признака внутри изучаемой совокупности называется вариацией признака.
Средняя величина – это абстрактная обобщающая характеристика признака изучаемой совокупности, но она не показывает строения совокупности. Для характеристики совокупностей и исчисленных средних величин важно знать, какая вариация признака скрывается за средними. В некоторых случаях отдельные значения признака близко примыкают к средней арифметической и мало от нее отличаются, в таких случаях средняя хорошо представляет всю совокупность. В других случаях, наоборот, отдельные значения далеко отстоят от средней, и средняя плохо представляет совокупность. Колеблемость отдельных значений, степень их близости к средней характеризуют показатели вариации. Вариации присущи явлениям природы и общества. При этом революция в обществе происходит быстрее, чем аналогичные изменения в природе. Объективно существуют также вариации в пространстве и во времени.
Вариации в пространстве показывают различие статистических показателей относящихся к различным административно-территориальным единицам.
Вариации во времени показывают различие показателей в зависимости от периода или момента времени к которым они относятся.
При характеристике колеблемости признака применяют систему абсолютных и относительных показателей