Сущность средних в статистике.
Средняя арифметическая, ее свойства и техника исчисления.
Средняя гармоническая.
Мода и медиана.
Показатели вариации.
Средние величины играют особую роль в статистическом исследовании. Это определяется задачей статистики – выявлением закономерностей массовых явлений. Закономерности можно выявить, лишь обобщая однородные явления и давая обобщенную характеристику единицам явлений.
Средней величиной в статистке называется обобщающая характеристика совокупности однотипных явлений по какому-либо варьирующему признаку, которая показывает уровень признака, отнесенный к единице совокупности.
Основополагающим условием применения средних величин является массовость изучаемого явления. Только при этом условии они покажут общую тенденцию, лежащую в основе процесса в целом, и покажут ее типичный для данного периода уровень проявления.
К прочим условиям верного и экономически грамотного использования средних величин относятся:
- использование средней только в том случае, когда признак изменяется, варьирует у отдельных единиц совокупности;
- средние величины могут рассчитываться только в качественно однородных совокупностях.
Средние величины, будучи обобщающими показателями, для совокупности в целом затушевывают количественные различия изучаемого признака у отдельных единиц. Поэтому даже в пределах качественно однородной совокупности нередко нужно общие средние дополнять исчислением групповых средних, так как общие средние величины могут не раскрыть подлинных закономерностей изучаемых процессов.
Введем следующие условные обозначения:
Х | Варианта признака – значение, величина признака отдельных единиц; |
F | Частота – величина, которая показывает сколько раз встречается признак с такой величиной в совокупности; |
Среднее значение признака в совокупности. |
Наиболее часто в практике встречаются средние арифметические и средние гармонические.
Средняя арифметическая используется в вариационном ряду распределения, где имеются частоты и варианты признака. Средняя арифметическая рассчитывается как:
1. Средняя арифметическая простая. Применяется когда частоты вариант равны между собой или равны единице.
=
-среднее значение признака в совокупности;
- сумма вариант признака;
n - количество частот.
Пример: определить среднюю цену на сахар за год, если средняя цена в первом квартале составила 2,50; во втором – 2,45; в третьем – 2,70; в четвертом – 2,60. Так как частоты равны единице, то используется средняя арифметическая простая:
грн.
2. Средняя арифметическая взвешенная. Используется, в случае, когда варианты совокупности имеют различную частоту.
=
- сумма всех частот в совокупности;
- общий объем значений частот варианты в совокупности.
Частоты отдельных вариант могут быть выражены не только абсолютными величинами, но и относительными значениями – частностями (w).
=
Пример: определить среднюю заработную плату работников магазина, если 1 человек получает 500 грн.; 3 – 450; 7 – 350; 2 – 250; 1 – 200. Так как варианты имеют различную частоту, то необходимо использование средней арифметической взвешенной:
грн.
В случае, когда варианты и частоты в интервальном вариационном ряду имеют большое численное значение, расчет среднего значения требует существенных усилий. Для сокращения трудоемкости расчетов использует некоторые особенности средней арифметической, позволяющие оптимизировать процесс расчета среднего значения и имеющие название способ моментов.
При расчете средней арифметической способом моментов необходимо:
1. Перейти от интервального ряда к дискретному путем нахождения среднего значения каждого интервала.
2. Вычесть из всех вариант постоянное число (лучше для этого использовать значение серединной варианты или варианты с наибольшей частотой) – A.
3. Разделить варианты на постоянное число, а именно величину интервала – i.
4. Рассчитать среднюю арифметическую из новых вариант или так называемый момент первого порядка.
M1 =
5. Для определения величины средней арифметической нужно величину момента первого порядка умножить на величину того интервала, на который делили все варианты, и прибавить к полученному произведению величину варианты, которую вычитали.
= i x M + A
Пример: на основании приведенных данных о результатах анализа жирности молока определить среднее значение.
Жирность молока, % | Количество | Жирность молока, % | х – А (А = 3) | Х1 = (х – А)/i (i – 1) |
0,5 – 1,5 | 12 | 1 | - 2 | - 2 |
1,5 – 2,5 | 25 | 2 | - 1 | - 1 |
2,5 – 3,5 | 38 | 3 | 0 | 0 |
3,5 – 4,5 | 5 | 4 | 1 | 1 |
М1 =
%
Для проверки, произведем расчет среднего процента жирности молока, используя среднюю арифметическую взвешенную:
Учитывая, что статистические средние всегда выражают качественные свойства изучаемых общественных процессов и явлений, важно правильно выбрать формулу средней исходя из взаимосвязи явлений и их признаков. Когда статистическая информация не содержит частот по отдельным вариантам совокупности, а представлена как их произведение, применяется формула средней гармонической, то есть в этом случае веса приходится делить на варианты или, что то же самое, умножать на их обратное значение.
Средняя гармоническая – величина, обратная средней арифметической, из обратных значений признака. Выбор средней гармонической простой и взвешенной аналогичен средней арифметической:
- в случае, когда варианты равны между собой или равны единице, применяется средняя гармоническая простая:
- если варианты имеют различную частоту, используется средняя гармоническая взвешенная:
Пример: на основании приведенных данных о цене и объеме реализации картофеля за месяц на рынках города определить среднюю цену.
Рынки | Цена, грн. | Объем реализации, тыс. грн. |
Южный | 2,10 | 1025 |
Железнодорожный | 1,80 | 1240 |
Центральный | 2,40 | 890 |
Калининский | 2,25 | 700 |
Для расчета средней цены необходимо использование средней гармонической простой, так как объем реализации выступает как произведение цены реализации на количество реализованной продукции.
грн.
Модой в статистике называется величина признака (варианта), которая чаще всего встречается в данной совокупности. В вариационном ряду это будет варианта, имеющая наибольшую частоту.
В дискретном ряду мода определяется визуально, так как это варианта, имеющая наибольшую частоту. В случае, если не одна, а две варианты имеют наибольшую частоту, в ряду будут две моды и распределение будет бимодальным.
Для определения моды в интервальном вариационном ряду используется следующая формула:
Mo= Xmo + Imo x
Xmo - минимальная граница модального интервала;
Imo - величина модального интервала;
Fm0-1 - частота интервала, предшествующего модальному;
Fm0 - частота модального интервала;
Fm0+1 - частота интервала, следующего за модальным.
Модальный интервал – интервал с наибольшей частотой.
Пример: на основании ранее рассмотренного примера определим моду
Жирность молока, % | Количество | Жирность молока, % |
0,5 – 1,5 | 12 | 1 |
1,5 – 2,5 | 25 | 2 |
2,5 – 3,5 | 38 | 3 |
3,5 – 4,5 | 5 | 4 |
Для дискретного ряда распределения модой будет выступать значение жирности молока, равное 3%, так именно это значение наиболее часто встречается в рассмотренной совокупности – 38 раз.
Определим значение моды в интервальном ряду распределения:
Мо =
Медианой называется варианта, которая находится в середине вариационного ряда. Медиана делит ряд пополам, по обе стороны от нее находится одинаковое количество единиц совокупности.
Если непарное число вариант записано в порядке возрастания или убывания, то центральная из них будет медианой ((n+1)/2). Если число вариант парное, то медиана рассчитывается как средняя арифметическая простая двух средних вариант.
Для нахождения медианы в интервальном вариационном ряду используют следующую формулу:
Me = Xme + Ime x
Xme - начальное значение медианного интервала;
Ime - величина медианного интервала;
- сумма частот (численность ряда);
S (me-1) - сумма накопленных частот в интервалах, предшествующих медианному;
Fme - частота медианного интервала.
Медианный интервал это тот интервал, кумулятивная частота которого равна или превышает половину суммы частот.
Пример: на основании ранее рассмотренного примера определим медиану.
Жирность молока, % | Количество | Жирность молока, % |
0,5 – 1,5 | 12 | 1 |
1,5 – 2,5 | 25 | 2 |
2,5 – 3,5 | 38 | 3 |
3,5 – 4,5 | 5 | 4 |
Для дискретного ряда распределения с парным числом вариант медианой будет являться средняя арифметическая простая двух средних вариант:
Ме =
Произведем расчет медианы для интервального ряда распределения:
Ме =
Средние величины дают обобщающую характеристику совокупности по варьирующим признакам, показывают типичный для данных условий уровень этих признаков. Но, как уже указывалось, наряду со средними величинами, большое практическое и теоретическое значение имеет изучение отклонений от средних. При этом интересуют не только крайние отклонения, но и совокупность всех отклонений. От размера и распределения отклонений зависит надежность средних характеристик.
Для характеристики величин колебания в статистике рассчитывают целый ряд показателей. Рассмотрим их на следующем примере:
Средние цены на пиво (за 1 литр) по Донецкой области за ряд лет составили:
- 1997 год – 1,49 грн.;
- 1999 год - 1,96 грн.;
- 2001 год – 3,10 грн.
1. Размах вариации – представляет собой разницу между наибольшим и наименьшим значением варьирующего признака.
R = Xmax - Xmin
R = 3,10 – 1,49 = 1,61 грн.
2. Среднее линейное (арифметическое) отклонение – характеризует распределение отклонений фактических значений от среднего. Используют:
- простое среднее линейное отклонение:
=
- взвешенное среднее линейное отклонение:
=