Понятие средней величины. Виды средних и их соотношение
Средняя величина – обобщающая количественная характеристика однородной совокупности явлений по определенному признаку. Характеризует величину изучаемого признака, приходящуюся на единицу совокупности.
Средняя гармоническая
Рассчитывается, когда изучаемые показатели связаны между собой как x и1/x (показатели на единицу времени, сырья и т.д.).
Средняя гармоническая простая: .
Пример 6.4. Требуется вычислить среднюю производительность труда бригады из 3-х человек, если первому рабочему требуется для изготовления одной детали 1/4 часа, второму - 1/3 часа, третьему - 1/2 часа.
часа.
Средняя гармоническая взвешенная: .
Средняя геометрическая
Применяется, если при замене индивидуальных величин признака на среднюю величину необходимо сохранить неизменным произведение индивидуальных величин.
.
Наиболее широкое применение этот вид средней получил в анализе динамики для определения среднего темпа роста.
Пример 6.5. В результате инфляции за первый год цена товара возросла в 2 раза к предыдущему году, а за 2-й год еще в 3 раза к уровню предыдущего года. Т.е. за 2 года цена выросла в 6 раз. Какой средний темп роста цены за год?
Если считать по средней арифметической, то раза, тогда за два года выросла бы в 2,5 · 2,5 = 6,25 раза, а не в 6 раз.
Средняя геометрическая дает правильный ответ: раза.
Средняя квадратическая
Применяется, если при замене индивидуальных величин признака на среднюю величину необходимо сохранить неизменной сумму квадратов исходных величин.
Средняя квадратическая простая:
.
Пример 6.6. Имеется 3 участка земельной площади со сторонами квадрата: x1 = 100 м; x2 = 200 м; x3 = 300 м. Чему равна средняя площадь участков?
Общая площадь участков равна (100)2 + (200)2 + (300)2 = 140000 м2.
Если считать по средней арифметической, то м2, тогда общая площадь равна 3 · (200)2 = 120000 м2, что неверно.
Средняя квадратическая дает правильный ответ:
м2.
Средняя квадратическая взвешенная:
.
Средняя степенная
Обобщает все виды средних
.
Если k = -1, то это средняя гармоническая,
k = 0 – средняя геометрическая (после преобразований),
k = 1 – средняя арифметическая,
k = 2 – средняя квадратическая,
k = 3 – средняя кубическая.
Имеется следующее соотношение между формами средних величин:
или
.
Пользуясь этим правилом статистика может управлять средними.
Пример 6.7. Студент на экзамене получил за 1-й вопрос оценку 2, за 2-ой вопрос – 5.
балла.
балла.
балла.
Исходя из полученных средних можно как «завалить» студента, так и «вытянуть».
Понятие средней величины. Структурные характеристики.
Средняя величина – обобщающая количественная характеристика однородной совокупности явлений по определенному признаку. Характеризует величину изучаемого признака, приходящуюся на единицу совокупности.
Структурные характеристики
Если величина средней зависит от всех значений признака, встречаемых в данном распределении, то значение средней определяется структурой распределения, местом распределения.
Медиана – значение признака, приходящееся на середину ранжированной совокупности. Медиана делит совокупность на две равные части.
Пример. Вес 7 телят: 75, 80, 83, 87, 92, 97, 101 кг.
Медиана равна 87 кг (половина телят имеет вес меньше 87 кг, а половина – больше 87 кг).
Вес 8 телят: 75, 80, 83, 87, 92, 97, 101, 105 кг.
Медиана равна (87+92)/2=89,5 кг.
Медиана в интервальном ряду рассчитывается следующим образом:
Сначала исчисляют порядковый номер медианы по формуле и строят ряд накопленных частот Si=fi+Si-1 (S1=f1).
Накопленной частоте, которая равна порядковому номеру медианы или первая его превышает, соответствует медианный интервал. Медиана равна:
,
где x0 – нижняя граница медианного интервала;
h – величина медианного интервала;
fi – частота i-го интервала;
Sме-1 – сумма накопленных частот в интервале, предшествующем медианному;
fMe – частота медианного интервала.
ПримерИмеются данные о заработной плате рабочих:
Месячная з/п, $ | Количество рабочих, fi | Накопленные частоты, Si |
до 800 | ||
800 – 1000 | ||
1000 – 1200 | ||
1200 – 1400 | ||
1400 и более | ||
Итого | - |
, следовательно, медианный интервал 1000-1200.
$ (половина рабочих имеет заработную плату ниже 1050$, а половина – выше 1050$).
Квартили – значения признака, делящие ранжированную совокупность на четыре равные по числу единиц части.
Номер квартильного интервала рассчитывается аналогично медианному в соотношении ¼ к совокупности. 1-й квартиль равен:
,
xQ1 – нижняя граница интервала, содержащего нижний квартиль (интервал определяется по накопленной частоте, первой превышающей 25%),
h – величина интервала,
fQ1 – частота квартильного интервала,
SQ1-1 – сумма накопленных частот в интервале, предшествующего квартильному.
2-й квартиль:
Q2=Мe.
3-й квартиль:
,
обозначения аналогичны 1-му квартилю с изменением на номер интервала.
Пример. По данным примера 6.9.
, следовательно, 1-й квартильный интервал 800-1000.
$ (25% рабочих получает заработную плату ниже 900$).
, следовательно, 3-й квартильный интервал 1000-1200.
$ (25% рабочих получает заработную плату выше 1175$).
Децили – значения признака, делящие ранжированную совокупность на десять равных по числу единиц частей.
Вычисляются они по той же схеме, что и медиана, и квартили. Обычно рассчитывают только первый и девятый децили:
,
.
Пример. По данным примера 6.9.
, следовательно, 1-й децильный интервал до 800.
$ (10% рабочих получает заработную плату ниже 800$).
, следовательно, 9-й децильный интервал 1200-1400.
$ (10% рабочих получает заработную плату выше 1400$).
Децильный коэффициент . Широко применяется при изучении дифференциации доходов.
Пример.По данным примера 6.11.
(10% самых высокооплачиваемых работников получают зарплату в 1,75 раза больше 10% самых низкооплачиваемых работников).
Мода – значение признака, которое чаще других встречается в изучаемом ряду распределения.
Мода для дискретного ряда определяется как варианта, имеющая наибольшую частоту.
Для интервального ряда:
,
где x0 –нижняя граница модального интервала,
d- величина модального интервала,
fMo-1 - частота интервала, предшествующего модальному,
fMo - частота модального интервала,
fMo+1 - частота интервала, следующего за модальным.
Пример. По данным примера 6.9.
Модальный интервал с наибольшей частотой fi = 4 равен 1000-1200.
$ (наибольшее число рабочих получает зарплату 1050$).
Показатели размера вариации
Вариация – изменение значения признака при переходе от одной единицы совокупности к другой.
Для измерения вариации используются следующие показатели.
1. Размах вариации – показывает, в каких пределах колеблется размер признака, образующего ряд распределения
R=xmax-xmin,
где xmax – максимальное значение признака,
xmin – минимальное значение признака.
2. Среднее линейное отклонение – показывает, на сколько в среднем отклоняются значения признака от его среднего значения.
По несгруппированным данным
.
По сгруппированным данным
,
где k – число групп.
3. Дисперсия – средний квадрат отклонений индивидуальных значений признака от их средней величины.
По несгруппированным данным
.
По сгруппированным данным
.
Дисперсия имеет большое значение в статистическом анализе. Однако ее не всегда удобно использовать, потому что размерность дисперсии равна квадрату размерности изучаемого признака. Поэтому рассчитывают среднее квадратическое отклонение.
4. Среднее квадратическое отклонение – показывает, на сколько в среднем отклоняются значения признака от его среднего значения (обладает лучшими свойствами, чем среднее линейное отклонение).
По несгруппированным данным
.
По сгруппированным данным
.
Выражается в тех же единицах измерения, что и признак.
5. Коэффициент вариации – показывает степень интенсивности вариации, однородность совокупности.
Совокупность считается однородной, если , где Vнорм – нормативная величина коэффициента вариации (для разных совокупностей может колебаться от 1% до 30%).
6. Линейный коэффициент вариации – отношение среднего линейного отклонения к средней.
Пример. Распределение коров фермы по годовому удою молока.
Годовой удой молока от коровы, тыс. кг (xi) | Число коров, fi | Средняя величина признака | xi*fi | ||||
до 2 | 1,5 | -1,3 | 5,2 | 1,69 | 6,76 | ||
2-3 | 2,5 | -0,3 | 0,6 | 0,09 | 0,18 | ||
3-4 | 3,5 | +0,7 | 1,4 | 0,49 | 0,98 | ||
4-5 | 4,5 | 4,5 | +1,7 | 1,7 | 2,89 | 2,89 | |
5 и более | 5,5 | 5,5 | +2,7 | 2,7 | 7,29 | 7,29 | |
Итого | 11,6 | 18,1 |
1) Средняя арифметическая тыс. кг.
2) Размах вариации R = 6 – 1 = 5 тыс. кг.
3) Среднее линейное отклонение тыс. кг.
4) Дисперсия тыс. кг2.
5) Среднее квадратическое отклонение тыс. кг.
6) Коэффициент вариации - совокупность неоднородна.
7) Линейный коэффициент вариации .
Показатели вариации альтернативного признака.
Доля вариантов обладающих изучаемым признаком обозначается р, а доля вариантов не обладающих изучаемым признаком – q=1-p.
Средняя величина: .
Дисперсия: .
Пример. Совокупность новорождённых – 205 чел., девочки – 100 чел.
Доля девочек р = 100/205=0,488,
Доля мальчиков q = 105/205=0,512,
Дисперсия σ2 = 0,488*0,512= 0,2498