Мода - это значение признака, которое чаще всего встречается в ряде распределения.
В дискретных рядах модой является значение признака в той группе, у которой наблюдается наибольшая частота. Определить моду в этом случае можно визуально.
В интервальных рядах распределения мода также находится в той группе, у которой наибольшая частота. Но так как в интервальных рядах признак может принимать любое значение в заданном интервале, точное значение моды следует определять по специальной формуле:
(17)
где хмо - нижняя граница модального интервала;
iмо - величина модального интервала;
fмо- частота модального интервала;
f(мо-1)- частота интервала, предшествующего модальному;
f(мо+1) - частота интервала, следующего за модальным.
Модальным является интервал, имеющий наибольшую частоту
Значение моды, рассчитанное по формуле, не может быть меньшим, чем нижняя граница модального интервала, и не будет превышать верхнюю границу модального интервала.
Медиана - это значение признака, стоящего в центре ранжированного ряда распределения.
В дискретном ряде распределения медиана равна значению признака в той группе, у которой сумма накопленных частот равна или превышает половину суммы всех частот ряда распределения.
Сумма накопленных частот находится последовательным сложением частот каждой группы. Так, для первой группы сумма накопленных частот будет равна частоте этой группы, для второй группы - сумме частот первой и второй группы, для третьей группы - сумме частот первой, второй и третьей группы и т.д. накопленная частота последней группы будет равна общей сумме частот ряда распределения.
В интервальном ряде распределения медиана находится по специальной формуле:
(18)
где хме - нижняя граница медианного интервала;
iме- величина медианного интервала;
fме - частота медианного интервала;
Σf - сумма всех частот ряда распределения;
Sме-1 - сумма частот, накопленных до медианного интервала.
Медианным считается интервал, сумма накопленных частот которого равна или превышает половину всех частот ряда распределения
Значение медианы будет не меньше, чем значение нижней границы медианного интервала, и не превысит значения верхней границы медианного интервала.
Показатели вариации
Показатели вариации характеризуют степень отклонения реальных значений признака от среднего значения и друг от друга. Они делятся на три группы: абсолютные, средние и показатели относительного рассеивания.
К абсолютным показателям вариации относится размах вариации, который характеризует отклонение крайних значений признака.
(19)
где xmax, xmin - максимальное и минимальное значение признака в изучаемой совокупности.
К средним показателям вариации относятся среднее линейное отклонение, среднее квадратическое отклонение и дисперсия. Эти показатели существуют в двух формах: простой и взвешенной.
Простая форма применяется для несгруппированных данных, взвешенная - если данные сгруппированы. Форма расчета средних показателей вариации совпадает с формой расчета средней величины.
Среднее линейное отклонение находится как отношение суммы отклонений индивидуальных значений признаков от средней (взятой по модулю) к количеству единиц совокупности. Среднее линейное отклонение показывает, на сколько единиц в среднем индивидуальные значения признака отклоняются от его среднего значения.
В простой форме среднее линейное отклонение рассчитывается по формуле:
(20)
Взвешенная форма имеет вид:
(21)
Следует иметь виду, что отклонение реальных значений от средней берется по модулю. В противном случае сумма отклонений будет равна 0.
Среднее квадратическое отклонение, как и среднее линейное отклонение, показывает, на сколько единиц в среднем индивидуальные значения признака отклоняются от средней, но сумма отклонений возводится в квадрат. Рассчитывается также в простой и взвешенной форме.
(22)
(23)
Дисперсия представляет собой сумму квадратов отклонений индивидуальных значений признака от средней. Данный показатель не имеет единиц измерения. В простой форме дисперсия имеет вид:
(24)
Во взвешенной форме:
(25)
Можно рассчитать дисперсию по методу моментов. В этом случае расчет производится по формуле:
(26)
Показатели относительного рассеивания являются мерой вариации признака и позволяют сопоставлять степень вариации у различных совокупностей. Данные показатели находятся как отношение абсолютных или средних показателей вариации к среднему значению признака.
Коэффициент осцилляции рассчитывается как отношение размаха вариации к среднему значению признака (в процентах):
(27)
Относительное линейное отклонение находится как частное от деления среднего линейного отклонения на среднее значение признака ( в процентах):
(28)
Коэффициент вариации является мерой типичности средней и показывает, на сколько процентов в среднем индивидуальные значения признака отклоняются от средней. Он находится по формуле:
(29)
Если значение коэффициента вариации не превышает 33%, средняя считается типичной для совокупности, и ее можно применять в экономических расчетах.
Пример 1. Расчет средней, показателей вариации, моды и медианы в интервальном вариационном ряде
Таблица 3 – Данные о затратах времени на изготовление деталей на 200 предприятиях:
Время, затраченное на изготовление 1 детали, мин. | Число предприятий, штук | Сумма накопленных частот, Si |
1 | 2 | 3 |
8-10 | ||
10-12 | ||
12-14 | ||
14-16 | ||
16-18 | ||
18-20 | ||
20-22 | ||
Итого |
По приведенным данным вычислите:
1. Среднее значение варьирующего признака;
2. Показатели вариации: размах, среднее линейное отклонение, дисперсию, среднее квадратическое отклонение, коэффициенты вариации и осцилляции;
3. Моду и медиану.
Решение:
Задачи данного типа рекомендуется решать в табличной форме. За значение признака (хi) принимаются середины интервалов.
Таблица 4 – Расчетная таблица
xi | fi | xifi | |||
1 | 2 | 3 | 4 | 5 | 6 |
9 · 14 = 126 | |9 - 14,1| = 5,1 | 5,1 · 14 = 71,4 | 5,12 · 14 = 364,14 | ||
11 · 26 = 286 | |11 - 14,1| = 3,1 | 3,1 · 26 = 80,6 | 3,12 · 26 = 249,86 | ||
1,1 | 82,5 | 90,75 | |||
0,9 | 36,0 | 32,40 | |||
2,9 | 58,0 | 168,20 | |||
4,9 | 73,5 | 360,15 | |||
6,9 | 69,0 | 476,10 | |||
Итого | 24,9 | 471,0 | 1741,60 |
Определим среднее значение признака по формуле средней арифметической взвешенной:
Размах вариации рассчитываем как разницу между серединами первого и последнего интервалов:
R = 21 - 9 = 12 мин.
Среднее линейное отклонение определяется по формуле:
Среднее квадратичное отклонение определим по формуле:
данные для расчета дисперсии содержатся в графах 2 и 6 таблицы 4. В данном примере она определяется по формуле:
коэффициент вариации определяем, подставляя данные в формулу:
Коэффициент осцилляции в нашем примере равен:
2. Чтобы определить моду и медиану в данном интервальном ряде распределения, воспользуемся формулами (17) и (18).
Вначале определяют модальный интервал, т.е. интервал, имеющий наибольшую частоту. В данном примере модальным является интервал 12-14 минут, т.к. его частота составляет 75 единиц.
Тогда:
нижняя граница модального интервала (хмо) составит 12;
величина модального интервала (iмо) = 2;
частота модального интервала (fмо) = 75;
частота интервала, предшествующего модальному (f(мо-1)) = 26;
частота интервала, следующего за модальным (f(мо+1)) = 40. Следовательно, мода равна:
Для определения медианы в интервальном ряде распределения воспользуемся формулой:
Найдем медианный интервал. У медианного интервала сумма накопленных частот должна быть равна половине суммы всех частот ряда или превышать эту величину. В нашем примере сумма всех частот равна 200 единицам, полусумма - 100 единиц (200 : 2). В гр. 3 таблицы 4 рассчитываются суммы накопленных частот последовательным сложением частот каждой группы. Для первой группы сумма накопленных частот - 14 единиц, для второй - 40 (14+26), для третьей - 115 (14 + 26 + 75) и т.д.
В третьей группе сумма накопленных частот превысит полусумму всех частот ряда (115 > 100), следовательно, третья группа является медианной, а медианный интервал - 12-14 мин. тогда медиана равна:
Вывод. из приведенных расчетов видно, что среднее время на изготовление 1 детали составит 14,1 мин., при этом половина рабочих затратит на изготовление 1 детали в среднем не более 13,6 мин. (Ме = 13,6), а самая многочисленная группа затратит на изготовление 1 детали в среднем 13,2 мин.
Индивидуальное время на изготовление 1 детали отклоняется от среднего времени в среднем на 2,9 мин. (σ = 2,95), что составляет 20,9% (V = 20,9). Средняя типична для совокупности, т.к. коэффициент вариации не превышает 30%.
Так как Мо<Ме< , в нашем примере наблюдается правосторонняя асимметрия.