Лимиты (пределы) разнообразия
Лимит (предел) разнообразия - это указание наименьшей и наибольшей величины признака среди всех представителей группы:
(5.1)
Другими словами, предел разнообразия признака не вычисляется, а лишь констатируется. Так, в приведенном выше примере lim x1 = 85 116 и lim x2 = 60 135.
Размах вариаций
Размах вариаций (r)есть математическая разность между максимальной и минимальной величиной признака:
(5.2)
В нашем примере размах вариаций в первой группе (r1)составляет 116 – 85 = 31 и во второй (r2) –135 – 60 = 75.
Размах от 10-го до 90-го процентиля (мера D)вычисляется следующим образом:
(5.3)
Другими словами, для вычисления меры D отсекается по 10% значений с левого и правого края распределения и определяется размах вариаций для оставшихся 80%. Эта мера более стабильна, чем включающий и исключающий размах, поскольку на него не влияют крайние (возможно, случайные) значения вариаций.
Междуквартильный размах–еще более жесткая мера изменчивости, нежели мера D. Междуквартильный размах – это разность между 1-м и 3-м квартилями группы:
(5.4)
Другими словами, для определения междуквартильного размаха с краев распределения признака отсекается по 25% значений и определяются границы для оставшихся (наиболее типичных) 50%, которые в максимальной степени характеризуют центральную тенденцию.
Полумеждуквартильный размах (Q1/2) равен половине расстояния между 1-м и 3-м квартилями:
(5.5)
Суть этой статистической меры состоит в уравнивании между собой расстояний между 1-м и 2-м и между 2-м и 3-м квартилями, которые в случае несимметричных распределений могут отличаться друг от друга. В случае же симметричного распределения полумеждуквартильный размах включает в себя приблизительно 25% данных.
Среднее отклонение
Среднее отклонение (MD) – параметрическая мера изменчивости, предложенная в свое время Г. Т. Фехнером. Среднее отклонение равно сумме отклонений от среднего значения (или, другими словами, сумме расстояний между xi и ), взятых по модулю:
(5.6)
Дисперсия
Дисперсия (s2)представляет собойсумму квадратов отклонений от среднего (сумму квадратов расстояний между xi и ):
(5.7)
Деление суммы квадратов на число степеней свободы n – 1 позволяет сравнивать между собой совокупности, различные по объему. Считается, что дисперсия – более мощный статистический критерий, нежели среднее отклонение, так как больший вклад в дисперсию дают те значения признака, которые расположены дальше от среднего (вклад каждого значения в дисперсию возрастает пропорционально квадрату отклонения от среднего).
Формула 5.7 не очень удобна при расчете дисперсии вручную (на микрокалькуляторе). Поэтому для этих целей можно использовать другую (рабочую) формулу, которую можно получить путем соответствующих преобразований.
Преобразование формулы:
Но . Отсюда следует, что:
Так как , то:
(5.8)
Свойства дисперсии:
1. Дисперсия не изменится, если к каждому значению xi прибавить константу c: xj = xi + c Þ sj2 = si2.
2. Умножение на константу c каждого значения xi увеличивает дисперсию в c2 раз: xj = сxi Þ sj2 = с2 × si2.