Структурные средние: мода и медиана
Структурные средние (мода, медиана) применяются для изучения внутреннего строения и структуры рядов распределения значений признака.
Мода − наиболее часто встречающееся значение признака у единиц совокупности. В ряду распределения, где каждая варианта встречается один раз, мода не рассчитывается. В дискретном ряду модой является варианта с наибольшей частотой . Для интервального ряда с равными интервалами мода рассчитывается по формуле:
.
где − начальная (нижняя) граница модального интервала;
− величина соответственно модального, до- и послемодального интервалов
− частота модального, до- и послемодального интервалов соответственно.
Модальный интервал – это интервал, который имеет наибольшую частоту.
Медиана - это значение признака, которое лежит в середине ранжированного ряда и делит этот ряд на две равные части по числу единиц: одна часть имеет значения признака меньше медианы, а другая больше медианы.
Ранжированный ряд – это расположение значений признака в порядке возрастания или убывания.
В дискретном ранжированном ряду, где каждая варианта встречается один раз, а число вариант не четное номер медианы определяется по формуле:
,
где – число членов ряда.
В дискретном ранжированном ряду, где каждая варианта встречается один раз и число вариант четное медианой будет средняя арифметическая из двух вариант, расположенных в середине ранжированного ряда.
В дискретном ранжированном ряду, где каждая варианта встречается несколько раз, номер медианы определяется по формуле:
.
Затем, начиная с первой варианты, последовательно суммируются частоты, до тех пор пока не получите .
Для интервального ряда медиана рассчитывается по формуле:
,
где − нижняя граница медианного интервала;
− величина медианного интервала;
−общее число единиц совокупности;
− накопленная частота до медианного интервала;
− частота медианного интервала.
Медианный интервал – это такой интервал, в котором его накопленная частота равна или превышает полусумму всех частот ряда.
Показатели вариации
Вариация признака – это различие индивидуальных значений признака внутри изучаемой совокупности. Вариация признака характеризуется показателями вариации. Показатели вариации дополняют средние величины, характеризуют степень однородности статистической совокупности по данному признаку, границы вариации признака. Соотношение показателей вариации определяет взаимосвязь между признаками.
Показатели вариации подразделяются на:
1) Абсолютные: размах вариации; среднее линейное отклонение; среднее квадратическое отклонение; дисперсия. Они имеют те же единицы измерения, что и значения признака
2) Относительные: коэффициент осцилляции, коэффициент вариации, относительное линейное отклонение.
Размах вариации показывает, на какую величину изменяется значение признака:
,
где – максимальное значение признака;
– минимальное значение признака.
Среднее линейное отклонение и среднее квадратическое отклонение показывают, на сколько в среднем отличаются индивидуальные значения признака от среднего его значения.
Среднее линейное отклонение определяется:
– простое; – взвешенное.
Дисперсия и среднее квадратическое отклонение определяются:
– простая; – взвешенная;
– простое; – взвешенное.
Если средняя величина признака рассчитывалась по простой арифметической, тогда рассчитываются по простой формуле, если средняя рассчитывалась по взвешенной, тогда рассчитываются по взвешенной формуле.
Дисперсия и среднее квадратическое отклонение также могут рассчитываться по другой формуле:
– простая; – взвешенная.
Для сравнения вариации различных признаков в одной и той же совокупности или же одного и того же признака в разных совокупностях рассчитывается относительный показатель вариации, именуемый коэффициентом вариации :
.
Чем больше величина коэффициента вариации, тем больше разброс значений признака вокруг средней, тем менее однородна совокупность по своему составу и тем менее представительна средняя. Совокупность считается однородной, если коэффициент вариации не превышает 33%.