Средние структурные величины
В условиях недостаточности средних используют структурные средние величины – моду и медиану.
Медиана (Ме) – это вариант, который находится а середине вариационного ряда. Медиана делит ряд на две равные (по числу наблюдений) части. В ранжированных рядах не сгруппированных данных нахождение медианы сводится к отысканию порядкового номера и значения варианта у этого номера.
Медиана в интервальныхвариационных рядах рассчитывается по формуле:
, (1.17)
где х0 – нижняя граница медианного интервала (накопленная частота которого превышает половину общей суммы частот);
– величина медианного интервала;
– накопленная частота интервала, предшествующего медианному;
– частота медианного интервала.
Также в интервальных вариационных рядах медиана может быть найдена с помощью кумуляты как значение признака, для которого
или . (1.18)
Главное свойство медианы заключается в том, что сумма абсолютных отклонений значений признака от медианы меньше, чем от любой другой величины: .
Модой(Мо) вариационного ряда называется вариант, которому соответствует наибольшая частота.
Для вычисления моды в интервальном ряду сначала находится модальный интервал, имеющий наибольшую частоту (или наибольшую плотность распределения – отношение частоты интервала к его величине ni/hi – в интервальном ряду с неравными интервалами), а значение моды определяется линейной интерполяцией:
, (1.19)
где хо – нижняя граница модального интервала;
– величина модального интервала;
, , – частота ni (в интервальном ряду с равными интервалами) или плотность распределения ni/hi (в интервальном ряду с неравными интервалами) модального, до и послемодального интервала.
Мода так же, как и медиана обладает определенной устойчивостью к вариации признака. Если в совокупности первичных признаков нет повторяющихся значений, то для определения моды проводят группировку.
Графически отобразить моду по гистограмме можно следующим образом: нужно взять столбец, имеющий наибольшую высоту, и из его левого верхнего угла провести отрезок в угол последующего столбца, а из правого угла – в верхний правый угол предыдущего столбца, абсцисса точки пересечения отрезков и будет соответствовать модальному значению признака в изучаемой совокупности. Медиану приближенно можно определить графически - по кумуляте. Для этого высоту наибольшей ординаты, которая соответствует общей численности совокупности, делят пополам. Через полученную точку проводят прямую, параллельную оси абсцисс, до пересечения ее с кумулятой. Абсцисса точки пересечения и есть медиана (рисунок 1.1)
Рис. 1.1 Графическое отображение интервального вариационного ряда
В симметричных рядах имеет место следующее соотношение моды, медианы и средней арифметической (1.20).
В случае, если (1.21), имеет место левосторонняя асимметрия ряда.
В случае, если (1.22), имеет место правосторонняя асимметрия ряда.
Мода и медиана,в отличие от степенных средних, являются конкретными характеристиками ряда. Медиана – характеризует центр, вычисляется проще и не чувствительна к концам интервала. Мода – наиболее вероятное значение в изучаемой совокупности (например, наиболее возможные результаты).
1 2 3
1 – распределение с левосторонней асимметрией
2 – распределение с правосторонней асимметрией
3 – нормальное (симметричное) распределение
Анализ вариационных рядов
Показатели вариации
Вариациейназывается изменяемость, колеблемость величины признака. Вариация проявляется в отклонениях от средних и зависит от множества факторов, влияющих на социально-экономическое явление. Вариация бывает случайной и систематической, существует в пространстве и во времени. Показатели вариации делятся на абсолютные и относительные (таблица 2.1).
Таблица 2.1 - Показатели вариации
Показатель | Формула расчета показателя | |
простой | взвешенный | |
Абсолютные | Размах | (2.1) |
Среднее линейное отклонение | (2.2) | * (2.3) |
Дисперсия | σ2 (2.4) | (2.5) |
Среднее квадратическое отклонение | (2.6) | (2.7) |
относительные | Коэффициент вариации | (2.8) |
Линейный коэффициент вариации | (2.9) | |
Коэффициент осцилляции | (2.10) |
*– Здесь fi – частота ( ).
Относительные показатели (коэффициент вариации, линейный коэффициент вариации, коэффициент осцилляции) строятся с учетом базы (в виде средней), выражаются в процентах и дают характеристику однородности совокупности. Совокупность считается однородной, если коэффициент вариации
. (2.11)
Для расчета дисперсии можно использовать модифицированную формулу:
. (2.12)
Выведем эту формулу из формулы (2.5)
Для расчета дисперсии можно использовать способ отсчета от условного нуля, который позволяет упростить вычисления при больших значениях признака. Тогда дисперсия вычисляется по формуле:
, (2.13)
где h – величина интервала;
А – условный нуль, в качестве которого можно использовать как середину серединного интервала, так и середину интервала с наибольшей частотой.
Свойства дисперсии
1.Дисперсия постоянной величины равна нулю.
2.Если у всех значений вариантов отнять какое-то постоянное число А, то средний квадрат отклонений (дисперсия) от этого не изменится
. (2.14)
Это значит, что дисперсию можно вычислить не по заданным значениям признака, а по их отклонениям от какого-то постоянного числа, например условного нуля (см. формулу 2.13).
3.Если все значения вариантов разделить на какое-то постоянное число А, то дисперсия уменьшится в А2 раз:
. (2.15)
4.Если распределение признака близко к нормальному или симметричному, то по правилу мажорантности (т.к. среднее квадратическое отклонение – средняя геометрическая величина, а среднее линейное отклонение – средняя арифметическая) среднее квадратическое отклонение больше среднего линейного отклонения ( ), причем
, . (2.16)
Размах вариации, среднее линейное и среднее квадратичное отклонение – это именованные величины. Единицей измерения у них и у исходных значений признака совпадают. Дисперсия может быть задана в ед.2 признака или в % отклонений.