Расчет моды и медианы в интервальном ряду
В отличие от дискретных вариационных рядов определение моды и медианы по интервальным рядам требует проведения определенных расчетов на основе следующих формул:
, (1)
где x0 – нижняя граница модального интервала (модальным называется интервал, имеющий наибольшую частоту);
i – величина модального интервала;
fMo – частота модального интервала;
fMo-1 – частота интервала, предшествующего модальному;
fMo+1 – частота интервала, следующего за модальным.
(2)
где x0 – нижняя граница медианного интервала (медианным называется первый интервал, накопленная частота которого превышает половину общей суммы частот);
i – величина медианного интервала;
SMe-1 – накопленная интервала, предшествующего медианному;
fMe – частота медианного интервала.
Проиллюстрируем применение этих формул, используя данные табл. 3.1.
Интервал с границами 60 – 80 в данном распределении будет модальным, т.к. он имеет наибольшую частоту. Использую формулу (1), определим моду:
Для установления медианного интервала необходимо определять накопленную частоту каждого последующего интервала до тех пор, пока она не превысит половины суммы накопленных частот (в нашем случае 50 %) (табл. 3.2).
Установили, что медианным является интервал с границами 100 – 120 тыс. руб. Определим теперь медиану:
Таблица 3.1 - Распределение населения РФ по уровню среднедушевых номинальных денежных доходов в марте 2009 г.
Группы по уровню среднедушевого месячного дохода, тыс. руб. | Удельный вес населения, % |
До 20 | 1,4 |
20 – 40 | 7,5 |
40 – 60 | 11,9 |
60 – 80 | 12,7 |
80 – 100 | 11,7 |
100 – 120 | 10,0 |
120 – 140 | 8,3 |
140 –160 | 6,8 |
160 – 180 | 5,5 |
180 – 200 | 4,4 |
200 – 220 | 3,5 |
220 – 240 | 2,9 |
240 – 260 | 2,3 |
260 – 280 | 1,9 |
280 – 300 | 1,5 |
Свыше 300 | 7,7 |
Итого | 100,0 |
Таблица 3.2 - Определение медианного интервала
Интервал, тыс. руб. | Накопленная частота, % |
До 20 | 1,4 |
20 – 40 | 8,9 |
40 – 60 | 20,8 |
60 – 80 | 33,5 |
80 – 100 | 45,2 |
100 – 120 | 55,2 |
Таким образом, в качестве обобщенной характеристики значений определенного признака у единиц ранжированной совокупности могут быть использованы средняя арифметическая, мода и медиана.
Основной характеристикой центра распределения является средняя арифметическая, для которой характерно то, что все отклонения от нее (положительные и отрицательные) в сумме равняются нулю. Для медианы характерно, что сумма отклонений от нее по модулю является минимальной, а мода представляет собой значение признака, которое наиболее часто встречается.
Соотношение моды, медианы и средней арифметической указывает на характер распределения признака в совокупности, позволяет оценить его асимметрию. В симметричных распределениях все три характеристики совпадают. Чем больше расхождение между модой и средней арифметической, тем более асимметричен ряд. Для умеренно асимметричных рядов разность между модой и средней арифметической примерно в три раза превышает разность между медианой и средней, т.е.:
|Mo –`x| = 3 |Me –`x|.