Расчет медианы по интервальному ряду
Группы семей по среднемесячному доходу на 1 человека, руб. | Число семей |
До 900 | |
900—1200 | |
1200—1500 | |
1500—1800 | |
Свыше 1800 | |
ИТОГО |
Следовательно, 50% семей имеют доход на одного человека не более 1350 руб., а 50% имеют доход на одного человека более 1350 руб.
У медианы есть свойство, которое заключается в том, что сумма абсолютных величин линейных отклонений от Ме минимальна.
Это свойство очень важно при практическом применении медианы.
Пример. Филиалы торговой фирмы "Элегант" расположены на расстоянии 10,30, 70,90,100 км от нее. Где построить склад фирмы для оптимального снабжения филиалов? Расчет показан в табл. .10. Таблица .10
Расчетная таблица для сравнения отклонений от медианы и от средней арифметической
Расстояние, км | ||
-60 | -50 | |
-40 | -30 | |
+10 | ||
+20 | +30 | |
+30 | +40 | |
ИТОГО | ±150 | ±160 |
; Ме = 70 км.
Таким образом, оптимальным вариантом является медианное расстояние 70 км, так как 150 < 160 км на 10 км.
Подводя итог рассмотрению моды и медианы особо следует отметить, что данные два показателя часто используются вместо средней арифметической или вместе с ней. Так, например, фиксируя цены на продукты на мелкооптовых рынках, записывают наиболее часто встречающуюся цену каждого продукта, т. е. моду цены. Однако наилучшей характеристикой величины варианта или уровня ряда служит средняя арифметическая, которая имеет ряд преимуществ, главное из них — точное отражение суммы всех значений признаков, необходимой для решения ряда практических задач.
Вместе с тем для тех случаев, когда в совокупности имеется небольшое число единиц с чрезмерно большим или чрезмерно малым значением исследуемого признака, в дополнение к средней арифметической целесообразно исчислять моду и особенно медиану, которые, в отличие от средней, не зависят от этих крайних, не характерных для совокупности значений признаков.
Мода (Мо) – значение случайной величины, встречающееся с наибольшей вероятностью, в дискретном вариационном ряду – вариант, имеющий наибольшую частоту.
Например, в табл..1 наибольшей частотой является число 5. Этой частоте соответствует модальное значение признака, т.е. выработка деталей за смену. Мода свидетельствует, что в данном примере чаще всего встречаются рабочие, изготавливающие за смену 20 деталей.
В интервальных рядах распределения с равными интервалами мода вычисляется по формуле:
( )
где – нижняя граница модального интервала;
– модальный интервал;
– частоты в модальном, предыдущем и следующем за модальным интервалах (соответственно).
Модальный интервал определяется по наибольшей частоте. По данным табл. 4.4 рассчитаем моду, тыс. руб.:
Итак, модальным значением стоимости ОПФ малых предприятий региона является стоимость, равная 18,33 тыс. руб.
Мода широко используется в с/практике при изучении покупательского спроса, регистрации цен и т.п.
Медиана (Ме) – это вариант, который находится в середине вариационного ряда. Медиана делит ряд на две равные (по числу единиц) части – со значениями признака меньше медианы и со значениями признака больше медианы. Чтобы найти медиану необходимо отыскать значение признака, которое находится в середине упорядоченного ряда. В ранжированных рядах несгруппированных данных нахождение медианы сводится к отысканию порядкового номера медианы.
Пусть ряд состоит из показателей заработной платы 9 рабочих (руб. в месяц ) в 2000 г.:
630, 650, 680, 690, 700, 710, 720, 730, 750.
Номер медианы для нечетного объема вычисляется по формуле
где n – число членов ряда.
В нашем примере номер медианы равен 5, медиана равна 700 руб. (т.е. одна половина рабочих получила зарплату менее 700 руб., а другая – более 700 руб. в месяц).
В случае четного объема ряда медиана равна средней из двух вариантов, находящихся в середине ряда.
В интервальных рядах распределения медианное значение (поскольку оно делит всю совокупность на две равные по численности части) оказывается в каком-то из интервалов признака х. Этот интервал характерен тем, что его кумулятивная частота (накопленная сумма частот) равна или превышает полусумму всех частот ряда. Значение медианы вычисляется линейной интерполяцией по формуле:
(13)
где – нижняя граница медианного интервала; - медианный интервал;
– половина от общего числа наблюдений; – сумма наблюдений, накопленная до начала медианного интервала; – число наблюдений в медианном интервале.
Формула (13) получена исходя из допущения о равномерности нарастания накоплений частоты внутри интервала и пригодна для любого интервального ряда.
Рассчитаем медиану по данным табл. 4.4. Прежде всего найдем медианный интервал. Таким интервалом очевидно будет интервал стоимости ОПФ малых предприятий (18–20 тыс. руб.), поскольку его кумулятивная частота равна 18 (2+6+10), что превышает половину суммы всех частот (25:2 = 12,5). Нижняя граница интервала 18 млн руб., его частота 10; частота, накопленная до него, равна 8. Подставив данные в формулу (4.13), получим, тыс. руб.:
Полученный результат говорит о том, что из 25 малых предприятий региона 12 предприятий имеют стоимость ОПФ менее 18 тыс. руб., а 12 предприятий – более этой величины.
Медиана находит практическое применение в маркетинговой деятельности вследствие особого свойства – сумма абсолютных отклонений чисел ряда от медианы есть величина наименьшая: .
Мода и медиана в отличие от степенных средних являются конкретными характеристиками, их значение имеет какой-либо конкретный вариант в вариационном ряду.
Мода и медиана, как правило, отличаются от значения средней, совпадая с ней только в случае симметричного распределения частот вариационного ряда. Поэтому соотношение моды, медианы и средней арифметической позволяет оценить асимметрию ряда распределения.
Мода и медиана, как правило, являются дополнительными к средней характеристиками совокупности и используются в математической статистике для анализа формы рядов распределения.
Квартили и децили
Более общая постановка вариант, занимающих определенное порядковое место в ранжированном ряду, называется порядковой статистикой. К порядковым статистикам принадлежат и экстремальные значения признака, т. е. минимальные и максимальные в данном ряду. Различают порядковые статистики, отсекающие четверти совокупности, которые называются квартили; первую или нижнюю (отсекающие четверть совокупности снизу), третью или верхнюю (отсекающие четверть сверху). Второй квартилью можно назвать медиану. Далее можно говорить об отсекающих десятые части — децилях и т. д.
Определение этих порядковых статистик в вариационном ряду, так же как и определение медианы, начинается с расчета порядкового номера соответствующего варианта, а затем по накопленным частотам определяется интервал, в котором находится соответствующий вариант. Определение величины накопленного варианта внутри интервала тоже аналогично нахождению медианы.
В интервальном вариационном ряду квартили внутри определенного по накопленным частотам интервала рассчитываются по следующим формулам:
Нижний квартиль Верхний квартиль
где хо — нижняя граница квартальных интервалов;
i— величина интервала;
— сумма частот;
— накопленная частота интервала, предшествующего нижнему квартилю;
— накопленная частота интервала, предшествующего верхнему квартилю;
— частоты квартального интервала.
Формулы для децилей в интервальном вариационном ряду записываются следующим образом:
Пример. В табл. 11 дан интервальный ряд распределения 50 учащихся по росту. Определить верхний и нижний квартиль и первые два дециля. Таблица .11
Распределение 50 учащихся по росту в интервальном ряду
Рост, см х | Число учащихся | Накопленные частоты |
160—165 | ||
165—170 | ||
170—175 | ||
175—180 | ||
180-185 | ||
185-190 | ||
190-195 | ||
ВСЕГО | - |