Вариационного ряда распределения
Вопросы:
1.Мода
2. Медиана
3.Понятие квартили, децили и перцентили
4. Децильные коэффициенты
5. Квартильные коэффициенты
Особым видом средних величин являются структурные средние. Они применяются для изучения внутреннего строения и структуры рядов распределения признака. К таким показателям относится мода и медиана.
1. Мода- это значение признака, наиболее часто встречающееся в изучаемой совокупности.
Мода применяется, например, при определении размера одежды, обуви, пользующихся наибольшим спросом у покупателей, наиболее распространенной цены на тот или иной товар на рынке и т.д.
В дискретном ряду модой является вариант с наибольшей частотой (частостью).
Например:
Распределение рабочих по выработке деталей
Выработка деталей за смену одним рабочим, шт. | Число рабочих ( веса) |
Итого |
Наибольшей частотой является число 5. Этой частоте соответствует модальное значение признака, т.е. выработка деталей за смену. Мода свидетельствует, что в данном примере чаще всего встречаются рабочие, изготавливающие за смену 20 деталей.
При расчете моды для интервального вариационного ряда необходимо вначале определить модальный интервал, в пределах которого находится мода, а затем значение модальной величины признака.
Модальный интервал- это интервал, имеющий наибольшую частоту (частость).
В интервальном вариационном ряду мода рассчитывается по формуле:
Мо= +h
где -нижняя граница модального интервала;
h- величина модального интервала;
- частота модального интервала;
- частота интервала, предшествующего модальному;
- частота интервала, следующего за модальным.
Например: имеются следующие данные обобщения итогов выборочного бюджетного обследования населения города Новосибирска:
Среднедушевой денежный доход в среднем за месяц, тыс. руб. | Число жителей | Накопленные частости (S) | Середина интервала (х) | |
чел. (f) | в % к итогу | |||
До 0,5 | 0,9 | 0,9 | 0,25 | |
0,5-1,0 | 16,5 | 17,4 | 0,75 | |
1,0-1,5 | 24,6 | 42,0 | 1,25 | |
1,5-2,0 | 18,8 | 60,8 | 1,75 | |
2,0-2,5 | 15,4 | 76,2 | 2,25 | |
2,5-3,0 | 12,5 | 88,7 | 2,75 | |
3,0 и более | 11,3 | 100,0 | 3,25 | |
Итого | 100,0 | - | - |
Модальное значение признака, используя в качестве весов частости распределения получим:
Мо= 1,0+0,5 тыс. руб.
Таким образом, наиболее часто встречающаяся величина среднедушевого дохода составляет 1290 руб.
Расчет моды с использованием в качестве весов частот распределения дает аналогичный результат:
Мо=1,0+0,5 тыс. руб.
Вычисление моды в интервальном ряду является весьма условным.
Мода и средняя величина по – разному характеризуют совокупность. Мода определяет непосредственно размер признака, свойственный хотя и значительной части, но все же не всей совокупности.
Мода по своему обобщающему значению менее точна по сравнению со средней арифметической, характеризующей совокупность в целом с учетом всех без исключения элементов совокупности.
2. Медиана- это вариант, который находится в середине вариационного ряда.
Медиана делит ряд на две равные (по числу единиц) части – со значениями признака меньше медианы и со значениями признака больше медианы.
Чтобы найти медиану, необходимо отыскать значение признака, которое находится в середине упорядоченного ряда.
В ряду, состоящем из 15 чисел, медианой будет 8-е число, от которого как вниз ,так и вверх будет расположено по 7 чисел.
Например:
А: Дан нечетный вариационный ряд роста студенток:
156 158 160 161 166 168 172
Таким образом, центральным числом (медианой) данного ряда является рост студентки -161 см.
В случае четного вариационного ряда медиана определяется следующим образом: серединные два члена вариационного ряда складываются и делятся пополам.
В: Дан четный вариационный ряд роста студенток:
155 156 158 160 161 166 168 172
Ме= .
Если варианты в ряду распределения заданы в виде интервалов, то первоначально находят медиальный интервал, который содержит единицу, находящуюся в середине ранжированного ряда.
Медиальный интервал- это интервал, в котором находится порядковый номер медианы.
Медиана интервального ряда определяется по формуле:
Ме= ,
где - нижняя граница медиального интервала;
i- величина медиального интервала;
- сумма накопленных частот в интервалах предшествующих медиальному;
- частота медиального интервала.
Например: В интервальном ряду даны группы семей по среднемесячному доходу на 1 человека. Требуется определить для этого ряда серединное значение, т.е. медиану.
Группы семей по среднемесячному доходу на 1 человека, руб. | Число семей |
До 900 | |
900-1200 | |
1200-1500 | |
1500-1800 | |
Свыше 1800 | |
Итого |
Ме=1200+300 руб.
Следовательно, 50% семей имеют доход на одного человека 1360 руб., а 50% имеют доход на одного человека > 1350 руб.
Мода и медиана, как правило, отличаются от значения средней, совпадая с ней только в случае симметричного распределения частот вариационного ряда. Поэтому соотношение моды, медианы и средней арифметической позволяет оценить ассиметрию ряда распределения.
3.Более общая постановка вариант, занимающих определенное порядковое место в ранжированном ряду, называется порядковой статистикой.
К порядковым статистикам принадлежат и экстремальные значения признака, т.е. минимальные и максимальные в данном ряду. Различают порядковые статистики, отсекающие четверти совокупности, которые называются квартили;в первую или нижнюю (отсекающие четверть совокупности снизу), третью или верхнюю (отсекающие четверть сверху). Второй квартилью можно назвать медиану. Далее можно говорить об отсекающих десятые части – децилях и т.д.
Определение этих порядковых статистик в вариационном ряду, так же как и определение медианы, начинается с расчета порядкового номера соответствующего варианта, а затем по накопленным частотам определяется интервал, в котором находится соответствующий вариант. Определение величины накопленного варианта внутри интервала тоже абсолютно аналогично нахождению медианы.
Таким образом, к структурным характеристикам относятся и другие порядковые статистики: квартили – делящие ряд на 4 равные части, децили- делящие ряд на 10 частей, перцинтили- на 100 частей и т.д.
4.Общая схема расчета децилей следующая:
1) поскольку децили отсекают десятые части совокупности, по накопленным частостям определим интервалы, куда попадают порядковые номера децилей: для первой децили- интервал, где находится вариант, отсекающий 10% совокупности с наименьшими значениями признака; для второй- 20% и т.д. ; для девятой децили – интервал, содержащий вариант, отсекающий 90% с наименьшими значениями , или, что то же самое, 10% с наибольшими значениями признака;
2) Рассчитаем величину децилей по формулам.
Например, первая и девятая децили находятся по формулам:
;
= .
Где- , -начала интервалов, где находятся первая и девятая децили;
, - величина интервалов, где находятся первая и девятая децили;
- общая сумма частот ( частостей);
, - суммы (частот ( частостей), накопленных в интервалах, предшествующих интервалам, в которых находятся первая и девятая децили;
, -частоты (частости) интервалов, содержащих первую и девятую децили.
Например: согласно имеющихся данных об итогах выборочного бюджетного обследования населения города Новосибирска (см. пример выше) первая дециль попадает в интервал от 0,5 до 1,0 тыс. руб. (сумма накопленных в этом интервале частостей составляет 17,4%, что превышает 10%), девятая дециль – в интервал от 3,0 тыс. руб. и более (в этом интервале находится 10 % населения с наибольшими доходами). Найдем величину соответствующих децилей.
тыс. руб.
Следовательно, максимальная величина месячного среднедушевого дохода у 10% наименее обеспеченных жителей составила 776 руб.
тыс. руб.
Минимальная величина месячного среднедушевого дохода у 10% наиболее обеспеченного населения города составляла 3058 руб.
Соотношение децильных коэффициентов в социальной статистике получило названиекоэффициента децильной дифференциации доходов населения ( ):
= .
В рассматриваемом примере:
3,9.
Это означает, что минимальный месячный среднедушевой доход 10% наиболее обеспеченного населения превышал максимальный доход 10% наименее обеспеченного населения в 3,9 раза.
5.Наряду с децилями применяются квартили.
Квартили- это значения признака в ранжированном ряду распределения , выбранные таким образом, что 25% единиц совокупности будут меньше по величине Q1 ; 25% единиц будут заключены между Q1 и Q2; 25% между Q2 и Q3 и остальные 25% превосходят Q3.
В интервальном вариационном ряду квартили внутри определенного по накопленным частотам интервалам рассчитывается по следующим формулам:
Нижний квартиль :
Q1= +i .
Верхний квартиль:
Q3= +i ,
Где х0 – нижняя граница квартильных интервалов;
i –величина интервала;
- сумма частот,
Sx1 – накопленная частота интервала, предшествующего нижнему квартилю;
Sx3 – накопленная частота интервала, предшествующего верхнему квартилю
- частота квартильного интервала .
Если в качестве показателя центра распределения используется медиана, то Q2=Ме.
Например: В интервальном ряду распределения 50 учащихся по росту, определить верхний и нижний квартиль.
Распределение 50 учащихся по росту в интервальном ряду
Рост, см х | Число учащихся | Накопленные частоты |
160-165 | ||
165-170 | ||
170-175 | ||
175-180 | ||
180-185 | ||
185-190 | ||
190-195 | ||
Всего | - |
.
Следовательно, в ряду распределения по данным о распределении учащихся по росту первый квартиль составляет 170,8 см., а третий-180,8см, т.е. 25% учащихся имеют рост, не превышающий 170,8см., а у 75% учащихся рост не превышает 180,8 см.
Контрольные вопросы:
1. В чем сущность моды и как она рассчитывается для вариационного и интервального ряда?
2. Что такое медиана и как она рассчитывается для интервального ряда?
3. Что такое квартили, децили ?
4. Как рассчитываются квартили?
5. Каков порядок расчета децили?