Характеристика центра распределения.
К показателям центра распределения относятся: 1 мода, 2 медиана, 3 средняя
Высшей хар-кой центра распределения считаетс яс редняя величина т.к она рассчитывается с учетом знаний признака у всех единиц совокупности и хар-ет типический уровень признака.
Это отражение центральной тенденции распределения – это значит вокруг которой концентрируются единицы изучаемой совокупности. Т.к средняя величина может быть рассчитана по количественному признаку в качестве центра распределения используется мода или медиана.
Мода может быть рассчитана по любым показателям по количественным и атрибутивным как по номинальным и порядковым.
Мода – наиболее часто встречающееся значение признака совокупности.
Распределение семей по размеру среднедушевого дохода.
Группы семей | Число семей fi(частоты) | Середина интервала | Накопленные частоты Σ fi | Накопленные частости Σ f’i |
А | ||||
До 500 | ||||
500-600 | ||||
600-700 | ||||
700-800 | ||||
800-900 | ||||
900-1000 | ||||
1000 и более | ||||
Σ |
По атрибутивному признаку и несгруппированным данным количественного признака мода определяется просто исходя из определения. По сгруппированным данным мода определяется по формуле:
Mo= Xmo0Z+h [(fmo-fmo-1)/{(fmo-fm0-1)+(fmo-fmo+1)}]
Xmo0-нижняя граница модального интервала
h- величина группировочного интервала
fmo- частота модального интервала
fmo-1, fmo+1- частота предшествующего / следующего модальному интервалу
Модальный интервал- интервал которому соответствует максимальная частота.
Мо=700+100[(2500-1700)/{(2500-1700)+(2500-2200)}] = 773 руб
Медиана -значения признака у единиц делящей ранжированный ряд пополам.
Если данные не сгруппированы порядковый номер единицы с медианным значением определяется (n+1)/2
Если число единиц четное то значение медианы определяется как средняя арифметическая величина 2-х центральных значений.
Если данные сгруппированы то величина медианы считается
Mc=Xmc0+h[(1/2 Σ fi – Smc-1)/fmc]
Xmc0-нижняя граница медианного интервала
1/2Σ fi
Smc-1 – накопительная частота интервала предшествующего медианному
fmc- частота медианного интервала
Медианный интервал- интервал в который попадают первые 50 % единиц совокупности т.е он находится по накопленным частотам или частостям
Мс=700+100[(1/2 *10000-3000)/2500]=780 руб
Использование того или иного показателя центра распределения зависти от типа анализируемого показателя и от задач исследования
Если анализируемый признак измерен количественными показателями то предпочтение следует отдать средней величине, если в распределение нет существенной асимметрии. Если в распределение есть существенная асимметрия то вероятнее информативнее будут показатель медианы. Мода может быть рассчитана по любому признаку включая атрибутивный. Медиана тоже может быть рассчитана по атрибутивному признаку но при условии что он порядковый т.е может быть ранжирован.
Характеристика структуры распределения.
Медиана наряду с оценкой центра распределения является показателем структуры. Значения медианы в этом случае значит что у 50% единиц изучаемой совокупности значения признака меньше медианного и у 50% более медианного. К показателям структуры распределения относятся также:
Перцентире (процентире) характеристики разбивающие совокупность на определенное число равных частей. На практике самым распространенным является квартиля разбивающие совокупность на 4 равные части и децикл разбивающий совокупность на 10 равных частей.
Квартили рассчитываются первый или нижний и третий или верхний квартиль
Q1 Mc Q3
25% 50% 25%
Q1=Xqo+ h [(1/4Σ fi-Sq1-1)/fq1]
Q1=600+10 (1/4*10000-1300)/1700 =671 руб
В 25 % семей средний душевой доход менее 671 руб
Q3=800+100 (3/4*10000-5500)/2200 =891 руб
В 25% семей средний душевой доход превышает 891 руб, а у 75 % менее 891 руб.
На основе квартиля рассчитывается межквартальное расстояние как разность между этими характеристиками.
Rq=891-671 =220 руб
Rq аналогоказателя размаха вариации, отличие в том что показатель характеризует размах вариации в центре распределеня, а в интервале от Q1 до Q3 содержится 50%.