Краткие методические указания к решению задачи 1.6
Графики Лоренца получили широкое распространение при изучении степени неравномерности распределения (неравномерности концентрации) различных суммарных показателей в группах единиц наблюдения, образованных в зависимости от численных значений этих же показателей или других, тесно взаимосвязанных с ними показателей. Например, распределение совокупного денежного дохода по группам населения, в зависимости от размеров, получаемых денежных доходов, или распределение продовольственных фондов по группам населения в зависимости от размеров получаемых денежных доходов и т.д.
Применение графиков Лоренца во времени или по разным объектам позволяет их рассматривать как многоплановый и эффективный инструмент статистического анализа, взаимосвязанный с традиционными методами статистики и расширяющий сферы их применения.
Если обозначить согласно общепринятой символики в статистике частотное распределение единиц наблюдения по признаку – Х1, через «p», а распределение совокупного признака Х1 по этим же группам через «g», совокупного признака Х2 через «g1» и т.д., то, согласно условию задачи, следует последовательно сопоставить следующие пары частотных распределений: 1) «p» и «g»; 2) «p» и «g1»; 3) «p» и «g2»; и соответственно построить графики.
Важно подчеркнуть, что в целях упрощения расчетов и повышения аналитичности данных, единицы наблюдения, как правило, распределяются на равные группы – 20 групп по 5% единиц наблюдения в каждой группе, 10 групп и 10% единиц наблюдения в каждой группе, 5 групп по 20% и т.д. Это и учтено при определении числа групп в задаче 1.3. пункт 2.
Последовательность решения задачи следующая.
Во-первых, для каждой пары сопоставляемых распределений рассчитывают кумулятивные частоты (накопленные частоты).
Во-вторых, на осях ординат строится квадрат 100 × 100, который делится пополам диагонально квадрата (прямой линией равномерного распределения). На ось абсцисс наносят кумулятивные итоги. «Cum p», а на ось ординат – кумулятивные итоги «Cum g».
Для каждой пары значений кумулятивных итогов находят точки пересечения, проведя перпендикуляры к осям. По полученным точкам строится кривая Лоренца.
В-третьих, рассчитывается коэффициент Джини:
где s = 1…К, К – число групп.
Чем ближе коэффициент Джини к единице, тем больше степень концентрации или степень неравномерности распределения и наоборот (если в расчетах используются не комулятивные доли, а проценты, то результат вычисления надо разделить на 10000).
Ниже для иллюстрации представляются результаты решения задачи, полученные по данным базового информационного варианта.
Таблица 18
Сопоставление распределений «p» и «q», %
№ групп | «p» | «q» | «Cum p» | «Cum q» |
5,29 | 5,29 | |||
6,72 | 12,01 | |||
7,88 | 19,89 | |||
9,04 | 28,93 | |||
9,47 | 38,40 | |||
10,71 | 49,11 | |||
11,47 | 60,58 | |||
12,58 | 72,37 | |||
15,05 | 84,99 | |||
Итого | – | – |
10% наполняемость групп с неравными интервалами.
Кривая Лоренца
Коэффициент Джини:
G = ((10×12,01 + 20×19,89 + 30×28,93 + 40×38,40 + 50×49,11 + 60×60,58 +
+ 70×72,37 + 80×84,95 + 90×100) – (20×5,29 + 30×12,01 + 40×19,89 +
+ 50×28,93 + 60×38,40 + 70×49,11 + 80×60,58 + 90×72,37 + 100×84,95))/
/ 10000 = (29874 – 28304,60)/10000 = 1569,40/10000 = 0,16.
Аналогичная процедура повторяется для распределения «p» и «q2», «p» и «q3».
Таблица 19
Сопоставление распределений «p» и «q», %
№ группы | «p» | «q1» | «Cum p» | «Cum q1» |
I | 20% | 12,78 | 12,78 | |
II | 20% | 16,77 | 29,55 | |
III | 20% | 20,00 | 49,55 | |
IV | 20% | 23,06 | 72,61 | |
V | 20% | 27,38 | ||
Итого | 100% | – | – |
20% наполняемость групп с неравными интервалами.
Кривая Лоренца
Коэффициент Джини
G = ((20×29,55 + 40×49,55 + 60×72,61 + 80×100) –
– (40×12,78 + 60×29,55 + 80×49,55 + 100×72,61))/10000 =
= (14929,6 – 13509,2)/10000 = 1420,4/10000 = 0,14.
Задача 1.7
По данным задачи 1.3, пункт 3 (выходная статистическая табл. 6) проведите вторичную группировку, образовав группы с равными интервалами: 3000–4500; 4500–6000; 6000–7500; 7500–9000; 9000–10500; 10500–12000.