Методи оцінки варіації ознак та моделювання розподілу
Основою будь-якого групування є статистичний ряд розподілу, який складається з двох елементів: значень ознаки та частот.
Властивістю статистичної сукупності є варіація ознаки, яка зумовлена як основними, так і другорядними причинами. Основні причини формують центр розподілу, другорядні – варіацію ознаки, а сукупна їх дія – форму розподілу [3,48].
1) Показники центру розподілу.
Показники центру формуються під впливом основних факторів6 середня арифметична , мода , медіана .
Середня арифметична має ряд математичних властивостей, які використовуються при спрощеному обчисленні середньої в рядах розподілу.
Зокрема, за методом моментів або методом відліку від умовного початку середню арифметичну визначають за виразом:
, (3.1)
де - умовний момент першого порядку:
, (3.2)
де:
h – величина інтервалу групування,
A – довільне число (як правило, це та варіанта, якій відповідає найбільша частота).
Мода – це таке значення ознаки, яке найчастіше зустрічається в ряді розподілу.
В дискретних рядах моду визначають візуально: це та варіанта, якій відповідає найбільша частота.
В інтервальний рядах моду визначають за формулою:
(3.3)
де:
x0 – нижня межа модального інтервалу;
h – величина інтервалу групування;
f2 – частота модального інтервалу;
f1 – частота інтервалу, що передує модальному;
f3 – частота інтервалу, що стоїть після модального.
Модальним називають інтервал, що має найбільшу частоту.
Медіана – це та варіанта, яка ділить ранжирований (упорядкований) ряд на 2 рівні частини [5,74].
В дискретних рядах медіану знаходять за її номером:
, (3.4)
В інтервальний рядах медіана розраховується по формулі Фехнера:
, (3.5)
де:
x0 – нижня межа медіанного інтервалу;
h – величина інтервалу групування;
Sm-1 – кумулятивна частота, яка стоїть перед медіанним інтервалом;
fm – частота медіанного інтервалу.
Медіанним називають інтервал, нагромаджена частота якого півсуми частот.
Моду і медіану називають структурними або порядковими середніми.
Перевагою цих середніх є те, що на них не впливають екстремальні значення.
2) Показники варіації.
Для вивчення і всебічної характеристики варіації ознак статистичних сукупностей використовують показники, які визначають міру варіації (коливання) окремих значень ознаки від середньої величини (див табл. 3.1).
Вимір варіації ознак має важливе значення для характеристики статистичної сукупності (визначення ступеню ритмічності й рівномірності виконання планів, завдань, стійкості впливу чинників на результативні ознаки, стійкості тенденцій та ін.) [1,169].
Таблиця 3.1 -Показники варіації
Показник | ||
Формула для не згрупованих даних | Характеристика | Формула для згрупованих даних |
Розмах варіації | ||
R = xmax - xmin | ||
Простий в обчисленнях, однак не дає уяви про ступінь варіації в середині сукупності, оскільки обчислюється лише на основі двох крайніх значень, а тому застосовується для наближеної оцінки варіації. | ||
Середнє лінійне відхилення | ||
Представляє собою середню арифметичну з абсолютних значень відхилень окремих варіант від їх середньої. Величина ця є іменована. | ||
Дисперсія (середній квадрат відхилень) | ||
Представляє собою середню арифметичну з квадратів відхилень окремих варіант від їх середньої. Величина ця є не іменована. |
Продовження таблиці 3.1 | ||
Середнє квадратичне відхилення | ||
Є узагальнюючою характеристикою абсолютних розмірів варіації. Ця величина є іменована. В літературі її ще називають стандартом, в економічному аналізі вона виступає мірою ризиків. |
Вище зазначених характеристик варіації не достатньо, оскільки на ці величини впливає не тільки розмір варіації, але й абсолютні значення ознаки та їх середньої. А тому характеристику варіації доповнюють такими відносними показниками варіації:
1) Лінійний коефіцієнт варіації
2) Квадратичний коефіцієнт варіації
Служить не тільки відносною мірою варіації, але й виступає критерієм типовості середньої та однорідності сукупності: говорить про те, що сукупність неоднорідна, а середня не типова [8,49].
Дисперсія має ряд математичних властивостей, які використовуються для спрощеного обчислення методом моментів, або відліку від умовного початку дисперсію обчислюють за виразом:
, (3.6)
де - умовний момент 2-го порядку
(3.7)
За методом різниці квадратів дисперсію обчислюють так:
(3.8)
Варіація може бути якісною, якщо є 2 варіанти, які взаємно виключають одна одну, тоді варіація такої ознаки називається альтернативною [5,77].
Наявність ознаки позначають 1, а її відсутність – 0.
Частку одиниць, що мають ознаку позначають р, що не мають – q.
p+q=1
p=1-q
q=1-p
І тоді середнє значення альтернативної ознаки буде просто р, а дисперсія альтернативної ознаки буде .
3) Показники форми розподілу.
На форму розподілу впливають як основні так і другорядні чинники. Розрізняють багато вершинні та одновершинні розподіли.
|
|
|
|
|
|
Рис. 3.1 Багато вершинний розподіл Рис. 3.2 Одно вершинний розподіл
Багатовершинність свідчить про неоднорідність сукупності.
|
|
Найпростішою мірою скошеності є співвідношення середньої арифметичної, медіани і моди.
Напрям і міру скошеності характеризує також стандартизоване відхилення:
або (3.9)
Для порівняння ступеня асиметрії (скошеності) різних розподілів використовують стандартизований момент 3-го порядку:
, (3.10)
де - центральний момент 3-го порядку:
. (3.11)
Вважається, якщо As < 0.25 – асиметрія слабка, в межах 0,25-0,5 – середня, As > 0,5 – висока.
Скупченість окремих значень ознаки навколо середньої називають ексцесом [5,90].
Мірою ексцесу є стандартизований момент 4-го порядку:
, (3.12)
де - центральний момент 4-го порядку:
. (3.13)
За ексцесом розрізняють гостро- та плоско вершинний розподіли:
|
|
|
|
|
|
Вважають, якщо Е = 3, то це симетричний, близький до нормального, розподіл.
Таблиця 3.2 – Вихідні дані для розрахунку
Групи працівників за рівнем нарахованої зарплати, грн. | Чисельність працівників | |
Осіб | % | |
980-1180 | ||
1180-1380 | ||
1380-1580 | ||
1580-1780 | ||
1780-1980 | ||
Разом |
Таблиця 3.3 - Таблиця побудови теоретичного розподілу з використанням інтегральної функції
групи | f | S | x | xf | |||||||
980-1180 | -245,05 | 60049,5 | -147061253 | -176473503,6 | 3605942450,3 | ||||||
1180-1380 | -54,05 | 2921,4 | -15790167 | -157901670 | 8534577,9 | ||||||
1380-1580 | 145,95 | 21301,4 | 127808,4 | 18653577,6 | 111921465,6 | 453749641,9 | 2722497851,8 | ||||
1580-1780 | 345,95 | 119681,4 | 478725,6 | 41403781,2 | 165615124,8 | 14323638104,3 | 57294552417,2 | ||||
1780-1980 | 545,95 | 298061,4 | 162726622,7 | 813633113,5 | 88840599659,7 | ||||||
Разом | X | X | X | X | X | 75794530,3 | X |
Визначаємо показники центру розподілу:
-середню арифметичну зважену
= = 1334,05 грн.
-медіану
n / 2 – S(-1)
Ме= Хме+ h* fме
Хме =1380; S(-1) =12; h=200; n=37; fме =10
Ме =1380+200* 37/2 –12 /10 =1510 ;
-моду
fмо – f(-1)
Мо =Хмо + h * (fмо – f(-1)) + (fмо – f(+1) )
Хмо =1380; fмо =15; f(-1)=12; f(+1)=6; h =200.
10-12
Мо = 1380+200* (10-12) +(10-6) = 1280 .
Визначаємо показники форми розподілу. Для наближеної оцінки розподілу зіставляємо значення середньої арифметичної, медіани і моди [7,54].
=1334,05 ; Ме =1510; Мо =1280.
Mo < <Me , отже має місце правостороння асиметрія.
= = = 84042,567
= = 289,9 грн.
= *100 % = *100 % = 21,7 %
сукупність однорідна, а середня – типова.
= = 20453906,22
= + 0,8395
= = 14799370371,5
E = = 2,09 .
Маємо ознаки правосторонньої асиметрії (As >0) і плоско вершинного розподілу ряду (Е < 3). Тому моделювання розподілу працюючих за розміром заробітної плати зробимо при допомозі логарифмічно-нормальної кривої з використанням функції
= = 0,29207
= =0,089094
= ; = .
Першу і останню групу доповнимо, оскільки деякі працюючі можуть мати заробітну плату меншу ніж 980 грн. або більшу за 1980 грн.
Перевіримо істотність відхилень між теоретичними і емпіричними частотами:
f, % | f', % | f-f' | (f-f')2 | (f-f')2/f' |
33,23 | -1,23 | 1,51 | 0,0455 | |
28,76 | -0,76 | 0,58 | 0,0201 | |
21,91 | -5,91 | 34,93 | 1,5942 | |
7,21 | 3,79 | 14,36 | 1,9922 | |
8,31 | 4,69 | 21,99 | 2,6462 | |
X | X | X | X | 6,2982 |
Висновки:Оскільки фактичне значення менше критичного – це дає підстави стверджувати з ймовірністю 0,95, що розходження між емпіричними та теоретичними частотами не істотне і розподіл працюючих за рівнем заробітної плати підлягає логарифмічно-нормальному закону.
Використаємо цю модель розподілу для прогнозування частки тих працівників, у яких заробітна плата буде менше 980 грн., якщо середня заробітна плата по підприємству складатиме 1987 грн.:
ln980 = 6,887 ; ln1987 = 7,594 ; t= = - 7,935;
ф (-7,94) = - 0,48
100 % * [ 0,5-0,48]= 4,52 % .
Отже, у випадку зростання середньої заробітної плати до 1987 грн., частка тих, у яких заробітна плата менше 300 грн. складатиме лише 4,52%.