Тема 3. зведення і групування статистичних даних
Базові поняття та терміни
Статистичне зведення - це процес упорядкування, систематизації і наукової обробки первинного статистичного матеріалу для виявлення типових рис і закономірностей явищ і процесів, що вивчаються.
Складові елементи статистичного зведення:
1. Розробка програми систематизації та групування даних, вибір групувальних ознак і встановлення меж групування;
2. Статистичне групування;
3. Обгрунтування і розробка системи показників для характеристики груп і сукупності в цілому;
4. Визначення технологічних схем обробки інформації, типів ЕОМ, програмного забезпечення;
5. Безпосереднє зведення, узагальнення, розрахунок системи показників;
6. Викладення результатів зведення у вигляді рядів розподілу, статистичних таблиць і графіків.
Централізоване зведення - це упорядкування, при якому матеріали статистичного спостереження надсилають у центральний орган державної статистики, де їх обробляють за певною, заздалегідь встановленою програмою.
Децентралізоване зведення передбачає обробку і підрахунок результатів спостереження на місцях, а уже зведені підсумки за певними адміністративними одиницями надсилають Держкомстату України.
Статистичне групування - це розподіл на групи за будь-якою істотною ознакою усієї сукупності інформації про суспільні явища, зібраної в процесі спостереження.
Типологічні групування дають можливість виділити із загального масиву інформації типові явища і процеси, з яких складається неоднорідна статистична сукупність, визначити істотні відмінності між ними, а також ознаки, що є спільними для усіх груп.
Структурні групування характеризують розподіл якісно однорідної сукупності на групи за певною ознакою.
Аналітичні групування застосовуються для вивчення взаємозв'язків між явищами, впливу однієї ознаки на іншу.
Ознака, яка впливає на інші та зумовлює їх зміни, називається факторною. Ознака, яка залежить від інших ознак і змінюється під їх впливом, називається результативною.
Просте групування - це розподіл на групи за будь-якою однією ознакою.
Складне групування може бути комбінаційним, якщо в його основі послідовно скомбіновано дві і більше ознак, або багатомірним, якщо воно проводиться за певною множиною ознак одночасно.
Первинне групування здійснюється на основі безпосереднього узагальнення первинних даних статистичного спостереження. Результат перегрупування називають вторинним групуванням. Перегрупування здійснюється або об'єднанням, або розбиттям інтервалів первинного групування.
Групувальна ознака - це ознака, яка покладена в основу групування.
Атрибутивні ознаки не мають кількісного вираження і реєструються у вигляді текстового запису. Число груп, на які поділяється досліджувана сукупність, визначається кількістю різновидів цієї ознаки. Окремим видом атрибутивних групувань є групування за альтернативною ознакою, коли є лише два варіанти атрибутивної ознаки, причому один із них виключає інший.
Кількісні (варіюючі) ознаки - це ознаки, які набувають різних цифрових характеристик і виражаються числовими значеннями. Дискретні (перервні) кількісні ознаки виражаються в кожній групі" тільки цілими числами. Інтервальні або безперервні ознаки можуть набувати різного значення в певних межах і визначаються цілими одиницями та їх частками в межах від одного числа до іншого.
Інтервал групування (величина інтервалу) - різниця між максимальним і мінімальним значеннями ознаки в кожній групі.
Рівні інтервали застосовують тоді, коли кількісна ознака всередині сукупності змінюється рівномірно. Величину інтервалу при групуванні із застосуванням рівних інтервалів визначають за формулою: ,
де h - величина інтервалу;
- максимальне значення ознаки;
- мінімальне значення ознаки;
n - кількість груп.
Нерівними називають інтервали, в яких різниця між верхньою і нижньою межею неоднакова. Нерівні інтервали застосовують у тих випадках, коли варіація групувальної ознаки відбувається нерівномірно і в дуже широких межах; вони можуть бути зростаючими і спадними.
Розрізняють інтервали закриті і відкриті. Закритимиє інтервали, в яких визначені максимальні і мінімальні межі. Відкритими називаються інтервали, у яких максимальні або мінімальні значення ознаки заздалегідь невідомі. Тому при групуванні перший і останній інтервали залишаються відкритими.
Орієнтовно оптимальна кількість груп визначається за формулою Стерджеса, за допомогою якої можна намітити число груп п, якщо відома чисельність сукупності N:
N=1+3,322 lg N
Результати зведення і групування можна оформляти у вигляді рядів розподілу, статистичних таблиць і графіків.
Статистичний ряд розподілу - це ряд, який характеризує розподіл одиниць сукупності по групах за будь-якою ознакою, різновидності якої розташовані у певному порядку.
Ряди розподілу складаються з двох елементів - варіантів і частот.
Варіанта — це окреме значення групувальної ознаки, а частоти - кількість елементів у групі з відповідним значенням ознаки. Частоти, які відповідають певній ознаці, можуть подаватись як в абсолютних значеннях, так і у відносних, виражених коефіцієнтом або відсотком (часткою). Накопичену частоту (частку) називають кумулятивною.
Ряд розподілу, утворений за якісною (атрибутивною) ознакою, називається атрибутивним.
Ряд розподілу сукупності за ознакою, що має кількісне вираження, називається варіаційним. Варіаційні ряди залежно від групувальної ознаки поділяють на дискретні та інтервальні.
Статистичні таблиці — це спосіб найбільш раціонального, наочного та систематизованого викладення результатів зведення і групування статистичних даних.