Поняття зведення та групування
Предмет, метод та основні завдання статистики
Предметом статистикиє вивчення кількісного співвідношення масових явищ та процесів у нерозривному зв'язку з їхнім якісним змістом за певних умов місця та часу. Закономірність, в якій необхідність пов'язана в кожному окремому явищі з випадковістю і лише в сукупності явищ виявляє себе як закон, називається статистичною закономірністю.
Загальні методи наукового дослідження знаходять свій розвиток у специфічних методах тієї чи іншої науки. Можна виділити такі основні групи методів статистики:
• методи масового спостереження;
• методи зведення та групування;
• методи визначення узагальнюючих та синтетичних показників (методи середніх та відносних величин, аналізу рядів розподілу, вимірювання зв'язку та ін.).
Статистичниий показник, система показників
Статистичний показник- число в сукупності з набором ознак, що характеризують обставини, до яких воно відноситься (що, де, коли, яким чином підлягає вимірюванню). Статистичні дані- сукупність показників, отриманих внаслідок статистичного спостереження або обробки даних.
Інформація - дані, необхідні для вирішення конкретної задачі. Якщо дані не відносяться до вирішуваної задачі або вже відомі адресату, то вони не містять для нього інформації. Вірогідність статистичного показника визначається його адекватністью та точністю вимірювання.
За способом обчислення розрізняють первинні і похідні (вторинні) показники. Первинні отримують в результаті зведення даних статистичного спостереження і мають форму абсолютних величин (обсяг виробленої за квартал промислової продукції). Похідні обчислюються на базі первинних або похідних. Вони мають форму середніх або відносних величин (середня заробітна плата, питома вага працівників з вищою освітою).
За ознакою часу показники діляться на інтервапьні та моментні (середня спискова чисельність робітників за 1995 p.; чисельність робітників за станом на 1 січня 1996 p.). Інтервальні та моментні показники можуть бути як первинними, так і похідними.
Складність та багатогранність соціально-економічних явищ вимагає для їхнього всебічного, комплексного вивчення використання системи статистичних показників.Така система пов'язана логікою дослідження і часто являє собою ієрархічну структуру, де показники вищих рівнів обчислюются на основі показників нижчих рівнів.
Статистична сукупність.
Статистична сукупність- множина елементів, поєднаних певними спільними умовами та причинами. Сукупність складають окремі одиниці сукупності,які мають спільні риси або ознаки.
Так, всіх студентів інституту (курсу, групи, області) можна розглядати як статистичну сукупність. Кожен студент — елемент сукупності, який має спільні ознаки: стать, вік, спеціальність, екзаменаційна оцінка і т. д. Але кожний елемент сукупності має своє, індивідуальне значення (рівень) певної ознаки. Так, конкретний студент П. має «своє» значення ознаки «вік», «спеціальність» та ін. В межах всієї сукупності окрема ознака може приймати в певних межах різні значення. Так «стать» може приймати два значення: «чоловіча», «жіноча»; «екзаменаційна оцінка» — чотири. Коливання значень ознаки в сукупності називається варіацією.
Рівень значення ознаки в окремих елементів вимірюється за допомогою шкали — набору властивостей явища і відповідних їм значень (чисел). Виділяють три основні шкали.
Метрична- звичайна числова шкала, використовується для вимірювання фізичних величин, або результатів обчислення. Для цієї шкали можуть використовуватись всі арифметичні дії. Для виміру індивідуального рівня значення ознаки «вік» буде використана саме ця шкала. Зазначимо, що для певної сукупності студентів можна вести мову про мінімальне або середнє значення цієї ознаки в сукупності.
Номінальна шкала- шкала найменувань. За допомогою цієї шкали в нашому прикладі може вимірюватись ознака «спеціальність». Очевидно, не може бути й мови про якусь «середню» або «максимальну» для групи студентів спеціальність, арифметичні дії над числами, якими ми кодуємо окремі спеціальності, не мають сенсу. Можна лише говорити про спеціальність, яка найчастіше зустрічається в сукупності. Далі таке значення будемо називати «мода».
Порядкова (рангова)шкала визначає не тільки подібність елементів, а й послідовність типу «більше, ніж», «краще, ніж» тощо. Кожній точці шкали присвоюється бал (ранг). Так, отримана на іспиті із статистики оцінка «добре», яку звичайно позначають як «4», відповідає рівню знань, який вищий ніж «задовільно», але нижчий від знань, оцінених на «відмінно». Але, як відомо, дві «2» не є «4». Таким чином, обчислення деканатом «середнього балу» є, з точки зору статистики, не коректним.
З огляду на названі шкали, ознаки можна поділити на кількісні (варіаційні) та атрибутивні (якісні).
Рівень кількісної ознаки вимірюється за допомогою метричної шкали. Для атрибутивної ознаки вимірювання означає реєстрацію наявності чи відсутності властивостей, тобто класифікація. Кожен клас помічається буквами або цифрами (проводиться оцифровка). Наприклад, атрибутивна ознака «стать»: два класи, позначка — «ч» і «ж», або — «1» і «2»; атрибутивна ознака «оцінка»: чотири класи, позначка — «5», «4» і т. д., або - «відмінно», «добре» і т. д.
З точки зору взаємозв'язку, відношення «причина-наслідок», ознаки поділяють на факторні та результативні (рівень кваліфікації — заробіток; кількість внесених добрив на 1 га — урожайність, ц/га).
У загальному випадку в будь-якому статистичному дослідженні присутні в тій чи іншій мірі такі етапи:
• збір статистичнних даних та їх первинна обробка (чистка);
• зведення, групування, обчислення середніх та відносних величин;
• аналіз варіації, взаємозв'язку, динаміки, перевірка гіпотез.
Аналіз, як правило, супроводжують побудовою статистичних таблиць та графіків. Звернемо увагу на те, що якість оформлення тексту матеріалу (аналітичної записки) не тільки сприяє його сприйманню, а й характеризує кваліфікацію та культуру автора.
Вказана послідовність є лише загальною, а конкретний зміст того чи іншого етапу залежить від мети дослідження та характеру даних. На практиці часто доводиться повертатись до попередніх етапів, повторювати окремі з них та ін.
У спеціальній літературі часто окремо виділяють так званий «етап розвідувального статистичного аналізу», метою якого є ретельне попереднє вивчення первинних даних для подальшого обгрунтованого вибору необхідного математичного інструментарію [10].
Широкі можливості і певну специфіку надає статистичному дослідженню використання комп'ютерів та спеціальних програмних засобів. Це значно підвищує якість та швидкість виконання роботи - від формування первинного масиву до підготовки та друкування тексту аналітичної записки, статистичних таблиць та графіків.
Статистичне спостереження
Статистичне спостереження— науково організований збір масових даних про явища та процеси, які відбуваються у суспільстві.
План спостереження передбачає мету, об'єкт та одиницю спостереження, джерела та засоби одер-ження даних, час (момент) спостереження та ін. Слід відрізняти одиницюстатистичного спостереження від елементу сукупності.
Одиниця — носій інформації; елемент — носій ознак. Так, під час перепису устаткування одиницею спостереження є окреме підприємство, а елементом — окремий верстат чи механізм.
Застосовують дві організаційні форми спостереження — звітність і спеціально організовані спостереження. До останньої належать переписи, одноразові обліки, вибіркові обстеження.
За охопленням одиниць сукупності спостереження поділяють на суцільне і несуцільне. Останнє буває кількох видів: спостереження основного масиву, вибіркове, монографічне і анкетне.
При суцільномуобстеженні реєстрації підлягають усі без винятку елементи сукупності.
Спостереження основного масивуохоплює переважну частину елементів сукупності.
При вибірковомуспостереженні вивчається лише частина сукупності, відібрана спеціальним методом, який:
а) забезпечує рівний шанс для кожної одиниці сукупності потрапити у вибірку;
б) визначає достатню кількість відібраних одиниць. Виконання цих двох умов робить вибірку репрезентативною,представницькою.
Це дає можливість приписати, розповсюдити характеристики, які визначені для вибіркової сукупності (наприклад, середнє значення), на всю сукупність, яка має назву генеральної.
Монографічне спостереження передбачає детальний опис невеликої кількості або окремих одиниць сукупності, які можуть вважатися типовими.
Анкетніспостереження застосовуються, наприклад, при соціологічних дослідженнях.
І, нарешті, існують три способи одержання статистичних даних: безпосередній облік фактів, документальний облік і опитування респондентів.
Розбіжності між даними спостережень та реальними даними називають помилками спостереження.
Розрізнюють два види таких помилок. Помилки реєстрації,які виникають внаслідок неправильного встановлення фактів або їх реєстрації. Помилки репрезентативностівластиві тільки вибірковому спостереженню і виникають в результаті некоректного формування вибіркової сукупності.
Питання для самоконтролю
1. Чим відрізняється поняття «статистика» від поняття «математична статистика»?
2. Як ви розумієте процедуру «чистки» статистичних даних?
3. Назвіть послідовність етапів статистичного дослідження.
4. Чи є необхідною варіація ознаки, щоб множину одиниць назвати статистичною сукупністю?
5. Назвіть умови використання натуральних та вартісних вимірників.
6. Чи можна вважати статистичною сукупністю усі підприємства м. Києва; кульки, добуті з одного підшипника?
7. Назвіть два "приклади ознак для кожної відомої вам шкали вимірювання.
8. Які види статистичного спостереження виділяють залежно від охоплення одиниць сукупності?
9. Які ви знаєте організаційні форми проведення спостереження?
10. Назвіть принципи формування вибіркової сукупності.
11. Від чого залежить обсяг вибіркової сукупності?
ТЕМА 2: Зведення та групування статистичних даних. Абсолютні та відносні величини
ПЛАН ЛЕКЦІЇ
2.1. Поняття зведення та групування.
2.2. Види групувань.
2.3. Методика проведення.
2.4. Статистичні таблиці та графіки.
2.5. Абсолютні та відносні величини.
Поняття зведення та групування.
У результаті статистичного спостереження отримують матеріал, який характеризує окремі елементи сукупності. За випадковим і несуттєвим криється закономірне та необхідне. Виникає потреба в спеціальній обробці статистичних даних — зведенні матеріалів спостереження.
Зведення— комплекс дій по узагальненню конкретних індивідуальних даних, які утворюють сукупність, з метою виявлення типових рис і закономірностей, властивих досліджуваному явищу в цілому. Зведення включає групування матеріалу, розробку або вибір показників, які характеризують типові групи та підгрупи, підрахунок групових і загальних підсумків, викладення результатів у вигляді статистичних таблиць та графіків. В основі зведення лежить метод групування.
Статистичне групування— розподіл сукупності на групи за істотними для них ознаками.
Види групувань.
За допомогою статистичного групування вирішуються три основних завдання:
• Поділення неоднорідної сукупності на якісно однорідні групи вирішується за допомогою типологічних групувань (поділення працівників за рівнем освіти) (табл. 2.1).
Таблиця 2.1
Групування працівників, що займають посади керівників та спеціалістів, за рівнем освіти
Групи | Освіта | Кількість працівників, тис. Чол. |
Керівники | Вища Середня спеціальна | 776,9 669,8 |
Спеціалісти | Вища Середня спеціальна | 1757,6 1899,6 |
• Вивчення структури та структурних зрушень в якісно однорідних сукупностях, їх розподіл за величиною варіюючої ознаки вирішується за допомогою структурних(варіаційних) групувань. Прикладом може бути розподіл працівників підприємства на вікові групи (до 20 років, 20-25 і так далі) (табл. 2.2).
Таблиця 2.2
Групування працівників підприємства на вікові групи
Групи за віком | % |
20-24 | |
25-29 | |
30-34 | |
35-39 | |
40-44 |
• Виявлення та вивчення взаємозв'язку між ознаками здійснюється за допомогою аналітичних групувань. Так, наприклад, виділивши окремі групи серед працівників однієї спеціальності за рівнем фаху (І розряд, II розряд і т. д.) та підрахувавши для кожної групи середній місячний заробіток, можна робити деякі припущення щодо наявності статистичного зв'язку між ознаками «фах—заробіток» (мається на увазі рівень фаху і рівень заробітку).
Таке поділення групувань на види досить умовне і на практиці не завжди можна провести чітку межу між ними. Групування за однією ознакою називаються простими. Коли ж для виділення груп беруть по дві і більше ознак, то такі групування називають комбінаційними. Наприклад, обстежувану кількість людей поділили на групи за кольором волосся, а потім кожну з них у свою чергу ще й за кольором очей (табл. 2.3). Таблиці такого типу мають назву таблиць співза-лежності, вони можуть бути використані при вивченні взаємозв'язку між двома якісними ознаками.
Таблиця 2.3
Розподіл студентів за кольором волосся та кольором очей (чол.)
Колір очей | Колір волосся | разом | |||||||
Світле | Русяве | Чорне | |||||||
Блакитні | |||||||||
Сірі | |||||||||
Карі | |||||||||
Разом | |||||||||
Дійсно, дані табл. 2.3 дають підставу зробити припущення, що темний колір очей в якійсь мірі пов'язаний з темним кольором волосся, частіше відповідає йому (якщо, звичайно, останнє не пофарбоване). Іншим прикладом комбінаційного групування є дані табл. 2.4.
Методика проведення.
На перший погляд може здаватися, що метод статистичного групування досить простий і з деякою «натяжкою» зветься науковим, але він займає в статистичному дослідженні особливе місце. Він допомогає виділити однорідні групи і тим самим визначає межі і можливості використання інших методів.
Таблиця 2.4
Залежність між матеріальним становищем працівників та їхнім соціальним статусом (чол.)
Матеріальне становище | Групи респондентів | |||
керівники | Робітники і службовці | підприємці | Всього | |
Добре | ||||
Середне | ||||
Погано | ||||
Дуже погано | ||||
Разом |
Передумовою використання методу є всебічний аналіз суті явища, чітке визначення істотних ознак та інтервалів групування таким чином, щоб утворені групи складались із подібних одиниць сукупності, а окремі групи суттєво відрізнялись одна від одної.
Якщо групування проводиться за атрибутивною ознакою, то число груп відповідає числу її різновидів. Якщо ознака альтернативна, то можливі лише дві групи.
При групуванні за варіаційною ознакою необхідно вибрати кількість груп та інтервали групування. Так, при групуванні працівників підприємства за віком інтервали групування, а можливо, і кількість груп будуть відрізнятись від групування за віком студентів стаціонарної форми навчання. Якщо у першому випадку може бути ширина інтервалу в п'ять років, а групу працівників у віці, наприклад, 45-50 років слід вважати досить однорідною, то у другому випадку такий підхід навряд чи буде доцільним. У кожному випадку необхідно приймати до уваги те, скільки одиниць сукупності потрапляє в кожну групу.
Якщо інтервали будуть занадто малими, то утвориться багато малочисельних груп, матеріал розпорошиться і не можна буде виявити масові законо- мірності. Якщо брати занадто широкі інтервали, то групи будуть складатись з одиниць, які якісно відрізняються, вони будуть неоднорідними.
Особливе значення має коректний вибір інтервалів у випадку аналітичних групувань, оскільки невдалий або упереджений підхід може спотворити дійсний характер взаємозв'язку між явищами.
Відомі формальні правила виділення числа груп, наприклад формула Стерджеса, але нагадаємо, що основну роль при цьому мають відігравати розуміння дослідником явищ, що вивчаються, його досвід та інтуїція.
Величина інтервалує різниця між максимальним та мінімальним значеннями ознаки в кожній групі. Інтервали можуть бути рівними і нерівними. Рівнізастосовуються тоді, коли ознака групування розподілена у сукупності більш-менш рівномірно. Ширину рівних інтервалів визначають за формулою
де хmax, xmin - відповідно максимальне і мінімальне значення ознаки в сукупності; п — кількість груп.
Прикладом групування з нерівнимиінтервалами може бути таке групування фірм по кількості працівників: до 10 чол.; 10-30; 30-100; 100-200; 200-500; 500 чол. і більше. При цьому, як правило, нижню межу вважають «включно», а верхню — «виключно». Тобто фірма з чисельністю 30 чол. потрапить в третю групу. Перший та останній інтервали в цьому прикладі називаються відкритими.
Іноді, при невеликій кількості спостережень, застосовують принцип рівнихчастот,при якому одиниці сукупності упорядковуються в порядку зростання, а кожна група містить їх однакову кількість. Це виключає утворення малочисельних груп.
В окремих випадках проводять перегрупування даних з метою утворення нових груп на основі тих, що є, якщо останні не задовольняють мету аналізу.