Розрахунок похибок вибіркових обстежень
Після визначення дизайну вибірки та її практичної реалізації важливим завданням є оцінка якості статистичних даних, отриманих на основі вивчення вибірки. Таку якість характеризують похибки репрезентативності, тобто розбіжності між характеристиками генеральної сукупності та їх вибірковими оцінками.
За причинами виникнення похибки репрезентативності поділяють на систематичні (тенденційні) та випадкові.
Систематичні похибки виникають за умови, що під час формування вибіркової сукупності порушується принцип випадковості відбору (упереджений відбір елементів, недосконала основа вибірки тощо). Для всіх елементів сукупності вони мають односторонній напрям і тому їх ще називають похибками зміщення.
Випадкові похибки – це наслідок випадковості відбору елементів сукупності для обстеження.
В організації вибіркового обстеження важливо запобігти виникненню систематичних похибок. Випадкових похибок уникнути неможливо, проте на основі теорії вибіркового методу можна визначити їх розмір і по можливості регулювати.
Отже, якість вибіркових оцінок невідомих параметрів генеральної сукупності характеризують:
– абсолютні: стандартна та гранична D=tm похибка вибірки;
– відносні: стандартна або гранична похибки вибірки.
Гранична похибка вибірки D – це максимально можлива похибка для прийнятої ймовірності Р. Довірче число t вказує, як співвідносяться гранична D і стандартна m похибки. Розмір граничної похибки для середньої величини і частки p значень альтернативної ознаки залежить від прийнятої ймовірності гарантування результатів, варіації досліджуваної ознаки, яку характеризує дисперсія , обсягу вибірки, а також способу її формування. Формули для обчислення похибок вибірки для різних способів її формування наведені у таблиці 5.4.
Гранична похибка вибірки використовується для побудови границь довірчих інтервалів, у межах яких з прийнятою ймовірністю P може знаходитися невідоме значення середньої або частки D у генеральній сукупності. Для побудови таких довірчих інтервалів використовують формули:
– для середньої (4)
– (5)
для частки значень альтернативної ознаки
Відносні стандартні похибки вибірки розраховуються за формулами:
- для середньої; - для частки (6)
Відповідно відносні граничні похибки вибірки будуть становити:
- для середньої; - для частки. (7)
Відносна стандартна похибка часто використовується як показник придатності для аналізу. Так якщо , то оцінка вважається надійною, якщо - оцінка є придатною для кількісного аналізу, але її надійність недостатньо висока, якщо - оцінка придатна лише для якісного аналізу, тому її слід використовувати обережно.