Оптимальная численность выборки
Перед непосредственным проведением выборочного наблюдения всегда решается вопрос, сколько единиц исследуемой совокупности необходимо отобрать для выборки. Формулы для определения ее численности выводят из формул предельных ошибок выборки в соответствии со следующими исходными положениями:
- вид предполагаемой выборки;
- способ отбора (повторный или бесповторный);
- выбор оцениваемого параметра (среднего значения или доли).
Кроме того, нужно заранее определиться со значением доверительной вероятности, устраивающей потребителя информации, и с размером допустимой предельной ошибки выборки. Задание и , как правило, не представляе6т особых трудностей и связано с природой изучаемой совокупности. Однако следует помнить, что большая доверительная вероятность позволяет получать не только более точные результаты, но и значительно увеличивает объем выборки. Аналогичная ситуация с предельной ошибкой выборки: ее снижение в два раза увеличивает размер выборки в четыре раза.
Реальную сложность представляет собой определение размера вариации признака – дисперсии. На практике эта величина чаще всего остается неизвестной до проведения обследования. Иногда дисперсию оценивают так называемыми прямыми способами:
- проводят пилотные обследования до начала основного наблюдения с целью выяснения величины ;
- условно принимают величину дисперсии из данных прошлых аналогичных обследований.
Существует также ряд косвенных способов нахождения дисперсии изучаемого признака, представляющих собой определенные математические приемы, которые базируются на свойствах статистических совокупностей. Поскольку распределения большинства из них близки к нормальному закону, значение дисперсии приблизительно можно определить следующим образом.
Так как все значения вариант признака при нормальном законе распределения размещаются на 3 в одну и другую сторону от среднего, имеет место приблизительное равенство .
Для социально-экономических явлений, если некоторым образом известно значение среднего, используют соотношение , также приблизительно характеризующее среднее квадратическое отклонение.
Дисперсия альтернативного признака зависит от доли единиц, обладающих изучаемым признаком. Если эта доля неизвестна, берется максимально возможное значение дисперсии – 0,25.
Таблица 4 – Формулы для определения численности выборочной совокупности
Способ отбора | При оценивании среднего значения | При оценивании доли | ||
повторный отбор | бесповторный отбор | повторный отбор | бесповторный отбор | |
Собственно-случайный | ||||
Механический | - | - | ||
Типический | ||||
Серийный |