Простая случайная выборка
При простой случайной выборке отбор единиц в выборочную совокупность производится непосредственно из всей массы единиц генеральной совокупности в форме случайного отбора, при котором каждой единице генеральной совокупности обеспечивается одинаковая вероятность (возможность) быть выбранной. Единица отбора совпадает с единицей наблюдения. Случайный отбор осуществляется путем применения жеребьевки (лотереи) или путем использования таблиц случайных чисел.
Случайный отбор может быть проведен в двух формах: в форме возвратной (повторной) выборки и в форме безвозвратной (бесповторной) выборки. При повторном отборе вероятность попадания каждой единицы генеральной совокупности остается постоянной, так как после отбора какой-то единицы она снова возвращается в генеральную совокупность и может быть выбранной. При бесповторном отборе выбранная единица не возвращается в генеральную совокупность и вероятность попадания отдельных единиц в выборку все время изменяется (для оставшихся единиц она возрастает).
Применение простой случайной повторной выборки на практике весьма ограниченно; обычно используется бесповторная выборка.
Теорема Чебышева утверждает принципиальную возможность определения генеральной средней по данным случайной повторной выборки. Теорема Чебышева дополняется теоремой Ляпунова, которая позволяет рассчитать максимальную ошибку выборочной средней при данном достаточно большом числе независимых наблюдений. Согласно этой теореме при достаточно большом числе независимых наблюдений в генеральной совокупности с конечной средней и ограниченной дисперсией вероятность того, что расхождение между выборочной и генеральной средней (хср. - )не превзойдет по абсолютной величине некоторую величину tµ, равна интегралу Лапласа. Это можно записать так:
Ф(t) = ,
где Ф (t) — интеграл Лапласа (удвоенная нормированная функция Лапласа).
Величина tµ , обозначаемая называется предельной ошибкой выборки. Следовательно,
; ,
где — предельная (максимально возможная) ошибка средней;
— предельная (максимально возможная) ошибка доли;
µ — величина средней квадратической стандартной ошибки (стандартная или средняя ошибка) средней или доли;
t — коэффициент кратности средней ошибки выборки, зависящий от вероятности, с которой гарантируется величина предельной ошибки.
В зависимости от принятой вероятности Р определяется значение коэффициента кратности (t) по удвоенной нормированной функции Лапласа (см. статистические таблицы – Удвоенная нормированная функция Лапласа).
Величина средней (стандартной) ошибки в условиях большой выборки (п > 30) рассчитывается по известным из теории вероятностей формулам:
а) при случайной повторной выборке:
,
б) при случайной бесповторной выборке:
,
При расчете ошибок возникает существенное затруднение: величины σ и р для генеральной совокупности неизвестны. Эти величины в условиях большой выборки заменяют величинами S (выборочная дисперсия) и w (выборочная доля), рассчитанными по выборочным данным. В табл. 4.1 приведены формулы расчета ошибок простой случайной выборки.
Табл. 4.1