Глава 11.Выборочное наблюдение
Тема «Выборочное наблюдение» является одной из центральных в курсе теории статистики. Это обусловлено, прежде всего, взаимосвязью данной темы с другими темами, в особенности, со статистическим наблюдением, статистическими показателями, таблицами, графиками и т.д. Основываясь на фундаментальных теоретических положениях, в частности, предельных теоремах закона больших чисел (Чебышева-Ляпунова, Бернулли и др.), выборочное наблюдение тесно связано с курсами математической статистики и теории вероятностей. Поэтому освоение теоретического материала, умение правильно решить практические задачи по данной теме, грамотно интерпретировать полученные результаты служат необходимым условием успешного изучения курса теории статистики в целом и связанных с ней наук.
Формирование набора задач данной главы обусловлено практическими вопросами, требующими своего решения при организации выборочного наблюдения и анализе его результатов. Такими вопросами являются определение способа отбора и процедуры выборки, вычисление ошибок выборки и построение доверительных интервалов выборочных характеристик, а также расчет необходимого объема выборки. Предложенные в данной теме задания охватывают все эти вопросы с учетом особенностей формирования выборочной совокупности.
Расчет ошибок позволяет решить одну из главных проблем организации выборочного наблюдения – оценить репрезентативность (представительность) выборочной совокупности. Различают среднюю и предельную ошибки выборки. Эти два вида ошибок связаны следующим соотношением:
, где
Δ – предельная ошибка выборки;
μ – средняя ошибка выборки;
t – коэффициент доверия, определяемый в зависимости от уровня вероятности.
Величина средней ошибки выборки рассчитывается дифференцированно в зависимости от способа отбора и процедуры выборки. Так, при случайном повторном отборе средняя ошибка определяется по формуле:
,
при бесповторном: , где
σ2 – выборочная (или генеральная) дисперсия;
σ – выборочное (или генеральное) среднее квадратическое отклонение;
n – объем выборочной совокупности;
N – объем генеральной совокупности.
Расчет средней и предельной ошибок выборки позволяет определить возможные пределы, в которых будут находиться характеристики генеральной совокупности. например, для выборочной средней такие пределы устанавливаются на основе следующих соотношений:
, где
и - генеральная и выборочная средние соответственно;
- предельная ошибка выборочной средней.
Покажем практическое применение рассмотренной выше методики на следующих примерах.
Наряду с определением ошибок выборки и пределов для генеральной средней эти же показатели могут быть определены для доли признака. В этом случае особенности расчета связаны с определением дисперсии доли, которая вычисляется так:
где - доля единиц, обладающих данным признаком в выборочной совокупности, определяемая как отношение количества соответствующих единиц к объему выборки.
Тогда, например, при собственно-случайном повторном отборе для определения предельной ошибки выборки используется следующая формула:
Соответственно при бесповторном отборе
Пределы доли признака в генеральной совокупности р выглядят следующим образом:
Ошибки и пределы генеральных характеристик при других способах формирования выборочной совокупности определяются на основе соответствующих формул, отражающих особенности этих видов выборки. Например, в случае типической выборки показателем вариации является средняя из внутригрупповых дисперсий , при серийной выборке – межгрупповая (межсерийная) дисперсия δ2 и т.д. Кроме того, в последнем случае вместо объема выборочной совокупности n используется показатель числа серий r.
Следовательно, для типической выборки средняя ошибка вычисляется по формулам:
· при отборе, пропорциональном объему типических групп;
(повторный отбор);
(бесповторный отбор);
· при отборе, пропорциональном вариации признака (не пропорциональных объему групп):
(повторный отбор);
(бесповторный отбор), где
Ni и ni – объемы i-й типической группы и выборки из нее соответственно;
- групповые дисперсии.
При серийной выборке средняя ошибка определяется следующим образом:
(повторный отбор);
(бесповторный отбор), где
R – число серий в генеральной совокупности;
- межгрупповая (межсерийная) дисперсия;
r – число серий в выборочной совокупности.
Формулы необходимого объема выборки для различных способов формирования выборочной совокупности могут быть выведены из соответствующих соотношений, используемых при расчете предельных ошибок выборки.
Приведем наиболее часто применяемые на практике выражения необходимого объема выборки:
· собственно-случайная и механическая выборка:
(повторный отбор);
(бесповторный отбор);
· типическая выборка:
(повторный отбор);
(бесповторный отбор);
· серийная выборка:
(повторный отбор);
(бесповторный отбор);
При этом в зависимости от целей исследования дисперсии и ошибки выборки могут быть рассчитаны для средней величины или доли признака.
Рассмотрим примеры определения необходимого объема выборки для различных способов формирования выборочной совокупности.