Понятие о выборочном наблюдении и его теоретические основы
Выборочное наблюдение представляет собой один из наиболее широко применяемых видов несплошного наблюдения. При проведении выборочного наблюдения, как и всякого несплошного наблюдения, обследуются не все единицы изучаемого объекта. Однако наблюдение организовано таким образом, что эта часть отобранных единиц репрезентатирует (представляет) всю совокупность. При проведении выборочного наблюдения может возникать ошибка репрезентативности. Она представляет собой расхождение между величиной полученных по выборке показателей и величиной этих показателей, которые были бы получены при проведенном с одинаковой степенью точности сплошном наблюдении.
В дальнейшем мы будем применять следующие условные обозначения:
N – объем генеральной совокупности (число входящих в нее единиц);
n – объем выборки (число обследованных единиц);
- генеральная средняя (среднее значение в генеральной совокупности);
- выборочная средняя;
p – генеральная доля (доля единиц, обладающих данным значением признака, в общем числе единиц генеральной совокупности);
w – выборочная доля;
- среднее квадратическое отклонение в генеральной совокупности;
S – среднее квадратическое отклонение в выборке.
В зависимости от способа отбора единиц выделяют:
- повторную выборку – это способ, когда единицы генеральной совокупности, отбираемые в выборочную совокупность, после их изучения, возвращаются в генеральную совокупность;
- бесповторную выборку – это способ, при котором единицы генеральной совокупности, отобранные в выборочную совокупность, после исследования обратно в генеральную совокупность не возвращают.
По способу организации различают следующие виды выборочного наблюдения:
1. Собственно случайная (простая) выборка. При простой случайной выборке отбор производится из всей массы единиц генеральной совокупности без предварительного расчленения ее на какие – либо группы, и единица отбора совпадает с единицей наблюдения.
2. Типическая (стратифицированная) выборка. При проведении выборочного наблюдения общий список единиц генеральной совокупности в целом предварительно разбивается на отдельные части, каждая из которых включает единицы, принадлежащие к однородной по определенному признаку группе (типу).
3. Серийная (гнездовая) выборка. В случайном порядке отбираются группы (серии, гнезда) единиц, подвергаются сплошному обследованию.
4. Механический отбор. Наблюдению подвергаются единицы, находящиеся на равном расстоянии в определенной последовательности расположения единиц генеральной совокупности.
По степени охвата единиц исследуемой совокупности различают большие и малые выборки.
Простая случайная выборка
Теорема П.Л. Чебышева доказывает принципиальную возможность определения генеральной средней по данным простой случайной выборки Согласно теореме А.Я.Ляпунова при достаточно большом числе независимых наблюдений в генеральной совокупности вероятность того, что расхождение выборочной и генеральной средней не превзойдет величину , равна интегралу Лапласа (Ф(t)). Величину называют предельной ошибкой выборки и обозначают ∆.
Приведем наиболее часто употребляемые уровни доверительной вероятности и соответствующие значения t для выборок достаточно большого объема (n> 30):
t | 1,00 | 1,96 | 2,00 | 2,58 | 3,00 |
Ф(t) | 0,683 | 0,950 | 0,954 | 0,990 | 0,997 |
1. Средняя ошибка выборки для среднего значения находится двумя способами, в зависимости от того, способом производился отбор в выборочную совокупность:
- при повторном отборе средняя ошибка выборки для среднего значения равна:
;
- при бесповторном отборе:
.
Предельная ошибка выборки для среднего значения находится по формуле: ,
где t – коэффициент доверия,
- средняя ошибка выборки для среднего значения.
2. Средняя ошибка выборки для доли признака находится двумя способами, в зависимости от того, способом производился отбор в выборочную совокупность:
- при повторном отборе средняя ошибка выборки для доли признака равна:
,
где w – выборочная доля.
- при бесповторном отборе средняя ошибка выборки для доли признака равна:
.
Предельная ошибка выборки для доли признака находится по формуле: ,
где - средняя ошибка выборка для доли признака.
Доверительный интервал для генеральной средней можно записать так:
Аналогичным образом могут быть записаны доверительные пределы генеральной доли:
.
Малая выборка
При уменьшении объема выборки снижается точность оцениваемых параметров генеральной совокупности.
Для оценки возможных пределов ошибки малой выборки пользуются отношением Стьюдента:
,
где S - среднее квадратическое отклонение в выборке;
n – 1 – число степеней свободы (k).
Если tрасч. по модулю tнабл.., то можно сделать вывод, что с определенной вероятностью оценки параметров генеральной совокупности значимы.
В таблице приведены величины отношения Стьюдента t:
Таблица
Величины отношения Стьюдента t (краткая выдержка)
0,95 | 0,99 | 0,997 | |
2,776 | 4,604 | 6,435 | |
2,262 | 3,250 | 4,024 | |
2,145 | 2,977 | 3,583 | |
2,086 | 2,845 | 3,376 | |
2,064 | 2,797 | 3,250 |
Средняя квадратическая ошибка выборки для среднего значения при повторном отборе составляет:
;
Средняя ошибка выборки для среднего значения при бесповторном отборе равна: .
Средняя ошибка выборки доли признака при повторном отборе находится по формуле: .
Средняя ошибка выборки доли признака при бесповторном отборе рассчитывается как: