Построение простой случайной репрезентативной выборки
При осуществлении отбора элементов ГС в выборку можно допустить ошибки отбора 2-х видов:
1) систематическая ошибка отбора. Характеризуется тем, что она направлена в 1 сторону, вследствие чего ошибка выборки не уменьшается при увеличении объёма ВС. СО обычно связывают с ошибками проектирования выборки. СО характеризуются тем, что их нельзя контролировать статистически, поэтому от них нужно избавляться на этапе планирования исследования;
2) случайная ошибка отбора (непреднамеренная). Ошибки обычно направлены в разные стороны и тем самым уравновешивают друг друга. Такого рода ошибка не устранима, но подчиняется статистическим законам и поддается контролю. Важнейшее свойство СО состоит в том, что они уменьшаются с увеличением объёма выборки. Как правило, при проведении исследования, параметр ГС неизвестен, а исследование проводится с целью его оценить, поэтому ошибка выборки (случайная) не может быть вычислена точно, а только может быть оценена с помощью статистических процедур. При отсутствии систематических ошибок степень точности для оценки параметра каждого признака задается двумя показателями:
1) величиной предельно допустимой случайной ошибки;
2) вероятность того, что эта ошибка не будет превышена;
Выборка называется репрезентативной, если её ошибка с заданной вероятностью не превышает предельно допустимой случайной ошибки. Если ГС ограничена (не является бесконечной), формулы расчета ОВС (объёма выборочной совокупности) корректируются за счет введения поправки на конечность ГС.
Исследователи рассчитали объёмы ВС для разных ГС по объёму, для базовых показателей ДВ и предельно допустимой ошибки. В таблице будут приведены соответствующие объёмы ГС и выборки, рассчитанной на основе качественного признака при ДВ 95% и предельно допустимой ошибке 5%.
???
ГС больше 5000 считается бесконечной. При планировании объёма выборки следует иметь ввиду следующее: приведенные в таблице объёмы выборки позволяют получить заданную точность при анализе выборки в целом, то есть, если мы не будем расчленять её на части. Если же мы хотим определить отдельно распределение ответов женщин и мужчин, то нам нужно, чтобы выборке присутствовали максимально по 400 Ж и М. Если по возрасту (на три), то 1200.
Процедуры построения ВС.
Основой статистической репрезентативности выборки является наличие случайного отбора элементом ГС в выборку. Случайный отбор – такой отбор, при котором каждый элемент ГС имеет одинаковую вероятность быть отобранным в ВС. Случайным отбор может быть только тогда, когда исследователю известен весь список ГС.
Виды случайного отбора:
1) простой случайный отбор – может быть осуществлен только для небольших и известных ГС, так как предполагает список всех элементов ГС. Респондентов отбирают для этого списка одним из методов случайного отбора:
1) лотерея;
2) компьютерная программа генерации случайных чисел;
3) систематический отбор с определенным шагом – 1) интервал (шаг) l = N/n; отбираются те элементы совокупности, которые фиксируются с помощью этого шага;
ПСО достаточно простой, однако, не всегда имеется список ГС.
Если ГС слишком велика и список ГС отсутствует, применяют расслоенный (стратифицированный отбор). В этом случае процедура случайного отбора предшествует расслоению ГС на однородные части (страты), при этом под стратификацией имеют в виду расслоение по уровням значений количественной переменной (по численности жителей; возрасту), под районированием – по значением качественного признака. Оно может быть многоступенчатым, и предполагает, что на последней ступени расслоения у исследователя будет список ГС.
2) кластерный отбор – используется для больших ГС, список не известен, и отличается от расслоенного отбора тем, что респонденты набираются не по одному, а целыми группами.