Понятие выборочной совокупности. Типы выборки
Для проведения социологического исследования недостаточно просто определить объект исследования. Нерационально опрашивать всех людей, составляющих объект исследования (иногда это могут быть тысячи людей). На это уйдет много времени. Поэтому обычно социологические исследования имеют не сплошной, а выборочный характер, т. е. по определенным и строгим правилам исследователь отбирает небольшое (относительно всего объема выборки) число людей, которые по своим социально-демографическим признакам и другим каким-то характеристикам полностью соответствуют структуре изучаемого объекта. Эта операция носит название "выборка".
Генеральная совокупность - это объект исследования, который территориально, производственно и во времени ограничен и для которого выводы проведенного исследования будут правомерны.
Выборочная совокупность (выборка) - это отобранное по строго заданному правилу определенное число элементов генеральной совокупности
Краткая характеристика основных типов выборки
N п/п | Тип выборки | Краткое описание | Достоинства | Недостатки |
Простая случайная | Из однородной совокупности, все элементы которой известны и могут быть пронумерованы, отбор единиц выборки осуществляется с помощью таблиц случайных чисел | Предварительная информация о генеральной совокупности очень проста - перечень или опись ее элементов. Легко классифицируются и вычисляются ошибки | Необходима основа выборки - перечень всех элементов генеральной совокупности, что делает выборку мало пригодной для очень больших генеральных совокупностей. Требует качественно однородных совокупностей, что в социальной сфере бывает редко | |
Систематическая | Необходим полный список единиц генеральной совокупности. В выборку отбирается по одному объекту через интервал, равный шагу отбора - отношению объема генеральной совокупности к объему выборки | Позволяет с помощью простой техники отбора при небольшом объеме выборки ухватить сравнительно большие генеральные совокупности | Существует опасность совпадения интервала отбора со скрытой периодичностью распределения признаков генеральной совокупности, что может привести к смещениям. Неопределенность выбора первоначального объекта (начальной точки отбора) | |
Гнездовая | Выборочные единицы отбираются с помощью одного из способов случайного отбора (N1,2). Единицы отбора представляют собой статистические группы (гнезда), которые целиком или выборочно подвергаются обследованию | Уменьшаются затраты (по сравнению с простой случайной выборкой равного объема) на организацию процедур отбора, например, при пространственно разбросанной генеральной совокупности. Относительно простое составление основы выборки для выбранных гнезд, чем полный перечень элементов, соответствующих всем гнездам генеральной совокупности | При форматировании искусственных гнезд создается трудность отнесения каждого отдельного элемента генеральной совокупности только к одному гнезду, обеспечения приблизительно одинаковых размеров гнезд | |
Стратифицированная (районированная выборка, расслоенный отбор) | Исследуемая совокупность предварительно разделяется на страты (слои) в соответствии с генеральным распределением известных и значимых для исследования признаков; из каждой страты извлекается выборка | При удачном подразделении совокупности на однородные группы расслоенный отбор дает выигрыш в точности по сравнению с простым случайным | Если классификация на страты не совпадает с распределением изучаемых признаков, возможно смещение выборки по этим признакам | |
А. Пропорциональное размещение | Объем выборки из страты пропорционален размеру страты в генеральной совокупности | |||
В. Оптимальное размещение | Объем выборки из страты пропорционален в страте среднеквадратичному отклонению признака и обратно пропорционален издержкам на получение выборки | Дает выигрыш по сравнению с А для случаев, когда совокупность состоит из больших и малых объектов или отбор из одних слоев обходится дороже, чем из других | Необходимо знание дисперсии признака расслоения внутри страты | |
Многоступенчатая | Процедура построения выборки разбивается на ряд этапов (ступеней). На каждой ступени меняется единица отбора | Для каждой ступени необходима своя, доступная для исследователя основа выборки. Если на одной из ступеней отбора выступает географический регион, то существенно уменьшается стоимость полевого исследования (стоимость передвижения и т.д.) | Ошибка выборки, как правило, выше, чем простого случайного или систематического отбора | |
А. Случайная | На каждой ступени единицы отбираются одним из способов случайного отбора | Организационная и методическая сложность реализации выборки | ||
В. Комбинированная | Отбор на каждой из ступеней может осуществляться любым из вышеописанных способов | |||
Квотная | Производится разбиение генеральной совокупности на классы согласно нескольким распределениям выбранных признаков. На основе знания статистического объема каждого класса и заданной доли отбора из него определяется «квота» - объем выборки соответствующего класса. Выбор исследуемых объектов из потенциально возможных, согласно квоте, возлагается на анкетера или интервьюера | Удобна для случаев, когда размер выборки невелик. Уменьшает стоимость организации выборки, поскольку производительность труда анкетеров или интервьюеров выше при самостоятельном выборе лиц для опроса, чем при их поиске по спискам адресатов | Основана на предположении, что распределения контролируемых признаков в выборке обеспечивают репрезентативность воспроизведения распределения зависимых признаков. Невозможно точно измерить смещения, вызванные неслучайным характером отбора лиц для опроса |
Качество выборки оценивают по двум показателям: репрезентативность и надежность. О репрезентативности уже говорилось выше. А чтобы создать надежную выборку, необходимо правильно построить ее основу. Для этого надо соблюдать следующие требования: полнота выборки, отсутствие дублирования, точность, адекватность и удобство работы.
Полнота выборки - это наличие всех элементов генеральной совокупности в основе выборки. Если в выборку не будут включены многие единицы наблюдения, тем более несущие в себе существенные особенности и характеристики объекта, то результаты исследования будут неполными и однобокими.
Отсутствие дублирования подразумевает недопустимость повторного включения в выборку одной и той же единицы наблюдения (например, ученик перешел учиться в другую школу, его включили в новый список, не вычеркнув при этом из старого, таким образом он дважды попал в выборку).
Под точностью информации выборки понимается исключение несуществующих единиц наблюдения из основы выборки (в избирательных списках часто остаются умершие люди или жильцы снесенных домов). Основа составленной выборки должна быть адекватна для решения поставленных в исследовании задач. Например, полный список всех учащихся школы - хорошая основа для того, чтобы сформировать выборку при изучении проблемы общей успеваемости. Но если Вас интересует проблема отношения старшеклассников к основным учебным дисциплинам, то этот список может быть использован только для формирования новой основы выборки - списка старшеклассников.
Для удобства работы с основой выборки необходимо четко пронумеровать все элементы, которые входят в основу выборки, а составленные списки централизованно хранить.
Объем и свойства выборки.
Если у нас сплошное исследование (т.е. полностью охватывается весь объект), то в идеальной ситуации ошибок репрезентативности не будет. Но если объект исследования огромен, то потребуется большое число анкетеров и интервьюеров, часто среди них бывают и недостаточно квалифицированные, а это ведет к увеличению ошибок регистрации. Проведение же выборочного исследования более подготовленными кадрами, которых можно лучше проинструктировать и проконтролировать, ведет к уменьшению ошибок регистрации. И тогда, если случайная ошибка не велика, то ошибка при проведении выборочного опроса в целом может быть меньше ошибки сплошного исследования.
Если разница в показателях выборки и генеральной совокупности более пяти процентов, то исследование проводить нельзя, так как будет иметь место искажение. Выводы такого социологического исследования не будут соответствовать действительности.
Каким должен быть оптимальный объем выборки? На этот вопрос нет однозначного, конкретного ответа. Все зависит от генеральной совокупности и целей исследования.
Социологи руководствуются обычно следующим принципом: чем более однороден по своим признакам, которые поддаются статистическому выражению, изучаемый объект, тем меньше может быть выборка. Если выборка формируется по случайному принципу, то обычно она не превышает 10%. Иногда она может быть завышена, если это будет обусловлено целями исследования.
Математики и статистики вывели формулу для определения объема выборки.
где n - объем выборки;
s -дисперсия, или мера рассеивания исследуемого признака в генеральной совокупности (степень однородности исследуемых единиц наблюдения);
t -коэффициент доверия (заданная точность);
-предельная ошибка выборки.
Как видим, объем выборки (n) будет зависеть, с одной стороны, от разнородности исследуемого объекта, а с другой - от степени точности. Чем больше разнородность объекта и больше степень точности, тем больше и объем выборки.
Чтобы вывести большую точность, для проведения исследования необходимо брать больше единиц наблюдения.
Чтобы вывести среднее квадратическое отклонение генеральной совокупности, надо взять небольшую выборочную совокупность и, пользуясь учебником общей теории статистики, вывести из нее среднее квадратическое отклонение.
Предельная ошибка выборки зависит от выбора инструментария и приемов исследования. Если приемы исследования совершенные, то и предельная ошибка меньше.
Эта формула работает лишь в условиях больших чисел. А если необходимо провести исследование на одном предприятии или учреждении, то тогда как определить выборку?
Для этого можно использовать метод квот. Квотная выборка получила наибольшее распространение при сборе информации при помощи интервью. Под квотой понимается пропорция. Этим методом пользуются, когда имеются предварительные данные о важных элементах генеральной совокупности. При этом берется какая-то часть (в процентном отношении) генеральной совокупности, непосредственно исследуется, а затем сопоставляется эта часть с целым по каким-то показателям. Это может быть возраст, образование, профессиональная подготовка и т.д. Показатели генеральной совокупности в этом случае берутся из официальной статистики.
Практика применения квотной выборки показала, что достаточно брать 10% единиц наблюдения генеральной совокупности, чтобы выборочная совокупность была обоснованной.