Выборочный метод в социологии
Объект социологического исследования может быть численно очень большим: десятки или сотни тысяч человек, составляющих население региона, области, города; тысячи работников производственного предприятия, курсантов учебного заведения и т.д. В связи с этим возникает серьёзная проблема: научная добросовестность требует от социолога изучить все элементы объекта исследования, а финансовых средств, людских ресурсов, времени, заданного заказчиком, для этого не хватает. Каким образом выйти из подобной ситуации без ущерба для качества исследования?
При сплошных исследованиях, которые, несмотря на свою дороговизну, хотя и редко, но проводятся (например, переписи населения или референдумы) изучению подвергается вся генеральная совокупность. Сплошной охват единиц генеральной совокупности даёт полное представление о состоянии объекта по изучаемому признаку, однако, такой метод исследования может быть связан с рядом практических препятствий. Генеральная совокупность может быть чрезмерно велика или недоступна для изучения до последней ее единицы по причине большой разбросанности по разным территориям или невозможности определить физическое нахождение индивидов (люди переезжают с места на место, меняют фамилию и т.п.).
В настоящее время почти все исследования в социологии проводятся несплошным способом. Несплошное исследование может проводиться различными методами: монографическим, методом основного массива и выборочным методом.
Монографический метод предполагает детальное описание той части объекта исследования, которая является наиболее представительной, типичной для объекта в целом, в интересующем социолога отношении. Этот метод обычно применяется в комбинации со сплошным или различными видами несплошного исследования.
Методом основного массива, как правило, изучается бОльшая часть объекта социологического исследования. Этот метод находит применение, например, в некоторых социологических исследованиях, проводимых с помощью контент-анализа.
Выборочный метод дает самую высокую степень достоверности результатов из всех методов несплошного исследования благодаря особой методике отбора, которая осуществляется на элементном уровне. Разновидностей выборочного метода много, но большинство из них начинается с формирования основы выборки.
Основа выборки – это информация обо всех элементах генеральной совокупности представленная в виде описания каждого элемента или их простого перечня. Основой выборки могут служить алфавитные списки сотрудников учреждения, номера пропусков, по которым можно идентифицировать определенные единицы, номера зачетных книжек студентов и т. п.
Основа выборки должна отвечать ряду требований:
Полнота. Под полнотой подразумевается представленность всех единиц данной генеральной совокупности в основе выборки. Если некоторые единицы, которые по предположению должны быть в списке, не зарегистрированы в нем, то список является неполным. Неполнота основы выборки приводит к серьезным ошибкам в том случае, если не включенные в выборочную совокупность единицы наблюдения имеют существенные для целей и задач исследования особенности и этих единиц достаточно много.
Отсутствие дублирования. Если некоторые единицы наблюдения генеральной совокупности будут включены в основу выборки более чем один раз, то они могут повторяться и в выборке (например, в том случае, когда человек переезжает из одного района в другой и включается в новый список раньше, чем исключается из старого).
Точность. Информация о каждой единице отбора должна быть точной. Основа выборки не должна содержать несуществующих единиц. Подобные неточности встречаются и избирательных списках, когда отсутствуют вновь прибывшие в данный населенный пункт, или остаются лица, изменившие свое местожительство, умершие, жильцы снесенных домов и т. п.
Адекватность. Основа выборки, адекватная решению одних задач, может быть неадекватной решению других.
Удобство. Удобство работы с основой выборки – существенное условие повышения качества результатов. Удобно, когда единицы, составляющие основу выборки, пронумерованы, когда имеющиеся о них сведения дают возможность с полной определенностью опознавать эти единицы. Если основа выборки находится в одном централизованном месте и ее структура соответствует реальной структуре изучаемых социальных объектов, это не только облегчает работу социолога, но и является необходимым требованием к исследованию, значительно повышающим качество последнего.
Одной из причин возникновения сложных схем выборки (многоступенчатых, комбинированных и т. п.) является невозможность обеспечить основу выборки для очень больших генеральных совокупностей, обладающих сложной структурой. В современной социологии для изучения сложных и масштабных социальных объектов все чаще используется основа выборки под названием «социальная карта».
Социальная карта. Подобно тому, как географическая карта является ориентиром в пространственном движении, социальная карта является ориентиром в исследовании социальных объектов. Социальная карта представляет собой пространственное распределение всевозможных социальных показателей для определенных экономико-географических регионов. Такая карта может служить основой всех выборочных исследований в каждом регионе, области, районе, городе и т. п.
Процесс составления социальной карты складывается из следующих этапов:
1. Сбор информации о размещении и движении населения, об основных постоянных и сезонных потоках населения, которые выражаются в демографических показателях.
2. Сбор социально-экономической информации относительно профессионального состава населения: данные о квалификации, заработной плате, соотношение между работающими и неработающими, распределение уровня семейных доходов и т. д.
3. Сбор социологической информации: условия труда и быта; данные о проведении досуга, о его структуре по различным социальным группам; данные о различных формах социальной активности, образовательном уровне, влиянии средств массовой коммуникации, общественных организаций и т. д.
Возрастающий интерес социологов к построению социальных карт связан в значительной степени с прикладными задачами выборочного обследования. Для более углубленной разработки социальных проблем необходима и более основательная исходная социальная информация: карта размещения социальных групп, распространенности средств массовых коммуникаций и другие показатели.
Перейдем к краткой характеристике основных типов выборки.
Простая случайная выборка.
Описание: Из однородной совокупности, все элементы которой известны и могут быть пронумерованы, отбор единиц выборки осуществляется с помощью таблиц случайных чисел. Достоинства: Предварительная информация о генеральной совокупности очень проста – перечень или опись ее элементов. Легко классифицируются и вычисляются ошибки. Недостатки: Необходима основа выборки – перечень всех элементов генеральной совокупности, что делает выборку малопригодной для очень больших генеральных совокупностей. Требует качественно однородных совокупностей, что в социальной сфере бывает редко.
Систематическая выборка.
Описание: Необходим полный список единиц генеральной совокупности. В выборку отбирается по одному объекту через интервал, равный шагу отбора – отношению объема генеральной совокупности к объему выборки.Достоинства: Позволяет с помощью простой техники отбора при небольшом объеме выборки охватить сравнительно большие генеральные совокупности.Недостатки: Существует опасность совпадения интервала отбора со скрытой периодичностью распределения признака в генеральной совокупности, что может привести к смещениям. Неопределенность выбора первоначального объекта (начальной точки отбора).
Серийная (гнездовая) выборка.
Описание: Единицами отбора являются не отдельные индивиды, а социальные общности (статистические группы, «гнезда»), которые затем целиком или выборочно подвергаются обследованию. Достоинства: Уменьшаются затраты (по сравнению с простой случайной выборкой равного объема) на организацию процедур отбора, например, при пространственно разбросанной генеральной совокупности. Относительно простое составление основы выборки для отобранных гнезд, по сравнению с полным перечнем элементов, соответствующих всем гнездам в генеральной совокупности. Недостатки: При формировании искусственных гнезд создается трудность отнесения каждого отдельного элемента генеральной совокупности только к одному гнезду и обеспечения приблизительно одинаковых размеров гнезд.
Стратифицированная выборка.
Описание: Генеральная совокупность предварительно разделяется на страты в соответствии с распределением значимых для исследования признаков; из каждой страты в выборочную совокупность случайным образом отбирают элементы, число которых пропорционально объему (доле) страты в составе генеральной совокупности. Достоинства: При удачном разделении генеральной совокупности на однородные подгруппы дает выигрыш в точности по сравнению с простой случайной и систематической выборкой. Недостатки: Если классификация на страты не совпадает с распределением изучаемых признаков, возможно смещение выборки по этим признакам.
Многоступенчатая выборка.
Описание: Процедура построения выборки разбивается на ряд этапов (ступеней), на каждом из которых меняется единица отбора (например, отбор регионов – отбор районов внутри выбранных регионов – отбор населенных пунктов внутри выбранных районов – отбор отдельных граждан…). Достоинства: Для каждой ступени необходима своя, доступная для исследователя основа выборки. Стоимость полевого исследования (стоимость передвижения и т.д.) существенно уменьшается, если на одной из ступеней отбора выбран один географический регион. Недостатки: Ошибка выборки, как правило, выше, чем для простого случайного или систематического отбора.
Квотная выборка
Описание: Как и в стратифицированной выборке сначала производится разбиение генеральной совокупности на классы по интересующим социолога признакам. Затем внутри каждого класса пропорционально его объему определяется "квота", то есть, объем выборки соответствующего класса. Сам отбор единиц наблюдения согласно «квоте» возлагается на анкетера или интервьюера.
Достоинства: Удобна для случаев, когда размер выборки невелик, бюджет небольшой и время ограничено. Производительность труда анкетеров или интервьюеров при самостоятельном выборе лиц для опроса выше, чем при их поиске по спискам адресатов. Недостатки: Низкая надежность, поскольку последний этап отбора не является случайным (вероятностным), а происходит на основе предпочтений анкетеров и интервьюеров.
При получении социальной информации выборочным методом могут возникать ошибки различного рода, причинами которых могут быть неточность данных, сообщенных социологу респондентом, неправильная фиксация получаемых сведений или неправильное измерение переменных, характеризующих единицы наблюдения, и т. д. Эти ошибки, называемые иногда ошибками регистрации, бывают двух видов: случайные и систематические.
Систематические ошибки регистрации возникают в том случае, когда исследуемые характеристики и признаки подвергаются односторонним искажениям в сторону увеличения или уменьшения. Постепенное накопление таких ошибок по исследуемой совокупности в целом может зачеркнуть результаты всего исследования.
Характерным примером систематической ошибки являются данные о женатых мужчинах и замужних женщинах во Всесоюзной переписи 1970 г. По результатам переписи в целом по Союзу оказалось 53,0 млн. женатых мужчин и 54,2 млн. замужних женщин. Систематическая ошибка, зафиксированная в этой переписи, образовалась из-за погрешностей в ответах, возникающих от различной оценки своего семейного положения мужчинами и женщинами.
Случайные ошибки регистрации носят в основном технический характер и возникают из различных статистических погрешностей в процессе наблюдения и при отклонениях от планируемой выборки. Существуют два типичных отклонения от плана выборки.
1. Замена намеченных при планировании выборки единиц наблюдения другими, более доступными, которые, однако, оказываются неполноценными с точки зрения выработанного плана выборки. Например, опрос планируется провести в каждой десятой квартире жилого массива. Никого не застав в выбранных квартирах, интервьюер иногда обращается в соседние квартиры и берет интервью. В итоге в выборке оказывается значительная доля пенсионеров, больших по размеру семей и слабо представлены одинокие лица и малочисленные семьи.
2. Неполный охват выборочной совокупности, т. с. неполучение информации от части единиц наблюдения, включенных в выборку (например, недополучение почтовых анкет, не полностью заполненные анкеты).
Распространенными ошибками в выборочном социологическом исследовании являются ошибки, возникающие при неправильной разработке плана выборки. Во многих книгах в качестве примера смещения выборки, из-за неправильного ее планирования, приводится известный опрос, проведенный "Литэрари Дайджест" ("Литературное обозрение") относительно исхода президентских выборов 1936 г. в США. Кандидатами на этих выборах были Ф.Д. Рузвельт и А.М. Ландон. Объём осуществлялся случайным образом по телефонным книгам и составил два миллиона человек. Попавшим в выборку лицам были разосланы открытки с просьбой назвать фамилию будущего президента. Затратив огромную сумму на рассылку, сбор и обработку полученных открыток, журнал информировал общественность, что на предстоящих выборах президентом США с большим перевесом будет избран А.М. Ландон. Результаты выборов опровергли этот прогноз. В то же время социологи Д. Гэллап и Э. Роупор правильно предсказали победу Ф.Д. Рузвельта, основываясь только на четырех тысячах анкет.
Ошибочный прогноз относительно возможного президента объясняется неправильным планом выборки, который не обеспечил полного отражения в ней всей генеральной совокупности: в телефонных книгах, которые использовались для организации выборки, были представлены лишь наиболее обеспеченные слои американского населения, в частности домовладельцы. Поскольку обеспеченные слои американцев составляют меньшую часть генеральной совокупности, то распространение мнения этой части населения на всю страну в целом оказалось ошибочным.
Современные методики расчёта выборки позволяют делать достоверные прогнозы о результатах президентских или парламентских выборов на основе опроса всего 4,5-5 тыс. чел. по всей стране.
Репрезентативность выборки. Выборка в определенном смысле должна быть моделью генеральной совокупности, что и позволяет оценивать на ее основе характеристики этой совокупности. Однако нет необходимости моделировать в выборке все аспекты генеральной совокупности, достаточно учесть лишь те, которые значимы с точки зрения задач исследования. Свойство выборки отражать характеристики генеральной совокупности называется репрезентативностью.
Основной принцип построения выборки (точнее, вероятностного отбора) состоит в том, чтобы обеспечить всем элементам генеральной совокупности равные шансы попасть в выборку. Однако даже самое аккуратное соблюдение этого принципа не гарантирует выборку от искажений. Последние происходят от того, что в реальности единицы генеральной совокупности не тождественны между собой, в то время как в теории мы полагаем их одинаковыми.
В идеальной ситуации при сплошном исследовании ошибки репрезентативности должны отсутствовать. Однако в социологической практике бывает и по-другому.
Проведение сплошного обследования требует значительного числа анкетеров и интервьюеров, а это ведет к тому, что иногда привлекаются недостаточно квалифицированные кадры, действия которых увеличивают ошибку регистрации. И наоборот, применение выборочного исследования при решении тех же вопросов позволяет использовать более подготовленные кадры специалистов, обеспечить лучший их инструктаж и контроль за правильностью самой процедуры обследования, что ведёт к уменьшению ошибки регистрации. И если случайная ошибка невелика, то ошибка выборочного исследования в целом может оказаться меньше ошибки сплошного исследования. Таким образом, при определенных условиях выборочный метод оказывается более точным, чем сплошной, что еще раз подчеркивает его преимущество при проведении эмпирических социологических исследований.