Районированная и стратифицированная выборки
Если генеральная совокупность велика, а такое в эмпирическом исследовании случается очень часто, то приходится разделять обследуемую совокупность на более или менее однородные части, а затем осуществлять отбор единиц внутри этих частей. Такую раздробленную на части выборку правильнее всего было бы называть расслоенной. Однако в русском языке подобный термин не утвердился, видимо, как не соответствующий нормам правильного произношения.
Поскольку в отечественной социологии очень много иностранных слов — и это правильно с точки зрения унификации научной терминологии, приведения ее к международным стандартам, — то слову «расслоенная» попытались найти эквивалент. В числе претендентов оказались две наилучшие кандидатуры, а именно термины «районированная» и «стратифицированная».
В русском языке первое слово явно тяготеет к географическому языковому ареалу и обозначает территориальную зону. Поскольку генеральную совокупность, особенно очень большую, например население всей страны, можно разбивать в том числе и по региональному признаку, в отечественной литературе утвердился термин «районированная выборка». Но наряду с тем генеральную совокупность можно расслаивать и по стратам (полу, возрасту, доходам и т.д.), получая в качестве критерия уже не географический район, а социальную группу.
В итоге сложилась практика различения двух разновидностей расслоенной выборки. Если деление происходит по стратам (социальным группам), то выборку именуют стратифицированной, если по экономико-географическим районам, то —районированной.
В литературе (да и в маркетинговой практике) два термина — районированная и стратифицированная выборки — нередко счи- таются эквивалентными. Происходит это потому, что в основе той и другой лежит одна и та же процедура расслоения, а расслаивать в социологии можно двояко: либо по социальным группам (тогда речь идет о социальной структуре и стратификации как ее част-ном виде), либо по географическим районам. Когда объединяют оба понятия в одно, как правило, дают обобщающее определение подобной выборки, например, такое:
Районированная выборка — вид выборки, при котором отбору предшествует процедура районирования (расслоения, стратификации), т.е. разделения исходной совокупности на статистически или качественно однородные подсовокупности, называемые слоями,
стратами или типичными группами. Отбор единиц, который может носить как случайный, так и направленный характер, производится независимо из каждого слоя, поэтому районированная выборка равносильна ряду выборок, извлеченных из меньших совокупностей-страт15.
В этом определении исходное понятие «районированная выборка» без ущерба для дела можно заменить на «стратифицированную выборку». Таким образом, одинаково правильно будет как разделять одну выборку на две самостоятельные разновидности, районированную и стратифицированную, так и подавать их как единое целое. За единство двух приемов выступает практика социологических исследований. Оказывается, в крупномасштабных проектах социологи начинают с районированной выборки, а затем переходят на стратифицированную. Так, например, в обследованиях Центра «Социо-Экспресс» Института социологии РАН в основе построения районированной выборки лежат десять экономико-географических зон, в каждой из которых выделяются крупные города (численностью свыше 500 тыс. населения), средние города (50-500 тыс.), малые города (до 50 тыс.) или поселки городского типа, а также сельские населенные пункты. Внутри отобранных городов респондентов отбирают случайным методом. Репрезентативность контролируется по региональным пропорциям численности населения, пропорциям между городским и сельским населением, пропорциям между населением указанных типов населенных пунктов16.
В международной практике не используется русское слово «район» как географическая зона (ареал, регион, часть территории), поэтому здесь не встретишь и термина «районированная выборка». Вместо него употребляют термин «стратифицированная выборка», подразумевая, что, разбивая единое целое на части, не обязательно точно указывать, что они собой представляют — группы или районы.
В таком случае стратифицированная выборка (stratified sampling) — вероятностная выборка, обеспечивающая равномерное представительство в выборочной совокупности различных частей, типов, групп и слоев населения.
В английском языке слово «стратификация» мало чем отличается от слов «расслоение», «разделение», «разбиение». Это социологи придали стратификации социальный смысл, а в геологии, 104
откуда мы позаимствовали термин, стратификация означает вертикальное расслоение земли на однородные пласты. Ни классов, ни доходов, ни социальных групп здесь нет.
Надо учитывать и другой нюанс. Дело в том, что в зарубежных словарях, прежде всего американских и главным образом ведущих, все, что связано с территориальным признаком, в том числе и расслоение по районам, относится к квотной выборке. К примеру, в знаменитом Оксфордском словаре социологии на термин «stratified sampling» стоит отсылка: см. sampling. Открываем с. 576—577 и читаем о том, что в случае стратифицированной вероятностной {random) выборки речь идет о разбиении совокупности на подгруппы, т.е. страты, например мужчин и женщин, а о районированной выборке в нашем понимании не говорится ни слова. Близкий к районам термин «local areas» употребляется Гордоном Маршаллом (а он считается знатоком в этом деле) только в связи: 1) с первой стадией многоступенчатого отбора, 2) с квотной выборкой17.
Возвращаясь от лингвистических тонкостей к методическим, подчеркнем вот еще что: отбор единиц, который может носить как случайный, так и направленный характер, производится независимо из каждого слоя или района, поэтому районированно-стра-тифицированная выборка (если можно так выразиться) равносильна ряду выборок, извлеченных из меньших совокупностей-страт (районов).
Стратифицированная случайная выборка (в узком значении) основана на выборке по каждой страте отдельно. Это повышает точность результатов либо уменьшает время, силы и стоимость исследования, допуская меньшие размеры выборки при заданном уровне точности. Например, известно, что бедность наиболее часто встречается среди пожилых, безработных и в монородительских семьях. Исследуя проблемы бедности, можно с равным успехом выбрать в качестве объекта любую из трех страт. В отобранных районах или стратах выбор единиц обследования проводится по вероятностному методу.
Основная цель всякого расслоения — повышение точности выборочных оценок. Слои выделяются таким образом, чтобы дисперсия изучаемых переменных внутри слоев была значительно меньше, чем между ними. При расслоении вариация между слоями не входит в среднюю ошибку выборки, а компенсируется самой процедурой выделения слоев. Поэтому расслоение позволяет5 добиться более высокой степени точности оценок по сравнению
с простым случайным отбором. Если каждый слой представляет собой статистически однородную группу, то для любого из них даже выборка малого объема позволит получить достаточно точные оценки, которые, будучи объединены, дадут хорошую оценку для всей совокупности.
Различают стратификацию одномерную и многомерную в зависимости от того, один или несколько признаков положены в основу разделения совокупности. Эти признаки должны иметь тесную связь с изучаемыми переменными, от их выбора в высокой степени зависит эффективность расслоения.
2.4.4. Гнездовая выборка
Противоположность районированной и стратифицированной выборке составляет гнездовая выборка.
Гнездовая выборка — вид выборки, при котором отбираемые объекты представляют собой группы или гнезда (кластеры) более мелких единиц. Гнездом называют единицу отбора высшей ступени, состоящую из более мелких единиц низшей ступени. В выборку могут быть включены как все единицы низшего уровня, так и их часть. Число единиц, образующих гнездо, называют его размером.
В качестве гнезд выступают населенные пункты, районы, дома, подъезды, предприятия, цехи, бригады.
Гнездовой отбор обладает большими организационными преимуществами — проще осуществлять отбор и обследование нескольких компактных групп, чем десятков или сотен отдельных единиц. Технические преимущества гнездового отбора особенно ощутимы при построении территориальной выборки. Отбор небольшого числа территориальных сегментов (населенных пунктов, районов, жилых кварталов и т.п.), затем выборочный или сплошной опрос проживающего в них населения существенно уменьшают стоимость исследования и сроки проведения.
Процедурно такой метод применить легче, чем вероятностный либо районированный. Проблемы, которые возникают здесь, связаны с определением величины гнезда, количеством гнезд, которые надо обследовать, их размещением в генеральной совокупности.
Основные рекомендации при выборе гнезд сводятся к тому, чтобы различия между гнездами были бы по возможности более неоднородными. Это правило прямо противоположно основному принципу расслоения, в соответствии с которым выигрыш в точности тем больше, чем более однородными будут выделенные
слои. Другая рекомендация касается выбора размера гнезд: большое число малых гнезд предпочтительнее малого числа крупных18.
Пример стратифицированной выборки.Первое исследование по уровню жизни населения проведено в конце 60-х гг. XX в. группой исследователей (под рук. Н.М.Римашевской) из Центрального экономико-математического института АН СССР в городе Таганроге19. Проект назван Таганрог-1. Исследование в конце 70-х гг. названо Таганрог-2, а в 1988-1989 гг. названо Таганрог-3. Это город на юге России с населением около 300 тыс. человек. Семья — это группа лиц, живущих вместе на одной жилой площади, ведущих совместное хозяйство и находящихся в отношениях родства, брака или опекунства. В 1989 г. в Таганроге около 10% населения имели душевые доходы ниже 75 руб., т.е. были бедными. Основой выборки служили данные о структуре жилого фонда и числе проживающих. На первом этапе город поделен на районы, на втором вычислялись доли разных типов жилья с разным уровнем его оплаты и коммунальными удобствами. На третьем этапе жилой фонд делился по числу квартир в домах. Для каждой страты — района, типа застройки, размера жилья — заводился лист с адресами и числом квартир. Так планировалась выборка и организовывался отбор домохозяйств в Таганроге-2. Использовалась трехуровневая процедура территориального стратифицированного отбора.
Пример районированной выборки.Эмпирической основой работы «Динамика социальной структуры красноярского региона» явились социологические исследования, проведенные сотрудниками Красноярского государственного университета под руководством проф. В.Г.Немировского: 1) опрос 1488 жителей Красноярского края в мае 1991 г.; 2) опрос 1240 жителей края в июне 1992 г.; 3) опрос 1050 жителей края в мае 1995 г.; 4) опрос 1820 жителей края в апреле 1998 г.; 5) опрос 1460 жителей края в январе 1999 г. Каждое исследование проводилось по общекраевой выборке методом формализованного интервью. Использовалась многоступенчатая, районированная выборка, сформированная в соответствии с половозрастной структурой населения края. В процессе построения выборки на первой ступени генеральная совокупность делилась на ряд слоев в зависимости от места жительства респондента: в городской (в крае 27 городов) и сельской местности (последняя подразделяется на 41 административный район); размера населенного пункта: жители крупного города (Красноярск), сред-
него города, малого города, сельскохозяйственных районов, районов с преобладанием лесной промышленности. Затем осуществлялся типологический отбор районов и городов в каждом из выделенных слоев. На второй ступени отбора проводилось районирование уже внутри населенных пунктов или сельских районов. Так, в городах выделялись административные, промышленные, «спальные» районы, места индивидуальной застройки. В сельской местности признаком расслоения служил размер населенного пункта — райцентр, село, деревня. В следующей ступени проводился квотный отбор. В рамках конкретной территориальной зоны анкетер должен был опросить определенное число лиц с заданными социально-демократическими характеристиками20.
При гнездовой выборке (которую иногда называют также кластерной21) определяются группы или гнезда элементов и составляются их списки. Затем из этого списка единиц выборки проектируется выборка. Потом только для этих единиц идентифицируются и отбираются элементы. Возьмем, например, составление опросного списка на 1000 человек (размер выборки) для изучения общественного мнения населения города. Поскольку мы не располагаем списком всех жителей города, мы могли бы начать с получения карты города, чтобы определить все его кварталы и составить их список. Этот список кварталов становится остовом выборки, из которого случайным образом или систематически проводится выборка кварталов. Затем будет спроектирована выборка жилых домов из каждого квартала. Затем будет установлена связь с семьями, проживающими в отобранных домах, и в каждой семье кто-то будет проинтервьюирован для опросного листа. Предположим, что имеется 500 кварталов и из них случайным образом отобрано 25. В этих 25 кварталах идентифицированы 4000 семей. Связь будет установлена с четвертью этих семей, потому что требуется выборка из 1000 индивидов. Эти 1000 семей будут отобраны случайным или систематическим образом.
Пример гнездовой выборки.Исследование Т. Б. Бердниковой и МАЛямина «Социальные последствия трансформации собственности»22, проведенное в 1999 г., охватывало 500 респондентов в Белгородском, Губкинском, Корочанском и Ровеньском районах Белгородской области. Отбор респондентов осуществлялся методом гнездовой двухступенчатой выборки. В качестве гнезд (клас-
теров) или групп выделялись районы Белгородской области. На первом этапе проведен отбор гнезд в соответствии с требованиями минимальных различий между ними и максимальной неоднородности составляющих их единиц. В рамках самих гнезд отбор респондентов осуществлялся по методу многоступенчатой квотной выборки, репрезентативной по отношению к социально-демографической структуре работников предприятий различных форм собственности. Квотными признаками выступали: пол, возраст, место проживания. Опрос руководителей проводился по той же методике, но квотными признаками выборки в данном случае были: пол, возраст, образование, стаж работы. Отбор респондентов для экспертного опроса проводился по методу случайной выборки по следующим критериям: род деятельности, наличие специального опыта, участие в приватизации и акционировании.
Пример кластерной выборки.В исследовании, проведенном B.C. Журавлевым23 в 1999 г. в школах и училищах Екатеринбурга была использована многоступенчатая выборка с применением на первой ступени кластерной выборки. Были отобраны учебные заведения Екатеринбурга, находящиеся в «опасных» районах в непосредственной близости от вокзалов, парков и лесопарков и т.д. Опрашивались учащиеся профессионального училища, школ и гимназии города. Внутри кластеров отбор стратифицировался. В каждом кластере опрашивалось по 100 респондентов. Генеральная совокупность насчитывает 80 тыс. человек. Объем выборочной совокупности составил 500 человек, что достаточно для получения репрезентативных данных, учитывая однородность генеральной совокупности и небольшой вариационный размах.
2.5. Методы невероятностной (неслучайной) выборки
Неслучайная (невероятностная) выборка — это способ отбора единиц, при котором мы не можем заранее рассчитать вероятность попадания каждого элемента в состав выборочной совокупности, что, разумеется, не дает возможности рассчитать, насколько правильна (репрезентативна) выборка. По этой причине предпочтение обычно отдается вероятностной выборке, хотя иногда по условиям исследования оказывается единственно возможным провести неслучайную выборку.
Таким образом, можно заранее сказать, что по содержательным критериям невероятностная (она же целевая и целенаправленная) выборка не хуже вероятностной, а может быть, и лучше. Ее недостатки: невозможность установить степень репрезентативности и более высокая стоимость (с точки зрения затрат она обычно превосходит вероятностную на несколько порядков). Но есть и преимущества — более глубокое, качественное и всестороннее раскрытие предмета по сравнению с вероятностной.
Известны следующие разновидности неслучайной выборки: квотная выборка, метод снежного кома, метод основного массива, метод стихийного отбора.
Несомненно, принцип отбора единиц в неслучайной выборке отличается от традиционного. Рассмотрим, чем именно.
Как и для вероятностного способа отбора, основная цель неслучайного отбора состоит в получении совокупности, репрезентирующей изучаемый объект. Однако в отличие от вероятностной выборки статистические выводы обо всем множестве объектов в этом случае делать не совсем правомерно. Эти выводы могут с большей или меньшей степенью вероятности распространяться лишь на генеральную совокупность (которая не всегда совпадает с объектом исследования).
Выделяют два основных вида неслучайного отбора:
♦ направленный отбор (другие названия — целенаправленный, целевой, выбор по усмотрению);
♦ стихийный.
Направленный отбор характеризуется выбором единиц по какому-либо заранее определенному принципу. Наиболее распространенными формами направленного отбора считаются: выбор типичных объектов (методов типичных представителей), метод «снежного кома» и выбор квотами.
Метод типичных представителей часто оказывается удобным на высших ступенях отбора, когда необходимо ограничиться небольшим количеством объектов. Отбор типичных объектов может в достаточной мере обеспечить репрезентативность полученных данных только в том случае, если приняты меры по обоснованию выбора объектов. Для этого необходимо иметь дополнительную информацию по ряду признаков, которые могут рассматриваться в качестве контрольных.
Метод «снежного кома» (snowball sampling) — разновидность целенаправленного выбора, при котором предполагается, что отбор дополнительных (последующих) респондентов производится после ссылки на них первоначально отобранных. Такая процедура используется при изучении особенных, редких, неслучайных совокупностей.
Этот метод обычно применяется для отбора экспертов и редко встречающихся групп респондентов (так называемых редких элементов) — например потребителей, обладающих очень высокими доходами, или представителей элитных групп. По сути, это техника поиска и отбора респондентов с определенным сочетанием свойств в таких условиях, когда трудно очертить границы генеральной совокупности. Особенность метода состоит в том, что, за исключением первого шага, выбор каждого очередного респондента совершается по указанию респондентов, включенных в выборку на предыдущем шаге. Каждый респондент указывает интервьюеру, где можно найти интересующих его людей (и даже сам связывается с ними и рекомендует интервьюера), и выборка скаждым шагом разрастается, подобно снежному кому.
Метод стихийного отбора только внешне похож на случайный отбор, поскольку социолог, приблизительно зная, кого ему надо опросить, идет на улицу или останавливается у станции метро, опрашивая всех, кого удастся или кто похож на представителей генеральной совокупности, например людей в возрасте от 30 до 40 лет. Никаких математических процедур при составлении выборки здесь не применяется, и соблюсти контроль за обеспечением репрезентативности невозможно. Чаще всего фиксируется мнение тех, кто имеет возможность и желание поговорить с интервьюером. Стихийный отбор может принимать иную форму, когда не социолог подходит к первому встречному на улице, а первый встречный звонит на телевидение, откликаясь на обращение принять участие в так называемом интерактивном опросе, ставшем особенно модным у нас с конца 1990-х гг.
Стихийные выборки формируются произвольно и часто независимо от самого исследователя. Примерами стихийного отбора могут служить опросы с помощью средств массовой информации, выборка «первого встречного», опросы покупателей в залах супермаркетов, пассажиров на остановках и в общественном транспорте
и т.д. Одна из особенностей стихийной выборки состоит в том, что мы зачастую не можем заранее предсказать ее размеров (как, например, при опросах с помощью СМИ — достаточно вспомнить опросы интерактивного телевидения). Главный недостаток стихийных выборок состоит в том, что для них часто невозможно уточнить, какую генеральную совокупность они представляют.
К стихийному отбору тесно примыкает метод основного массива. Метод основного массива представляет опрос 60—70% генеральной совокупности. Процедура его крайне проста: из жителей данного района или работников предприятия опрашивается простое большинство. В результате средние генеральной и выборочной совокупностей сближаются, а выборочная совокупность составляет преимущественную часть генеральной и перекрывает возможное смещение. К подобному методу в прошлом часто прибегали заводские социологи, не искушенные в математических процедурах составления сложной выборки, зато располагающие материальными и временными ресурсами для опросов.
Кроме того, к невероятностным методам отбора относятся также:
♦ отбор на основе принципа удобства;
♦ отбор на основе суждений.
Смысл метода отбора на основе принципа удобства заключается в том, что формирование выборки осуществляется самым удобным с позиций исследователя образом, например с позиций минимальных затрат времени и усилий, с позиции доступности респондентов. Формирование выборки на основе суждений основано на использовании мнений квалифицированных специалистов, экспертов относительно состава выборки. На основе такого подхода часто формируется состав фокус-группы.
Квотная выборка
Квотная выборка — микромодель объекта социологического исследования, формируемая на основе статистических сведений (параметров квот) преимущественно о социально-демографических характеристиках элементов генеральной совокупности. Нужные данные обычно берут из статистических справочников.
Квотный метод выборки предполагает предварительное наличие статистических сведений по ряду существенных либо коррелирующих с ними характеристик генеральной совокупности. Однако эти сведения не используются для определения объема выборки, так как в последующем отбор респондентов осуществляется не случайно, а целенаправленно, при помощи интервьюеров.
Принцип квотной выборки, или же принцип отбора единиц наблюдения по методу квот, восходит к представлению о подобии объектов в случае пропорциональности их структурных элементов. Этот метод основан на целенаправленном формировании структуры выборочной совокупности. Анкетер получает задание опросить некоторое количество лиц определенного возраста, пола, образования и профессии. Удельный вес квоты в выборочной совокупности должен соответствовать ее удельному весу в генеральной совокупности.
Обычно квотная выборка используется на последних ступенях отбора и завершает процесс районирования (стратифицирования) и применения вероятностных процедур. Социолог разыскивает респондента определенного пола, статуса и возраста в заданном районе и беседует с ним.
Приведем пример расчетавыборки по таким параметрам квоты, как пол и возраст, в реальном социологическом исследовании. Обосновывая репрезентативность выборки при опросе избирателей в ходе избирательной кампании по выборам депутатов Городской думы Нижнего Новгорода, мы опирались на данные Облком-стата о половозрастной структуре населения районов города. Так, половозрастная структура населения Советского района выглядела следующим образом (табл. 2.2):
Половозрастная структура населения Советского района
Таблица 2.2
Всего | Мужчины | Женщины | Мужчины, % | Женщины, % | |
Все население | 45,1 | 54,9 | |||
В том числе по возрастам: | |||||
до 1 года | 51,4 | 48,6 | |||
1 —6 лет | 51,1 | 48,9 | |||
7 —9 лет | 50,6 | 49,4 | |||
10-15лет | 51,0 | 49,0 | |||
16-19лет | 49,8 | 50,2 | |||
20 — 24 года | 50,3 | 49,7 | |||
25-29 лет | 55,0 | 45,0 | |||
30 — 34 года | 48,5 | 51,5 | |||
35 —39 лет | 47,3 | 52,7 | |||
40 — 44 года | 46,8 | 53,2 | |||
45 —49 лет | 45,7 | 54,3 | |||
50 — 54 года | 44,3 | 55,7 | |||
55-59 лет | 42,0 | 58,0 | |||
60 —69 лет | 39,0 | 61,0 | |||
70 лет и старше | 20,8 | 79,2 |
Учитывая, что в состав выборки должны были войти избиратели, т.е. лица в возрасте не моложе 18 лет, мы взяли в качестве основы выборки ту часть таблицы, где представлено половозрастное распределение населения от 20 лет (разделить предыдущую строку, выделив из нее лиц 18—19 лет, не представлялось возможным). В итоге распределение половозрастной структуры выборки по числу респондентов в каждой из 20 выбранных половозрастных групп (две по полу и 10 по возрасту) выглядело следующим образом (табл. 2.3):
Таблица 2.3
Половозрастная структура выборочной совокупности
Генеральная совокупность | Выборочная совокупность | ||||||||
число | доля(в%) | число | |||||||
Всего | муж. | жен. | муж. | жен. | всего | муж. | жен. | всего | |
Основавыборки | 43,4 | 56,6 | 100,00 | ||||||
Возраст (лет) | |||||||||
20-24 | 50,3 | 49,7 | 9,30 | ||||||
25-29 | 55,0 | 45,0 | 9,22 | ||||||
30-34 | 12 093 | 48,5 | 51,5 | 9,41 | |||||
35-39 | 47,3 | 52,7 | 11,17 | ||||||
40-44 | 46,8 | 53,2 | 10,98 | ||||||
45-49 | 45,7 | 54,3 | 9,94 | ||||||
50-54 | 44,3 | 55,7 | 5,66 | ||||||
55-59 | 42,0 | 58,0 | 9,32 | ||||||
60-69 | 17 503 | 10 675 | 39,0 | 61,0 | 13,62 | ||||
70 и старше | 20,8 | 79,2 | 11,38 |
Численность каждой из половозрастных групп в трех последних столбцах таблицы пропорциональна24 численности каждой из соответствующих групп в генеральной совокупности.
Степень репрезентативности квотной выборки повышается прямо пропорционально степени устойчивости значений тех характеристик, по которым задаются квоты, поэтому признаки, изменяющие свои значения слишком быстро, здесь стараются не применять. Иногда у исследователей возникает соблазн увеличить число контролируемых квотных параметров в надежде, что это повысит степень достоверности получаемых результатов. Однако на практике это ведет к нарастанию систематической ошибки и затрудняет работу интервьюера.
Квотная выборка — почти обязательный момент в проведении научного эксперимента, если он практикуется в социальных на-
уках. Что касается опросов общественного мнения, здесь квотная выборка применяется наряду с вероятностными выборками, по-рой для взаимного контроля представительности результатов оп-роса. Метод квот удобен также для построения выборки в случае небольшой генеральной совокупности либо в случае сильной «скошенности» распределения в ней элементов наблюдения.
Пример квотной выборки. В проведенном Е.Л. Могильчак в 2000 г. ис-следовании экономических диспозиций студентов 1-4-го курса экономичес-кого факультета Уральского государственного университета и финансового факультета Уральского государственного экономического университета по Екатеринбурга объем квотной выборки составил 380 человек (по 190 сту-дентов от каждого вуза), критериями выступили три признака: пол, курс, успеваемость. Выборка формировалась на каждом факультете в отдельно-сти, ошибка по квотным признакам не превышала 3%. Респондентам пред-лагалось выразить свое согласие с каждым из десяти суждений, отражаю-щих отношение к собственности по пятичленной шкале, включающей значения от «полностью согласен» до «совершенно не согласен» Дифференциация осуществлялась на основании следующих критериев: ха-рактер санкций, характер объекта собственности, характер субъекта соб-ственности, характер прав собственника25.
Квотная выборка у прикладных социологов вошла сегодня в моду, но не от хорошей жизни. По научным критериям она ни-когда не выровняется с классической выборкой, т.е. случайной! которая считается эталоном. Точность результатов по квотном выборке определить нельзя.
Правда, на практике случайный отбор встречается редко, ибо для него обязательно нужен список единиц генеральной совокуп-ности. Если его нет или есть, но такого качества, что для науч-ных целей его лучше не использовать, то и говорить о случайной выборке нельзя.
Многоступенчатая выборка
Отметим, что в реальной практике чаще всего применяется многоступенчатая выборка, построенная с применением проя цедуры поэтапного отбора объектов опроса. При этом совокупч ность объектов, отобранных на предыдущем этапе (ступени)
становится исходной для отбора на следующем. Соответственно различают единицы отбора первой ступени (первичные единицы), единицы отбора второй ступени (вторичные единицы) и т.д. Объекты самой нижней ступени, с которых ведется непосредственный сбор информации, называются единицами наблюдения.
Приведем пример многоступенчатой выборки, которую мы рассчитывали в ходе одного из маркетинговых омнибусных26 исследований, проводившихся при нашем участии в ряде крупных регионов России в 1995 г. одним из столичных маркетинговых центров. Для Нижнего Новгорода объем выборки был задан в 900 человек. В качестве единиц отбора первой ступени были определены три городских района из восьми с объемом выборки 300 респондентов по каждому. Здесь, как и на следующей ступени, был использован метод типичных представителей. Определив среднюю численность населения одного района, мы остановили свой выбор на трех районах — Канавинском, Советском и Нижегородском, численность населения которых в наименьшей степени отклонялась от этого среднего значения. За основу выборки на второй ступени были взяты списки избирателей (большинство из которых выступают самостоятельными экономическими агентами рынка в качестве покупателей). Здесь в качестве единиц отбора второй ступени были определены по три избирательных участка. Также были рассчитаны средние размеры каждого из участков и отобраны те из них, где численность избирателей в наименьшей степени отклонялась от средней. На третьей ступени за основу выборки принимался список избирателей каждого участка. Было определено, что на каждом участке предстоит опросить по 100 человек (я(.= 100). На этом последнем этапе для окончательного отбора единиц наблюдения применялся метод систематической выборки. Определив шаг выборки, мы получили списки респондентов с домашними адресами. Поскольку во всех районах имелись электронные версии списков избирателей, вся процедура заняла менее одного дня.
Отметим, что и в приведенном выше примере опроса избирателей в ходе избирательной кампании фактически использо-
валась многоступенчатая выборка. На первой ступени была произведена квотная выборка по параметрам пола и возраста, а на втором рассчитана территориальная квота — по параметрам численности каждого избирательного округа. Затем была опять просчитана половозрастная квота для каждой из первичных единиц отбора (округов). Кроме того, была задана половозрастная квота для каждого из тридцати анкетеров по отдельным
участкам опроса.
К многоступенчатому отбору прибегают в тех случаях, когда генеральная совокупность имеет настолько большой объем, что простой случайный или систематический отбор элементов привел бы к чрезмерному распылению выборки по всей территории. Попросту говоря, такой метод применяют в тех случаях, когда изучают достаточно большие группы людей или крупные общности, скажем регион или город.
В многоступенчатой выборке каждая единица отбора представляет собой гнездо единиц более низкого уровня, поэтому многоступенчатый отбор позволяет локализовать выборку в меньшем числе точек. Большой массив социолог начинает последователь-но сужать, проходя множество ступеней, доводя большую сово-купность до такой малой величины, что ее можно охватить одним взглядом, а если это территория, то обойти ногами. Город делит-ся на районы, те — на кварталы, затем выделяют избирательные участки, а в них отбирают домохозяйства.
Многоступенчатая выборка поначалу напоминает огромную воронку, поскольку широкое горлышко (огромную совокупность респондентов или объектов) через ряд процедур сводят к узкой горловине, с которой социолог в конечном итоге и имеет дело.
Однако то, что облегчает его жизнь на этапе составления вы-борки, сильно затрудняет его существование на конечной фазе, когда он подсчитывает величину ошибки и думает, на какую ге-неральную совокупность он может распространить свои выводы
При этом не стоит забывать: чем больше ступеней в многоступенчатом oт боре, тем больше ошибка выборки. В любом случае при многоступенчатом отборе ошибка всегда больше, чем при простом случайном. И еще: на каж-дой ступени все равно применяется случайный отбор.
Такая вот странная диалектика у нас получается: число оши-бок на каждой ступеньке возрастает, они накапливаются с каж-дым шагом и разрастаются к концу исследования до неуправляе-мых размеров. Вместо обратной пирамиды, т.е. воронки, мы по-лучили теперь прямую пирамиду (рис. 2.4).
Специалисты об этом явлении говорят так: на каждой ступени процессу независимого извлечения выборки сопутствует своя выборочная ошибка. Отдельные ошибки складываются в общую ошибку многоступенчатой выборки. Таким образом, увеличение количества ступеней, с одной стороны, приводит к сокращению базовых точек опроса и, следовательно, к экономии людских и материальных ресурсов, с другой — к уменьшению точности выборочных оценок27.
2.7. Идеальные и реальные совокупности
Обследуемый объект — выборочная совокупность — представляет собой явление, таящее в себе массу противоречий и подводных камней. Социологу следует помнить, что этот объект не существует в реальности — он сконструирован процедурой