Идеальные и реальные совокупности
Обследуемый объект — выборочная совокупность — представляет собой явление, таящее в себе массу противоречий и подводных камней. Социологу следует помнить, что этот объект не существует в реальности — он сконструирован процедурой операционализации переменных, методикой выборки респондентов, условиями наблюдения, проведения интервью или эксперимента.
«Действительно, выборочная совокупность, с которой непосредственно "снимаются" данные, порождается процедурой, но в то же время она растворена в большой совокупности, которую представляет или репрезентирует с разной степенью точности и надежности. Социологические заключения относятся не к обследованным на прошлой неделе респондентам, а к идеализированным объектам: "старшим поколениям", "молодежи" и т.д.»22
В идеале представляется, что из генеральной совокупности делается правильная выборка и опрашиваются только те, кто в нее попал. Однако подобная идеальная ситуация происходит далеко не всегда. Социолог правильно определил генеральную совокупность, сделал правильную выборку, но при обходе домов и опросе респондентов возникли непредвиденные сложности и часть из них или выпала, или была заменена на других. В результате те, кто попал в выборку, и те, кто был реально опрошен, представляют разные совокупности людей. В итоге вместо одного объекта исследования мы получили целых два.
Предположим, что социолог интересуется мнением россиян накануне президентских выборов. Что входит в понятие «россияне»? Объем понятия «россияне» охватывает, по всей видимости, всех, кто является гражданином России и имеет право участвовать в президентских выборах. Назовем всех мыс-
22 Батыгин Г.С. Лекции по методологии социологических исследований: Учеб. для высших учебных заведений. М., 1995. С. 146-147.
лимых россиян, соответствующих данному свойству, идеально планируемой генеральной совокупностью. Но на практике обследовать всех, кто охвачен теоретически сконструированным понятием «россияне», невозможно. «Среди россиян немало людей находится в тюрьмах, исправительно-трудовых учреждениях, в следственных изоляторах и иных труднодоступных для интервьюера местах. Эту группу придется "вычесть" из проектируемого объекта. "Вычесть" придется и многих пациентов психиатрических больниц, детей, часть престарелых. Вряд ли гражданскому социологу удастся обеспечить нормальные шансы на попадание в выборку и военнослужащим. Аналогичные проблемы сопровождают обследование читателей, избирателей, жителей малых городов, посетителей театров... Помимо заключенных, военнослужащих и больных, меньшую вероятность попасть в выборку имеют жители удаленных от транспортных коммуникаций сел, особенно если обследование производится осенью; те, кого, как правило, нет дома, не склонны к разговорам с посторонними людьми и т.п. Бывает, что интервьюеры, пользуясь отсутствием контроля, пренебрегают точным исполнением своих обязанностей и опрашивают не тех, кого положено опрашивать по инструкции, а тех, кого легче "достать"23.
Исключив из идеальной генеральной совокупности все труднодоступные единицы наблюдения, мы получим более узкое понятие —реально получившуюся генеральную совокупность. В методологической литературе первая получила также название концептуального объекта, а вторая — проектируемого.
Врезка
Исследование читательской аудитории «Правды» *
Проведенное в середине 1960-х гг., это исследование (рук. В.Э. Шляпентох) было по-своему уникальным. Здесь впервые в отечественной практике разработана общенациональная территориальная вероятностная выборка. Она основывалась на данных Всесоюзной переписи 1970 г. и планировалась как шестиступенча-тая. На первой ступени единицами отбора служили области, края и республики. Это был вынужденный выбор, ибо единицы имели разный размер по территории и по числу жителей, что само по себе нарушало принцип равных шан-
Подробнее см.: Мансуров В., Петренко Е. Изучение общественного мнения традиции // Социология в России / Под ред. В.А. Ядова. 2-е изд., перераб. и дополн. М.: Издательство Института социологии РАН, 1998. С. 577.
сов попадания в выборку жителей разномасштабных областей. Однако в те годы в распоряжении социологов не было статистической информации о более мелких административных единицах.
Территория некоторых областей была недоступна для проведения опроса. Сюда были отнесены труднодоступные и малонаселенные сибирские и дальневосточные районы (здесь проживало около 10% населения СССР) и режимные зоны (8,5% населения). В выборку они не попали. Две специальные «саморепрезентирующие» страты были выделены для населения Москвы (303 интервью) и Ленинграда (179). Остальные области сгруппированы по уровню социально-экономического развития и в зависимости от их географического положения в 47 страт, которые включали от 1 до 12 областей. Страты были неравными по численности населения. Самая малая содержала 1%, а самая крупная — 21% населения страны. Из их числа были отобраны 20 страт с помощью специаль-
Ьатыгин Г.С. Лекции по методологии социологических исследований. 1995. С. 147-148.
G65
Концептуальный объект — идеальный конструкт, обозначающий рамки темы исследования. Проектируемый объект — совокупность доступных исследователю единиц.
Итак, взвесив свои возможности и поняв, что всех, кто идеально подходит для нашей генеральной совокупности, мы опросить по разным обстоятельствам не сможем, мы получаем в итоге новую генеральную совокупность, из которой и должны исходить, проектируя свою выборку. Они могут различаться совсем незначительно (если труднодоступных единиц наблюдения мало) или очень значительно (если таковых много).
Поскольку два объекта расходятся, то следует заново переопределить генеральную совокупность. Старое определение: генеральная совокупность — это та совокупность, из которой предполагается производить выборку единиц. Новое определение: генеральная совокупность — это та совокупность, из которой производится выборка единиц. Чем они различаются? Старое определение не учитывает труднодоступность и возможные на практике ограничения, но указывает на теоретически возможный объем понятия, скажем «россияне». В теоретически сконструированной генеральной совокупности, согласно официальной статистике, например, 49% мужчин и 51% женщин. Но когда социолог отбросил все труднодоступные единицы наблюдения и дал новое определение, приближенное к реальности обследования, у него получилось, к примеру, 43 % мужчин и 57% женщин (уменьшение количества мужчин могло произойти за счет того, что, скажем, опросить военных и заключенных накануне президентских выборов практически невозможно или нереально).
Из какой генеральной совокупности — теоретически мыслимой или реально существующей — должен исходить социолог? Видимо, из второй. А с какой генеральной совокупностью он должен сравнивать выборочную после полево-
ггмлгсттрттгжяниа w х/гтяыяппипяти \лрг\\! гтгппыриыа т р пттпрттрпат^прттги^рытя-
Выборка домохозяйств. |
ной процедуры контролируемого отбора с вероятностью, пропорциональной размеру страты. В свою очередь, внутри каждой случайным отбором выделялось по одной области, которые получали количество интервью, пропорциональное объему страты. На второй ступени отбирались районы областных центров, города областного подчинения и административные районы областей, вошедшие в выборку путем систематического отбора. На третьей ступени — городские и сельские населенные пункты внутри них. На четвертой — в городских населенных пунктах отбирались территории, обслуживаемые ЖЭКами. На пятой ступени, по документации этих контор, выбирались семьи квартиросъемщиков. На шестой, завершающей, в отобранных семьях по процедуре «household-sampling»" Киша определялись респонденты для проведения интервью.
В этом исследовании тщательно регистрировались все действия интервьюера по отбору рес-
пондентов на последней ступени*". С первого посещения удалось войти в контакт только с 77% респондентов. Больше всего интервью с первого посещения проводилось по субботам — 83%. Для повторных интервью самым удачным оказывался вторник (59%). По времени суток наибольшее число удачных интервью пришлось на вечернее время — от 20 до 22 часов.
*" Петренко Е.С., ЯрошенкоТ.М. Социально-демографические показатели в социологических исследованиях. М.: Статистика, 1979.
тивность? Обязательно со второй. Но часто об этом забывают и сравнение происходит с первой совокупностью, хотя выборка производилась из второй.
Однако трудности встречаются, как мы уже выяснили, не только на пути конструирования генеральной совокупности. Не меньше, если не больше, их и на пути конструирования, а затем и обследования выборочной совокупности. Выше они были сгруппированы в два типа ошибок выборки — случайные и систематические. Для неопытного полевого социолога они могут стать мощнейшим фактором возмущения и причиной серьезных погрешностей.
В результате наложения двух типов ошибок происходит не меньшее, если не большее, чем в случае с генеральной совокупностью, отклонение идеально запроектированной выборки от реально получившейся. Отклонение реальной выборки от проектируемой можно наглядно изобразить на схеме.
На рис. 13 сплошной линией обозначена связь двух реальных выборок: А'=>В; она символизирует то, что получилось в эмпирическом исследовании в действительности. Хотя, конечно же, социологу мечталось о другом. В идеале он желал бы получить связь А=>В', т.е. чтобы из идеально сконструированной и максимально широкой генеральной совокупности у него получилась максимально полная и репрезентативная выборка. Но позже, когда он осознал невозможность получения идеальной генсовокупности, он устремился ко второму варианту — получить связь А'=>В', т.е. из ограниченной генсовокупности получить максимально полную выборку. На самом же деле, преодолев многочисленные трудности и наделав множество ошибок (случайных и систематических), социолог получил самый худший вариант, а именно А'=>В.
Рис. 13. Расхождение между идеальной и реальной моделями в двух совокупностях -
генеральной и выборочной
Для сокращения разрыва между идеальной (проектируемой) и реальной (получившейся) выборками, приведения в соответствие замысла и действительности социологи разработали множество довольно эффективных приемов: контроль выборки (увеличение удельного веса недостающих групп и уменьшение из-
быточных), ремонт выборки (замена труднодоступных респондентов аналогичными по задаваемым признакам индивидами), контроль заполнения вопросников и др. С их помощью реальный массив подгоняется под проектируемый.
РАСЧЕТ ОБЪЕМА ВЫБОРКИ24
Из всех вопросов, которые задают сотрудникам знаменитого Института опросов общественного мнения Гэллапа, самым популярным является такой: как вы можете, проинтервьюировав 1000 человек, судить о том, что думают 250 млн американцев?
Для ответа на этот вопрос нужно упомянуть не только высокую квалификацию и огромный практический опыт сотрудников, но и использование ими статистики и математики. Если методы опроса не основаны на науке, результаты могут ввести вас в заблуждение.
В статистике приняты следующие разграничения объемов выборки. Объем выборки, достаточный для взаимопогашения случайностей и получения статистических характеристик закономерного характера, равен 30. Выборка такого объема называется малой. Характер распределения значений признака в малых
выборках приближается к нормальному с ростом числа испытаний. Минимальный объем выборки, позволяющий получить средние значения признака с указанием доверительных вероятностей, равен 5. Выборки такого объема называются сверхмалыми. Распределение значений признака в таких выборках характеризуется распределением Стьюдента. Но чаще всего в социологии имеют дело с гораздо большим объемом выборки.
При планировании выборочного обследования наступает момент, когда нужно решить, сколько человек опрашивать, т.е. каким должен быть объем выборки. Это решение чрезвычайно важно, поскольку слишком большая выборка потребует излишних затрат, а слишком маленькая понизит качество результатов.
Поскольку выборочная совокупность — это часть генеральной совокупности, отобранная с помощью специальных методов, — важно, чтобы эта часть не искажала представления о целом, т.е. репрезентировала его. Социологов, часто проводящих эмпирические исследования, постоянно волнует вопрос о том, как много надо опрашивать человек, чтобы получить достоверную информацию? Институт Гэллапа в США проводит регулярные опросы по национальной выборке объемом в 1,5 тыс. человек и достигает поразительной точности (ошибка выборки составляет от 1 до 1,5%). Центр «Социо-Экспресс» Института социологии РАН проводит исследования на выборке объемом в 2 тыс. человек, при этом ошибка выборки не превышает 3%25.
Специалисты считают, что наилучшая выборка — не обязательно большая. Конечно, чем больше объем выборки, тем выше точность ее результатов. Однако даже огромная выборка не гарантирует успеха, если генеральная
24 Материал излагается по источнику: Методическое пособие социолога-практика (Словарь-справочник) / Под ред. Д.А. Шевченко, А.И. Кравченко. М., 1990.
25 Gallup G. The Gallup poll: Public opinion 1978. Wilmington, Delaware: Scholarly Resources, 1979. PXLIV; Зеркало мнений: Результаты социологического опроса населения России. М., 1993. С. 3—4.
Б68
совокупность«плохо перемешана», т.е. является неоднородной. Однородно1 считается такая совокупность, в которой контролируемый признак распре делен равномерно, не образует пустот или сгущений. В этом случае, опро сивнескольких человек, можно получить точную информацию о распреде ленииэтого признака в генеральной совокупности.
Таким образом, на репрезентативность данных влияют не количественные характеристики выборочной совокупности (ее объем), а качественные характеристики генеральной совокупности — степень ее однородности.
В социологии еще не придумано единой и четкой формулы, использу$ которую можно рассчитать оптимальный объем выборочной совокупности, -такой формулы просто не существует в природе. И объясняется это весьм; просто. Дело в том, что определение объема выборочной совокупности -проблема не столько статистическая, сколько содержательная. Иными словами, объем выборочной совокупности зависит от множества факторов, в ton числе от целей и задач, теоретической модели, гипотез и методов исследования, степени однородности генеральной совокупности, наконец, требующейся точности получаемой информации.
Практика показывает, что для многих социологов обоснование объема выборкг является камнем преткновения, несмотря на значительное количество литературы, посвященной выборочным методам и, в частности, расчету объема выборки Причин несколько: 1) дефицит специальной литературы на периферии; 2) нехват ка времени для самообразования; 3) неумение пользоваться математическим аппаратом. В связи с этим возникает необходимость без сложных математически) формул изложить стратегию и тактику обоснования объема выборки.
Процедура расчета объема выборки — цепь бесконечных компромисса между стремлением к точности и ограниченностью ресурсов, дефицитен времени и неполнотой сведений об изучаемом явлении. Вместе с тем эте наука и искусство, познание которых доступно каждому человеку. Однакс для этого нужно знать стратегии расчета объема выборки (предварительного расчета, последовательной и комбинированной стратегии), а также факторы, влияющие на объем выборки (объем генеральной совокупности, варьирование ответов респондентов, точность оценивания, характер предполагаемого распределения ответов, метод исследования, процедура обработки)
Стратегия предварительного расчетасостоит в том, что объем выборк* определяется до проведения основного исследования. Для расчета объем; случайной выборки надо знать желаемую точность оценивания, величию риска получаемого ответа и степень изменчивости ответа. Традиционно точность оценивания принимают за 5%, а величину риска — за 0,95. Иными словами , если по данным выборочного исследования 60% опрошенных удовлет ворены работой, то можно утверждать, что в генеральной совокупности дол5 удовлетворенных составит от 55 до 65% в 95% случаев, а в 5% случаев така5 доля может выйти за этот интервал. Если исходить из 5%-ной точности и величины риска в 0,95, объем выборки будет следующим (табл. 3).
Таблица ; Зависимость объема выборки от объема генеральной совокупности
Результаты, приведенные в табл. 3, свидетельствуют против распространенного заблуждения, будто бы объем выборки — жестко фиксированный процент от генеральной совокупности, равный 10. На самом же деле эта величина — не постоянная, а переменная, изменяющаяся в конкретных условиях. Объем выборки зависит также от того, какие вопросы используются в анкете. Цифры в табл. 3 действительны только для одного случая — когда речь идет о дихотомическом вопросе, у которого максимальный разброс ответов — 50 на 50%. Не имея предварительной информации о разбросе оценок, социолог как бы заранее страхуется и считает, что этот разброс составит 50 на 50%. Если же такая информация имеется, то объем выборки будет следующим.
Таблица 4 Зависимость объема выборки от распределения дихотомического ответа
Распределение ответов, % | |||||
Объем выборки |
В табл. 4 показано распределение ответов на качественные вопросы. Расчет объема выборки для количественных вопросов, включающих вопросы типа «возраст» и «заработная плата», строится исходя из коэффициента вариации (табл. 5), который показывает, какой процент составляет среднее квадратическое отклонение от средней арифметической, и позволяет сравнивать между собой (по степени варьирования) любые признаки.
Таблица 5 Зависимость объема выборки от коэффициента вариации
Коэффициентвариации,% | ||||||||||||
Объем выборки |
Если изучаются условия труда, взаимоотношения в коллективе, заработная плата и т.д. с помощью пятичленной шкалы, то коэффициент вариации изменяется здесь от 27 до 62%, а при использовании семичленной — от 78 до 113%. Стало быть, чем длиннее шкала, тем выше коэффициент вариации и больше должен быть объем выборки. Если социолог хочет обойтись небольшой выборкой, то и вопросы должен формулировать проще. Иногда думают, что чем длиннее шкала, тем точнее измерение. Но преимущества семибалльных шкал над пятибалльными не доказаны.
Среди социологов распространено мнение, согласно которому чем больше объем выборки, тем точнее результат, и это заставляет их непомерно увеличивать количество опрошенных. В реальности дело обстоит иначе: табл. 6, составленная по данным Института Гэллапа, показывает зависимость между объемом выборки и точностью оценивания в процентах. Из нее следует, что с увеличением объема выборки точность возрастает, но до определенного порога. Уже при 600 опрошенных достигается желанный для всех 5%-ный уровень точности. Стало быть, 600 человек — приемлемый объем выборки.
При расчете объема выборки социологи часто совершают такую ошибку: рассчитав по существующим формулам необходимый объем выборки в целом для совокупности, в дальнейшем пропорционально размещают его по
G70
отдельным подразделениям выборки, например по цехам, предприятиям, районам, городам, типам семей. После чего на этапе обработки данных — анализируют уже сами различия между подразделениями. Однако правильнее вычислить объем выборки отдельно для каждого подразделения, а затем суммировать отдельные объемы. Допустим, расчеты объема выборки по трем цехам (с учетом размерности шкалы, численности работающих, характера предполагаемого распределения оценок) позволили установить, что в первом цехе необходимо спросить 384 человека, во втором — 222, а в третьем -600. Тогда общий объем выборки составит 384+222+600=1206 человек.
Таблица t Зависимость между объемом выборки и точностью оценивания
Количество интервью | Точность оценивания, % |
— юо | ±11 |
" 200 | +8 |
±6 | |
±5 | |
±4 | |
±4 | |
+3 | |
±2 |
При расчете квотной выборки социологи часто произвольно определяют ее объем в 1000 человек, исходя из удобства вычисления квот. Но с таким же успехом можно взять любое другое круглое число. Более обоснованным являете; подход, при котором объем квотной выборки рассчитывается как для случайной. Другим вариантом расчета объема квотной выборки является использование теории малых выборок. Ее суть: если не ставится цель дать дифференцированный анализ по группам работников, то умножают количество градаций вопросов, подлежащих изучению, на 25 (минимальный статистический значимые размер группы). Например, изучают три переменные: пол —две категории, воз раст — две категории (до 30 лет и свыше 30 лет), удовлетворенность трудом -измеряется пятибалльной шкалой. Тогда необходимый объем выборки для данного примера составит 2x2x5x25=500 человек. Объем выборки увеличивается i 2,5 раза. Ясно, что с расширением числа переменных и числа градаций объе\ выборки может стать катастрофически большим. Выход только один: детальна) проработка исходной проблемы, которая позволит отбраковать лишние вопро сы в анкете, оставив самые важные. Если в исследовании проверяется несколь ко гипотез, то объем выборки для проверки каждой гипотезы вычисляется от дельно. Таким образом, при использовании выборки количество вопросов i анкете и гипотез должно быть минимальным.
Итак, мы рассчитали требуемый объем выборки. Теперь, и только тепер] необходимо проверить, совместима ли полученная величина с выделенном! ресурсами. Типичная ошибка многих социологов-прикладников состоит в том что при расчете объема выборки во главу угла ставятся наличные ресурсы W™ хуже того, социолог пассивно принимает все условия, диктуемые заказчиком Это в корне неверно по нескольким причинам. Во-первых, расчет объема вы борки позволяет глубже проникнуть в суть изучаемого предмета и специфик методов исследования, а значит, аргументированно требовать получения боль
G71
ших ресурсов или принять правильное решение о снижении объема выборки. Если администрация отказала в дополнительных ресурсах, а цели исследования не позволяют сократить объем выборки (т.е. социолог не может принять решение администрации), то надо переходить кдругой схеме исследования. Во-вторых, обоснованный расчет объема выборки показывает профессионализм социолога и заставляет заказчика относится к нему более уважительно.
Стратегия последовательного расчетаобъема выборки. При расчете объема выборки желательно знать разброс оценок и некоторые другие параметры. Однако они-то, как правило, неизвестны. Для того чтобы не допустить ошибки, лучше предположить, что они максимальны. Плата за наше незнание — разбухание объема выборки сверх необходимого и дополнительные финансовые и временные затраты (приходится опрашивать большее число людей). Для сохранения затрат применяется последовательная стратегия — объем выборки не рассчитывается заранее, а ставится в зависимость от конечных результатов исследования. Например, опрашивают 100 человек, затем устанавливают величину разброса оценок и уже в зависимости от этого рассчитывают необходимый объем выборки. Если оказывается, что 100 человек достаточно, то исследование заканчивается. В противном случае добирается необходимое количество респондентов, но не до бесконечности. Известен пример из практики Дж. Гэллапа, который в начале своей карьеры активно экспериментировал с объемами выборки. В 1936 г. американцам был задан вопрос: «Хотели бы вы возобновления закона о восстановлении национальной промышленности?» Выяснился странный парадокс: Дж. Гэллап вначале опросил 500 человек и замерил ошибку выборки, а затем последовательно наращивал число респондентов до 30 тыс. К своему сожалению, он обнаружил, что прибавление 29,5 тыс. опрошенных увеличило точность информации менее чем на 1 %. Следовательно, опрос можно было прекращать уже при 500 опрошенных. Этот пример показывает, что, применяя последовательную стратегию, можно добиваться значительного снижения необходимого числа наблюдений по сравнению с предварительным расчетом объема выборки.
Однако стратегия последовательного расчета объема выборки приносит желаемый результат лишь в том случае, если социолог может производить необходимые расчеты в ходе самого опроса, например телефонного, с применением компьютерных систем. Социолог вводит ответы респондента в свой персональный компьютер, с него результаты сразу поступают на компьютер руководителя исследования, обрабатываются, и на экране дисплея выдается информация не только об одномерных частотах, распределенных по тому или иному вопросу, но и о требуемом объеме выборки.
Если существует опасность, что объем выборки может оказаться катастрофически большим, надо совместить оба вида стратегии — предварительную и последовательную, т.е. применить комбинированную стратегию.Рассчитывая выборку по предварительной стратегии, получаем верхние допустимые значения для последовательной стратегии или, иначе говоря, ту величину объема выборки, при достижении которой прекращается опрос по последовательной стратегии.
Наиболее обоснованный и корректный подход к определению объема выборки основан на расчете доверительных интервалов, в основе которого лежит ряд базовых понятий математической статистики (вариация, среднее квадратиче-ское отклонение, доверительный интервал, средняя квадратическая ошибка).
Для расчета необходимого размера выборки в количественном исследовании чаще всего используют два статистических понятия — доверительный интервал и доверительную вероятность. Доверительный интервал представляет собой заранее задаваемую вами погрешность выборки. Например, если вы задаете доверительный интервал в 3% и конкретный ответ на конкретный вопрос исследования составит 48%, это значит, что даже при проведении опроса всей генеральной совокупности реальное значение попадет в интервал между 45 (48-3) и 51% (48+3). Доверительная вероятность показывает, насколько вы можете быть уверены в полученных результатах, в том, что характеристики выборки соответствуют характеристикам всей генеральной совокупности — иными словами, с какой вероятностью случайный ответ попадет в доверительный интервал. Обычно используют доверительную вероятность 95 и 99%. Чаще всего используется 95% — этого вполне достаточно в подавляющем большинстве исследований. Если объединить доверительную вероятность и доверительный интервал, то можно сказать, что ответы на вопрос с 95%-ной вероятностью попадут в интервал между 45 и 51%.
Повышенная надежность допускает ошибку выборки до 3%, обыкновенная — от 3 до 10% (доверительный интервал распределений на уровне 0,03— 0,1), приближенная — от 10 до 20%, ориентировочная — от 20 до 40%, а при-кидочная — более 40%26.
На основе этих понятий с учетом ряда предположений выводятся формулы расчета объема выборки, которые предполагают, что репрезентативность гарантируется путем использования корректных вероятностных процедур формирования выборки.
Врезка
Чтобы разобраться с выборками, надо прежде всего понять, что представляет собой изучаемое целое, или генеральная совокупность. А она меняется в зависимости от предмета изучения. Например, если вас интересует электоральное поведение, вы вряд ли станете интервьюировать детей в возрасте от двух до двенадцати. С другой стороны, если вы хотите понять восприятие субботних комиксов для детей, то взрослые старше восемнадцати лет вряд ли будут нужной группой. Поэтому первый шаг при проведении выборки — знать, пробой чего она является. В любом проекте, связанном с выборкой, ключевое решение — это ответ на вопрос: что является популяцией, или гене- |
III. Гауайзер, Э. Уитт Выборка — явление и процесс
С выборками знакомы все, мы используем их каждый день. Это не что иное, как часть чего-то большего, взятая для получения представления об этом большем. За шведским столом мы пробуем многие блюда, чтобы решить, какие из них взять целиком. Наш врач берет пробу крови, чтобы узнать о нашем состоянии. Электронная компания испытывает образцы своей продукции, чтобы гарантировать их качество. В каждом из этих случаев выбирается фрагмент какой-то большой группы. Все это выборки, и все они полезны.
Многим людям, правда, кажется, что выборка — это не совсем правильно и что гораздо лучше взять всю совокупность в целом. Конечно, бывают случаи, когда такой процесс под названием референдум или плебисцит, т.е. всеобщий опрос общественного мнения, является предпочтительным. Но ведь при визите к врачу вы не захотите, чтобы он взял для проверки всю вашу кровь, даже если это и заметно улучшит точность анализа.
Ядов В.А.Социологическое исследование: Методология. Программа. Методы. [Доп. и испр. изд.] Самара: Изд-во «Самарский ун-т», 1995. С. 70.
Б73
В ряде случаев в качестве главного аргумента при определении объема выборки используется стоимость проведения обследования. Так, в бюджете маркетинговых исследований предусматриваются затраты на проведение определенных обследований, которые нельзя превышать, и очевидно, что ценность получаемой информации не принимается при этом в расчет. Однако в ряде случаев и малая выборка может дать достаточно точные результаты.
Исследовательская практика подсказывает следующее правило: объем выборки должен обеспечивать не менее 100 наблюдений для каждой первостепенной и не менее 20—50 наблюдений для каждой второстепенной классификационной составляющей. Первостепенные классификационные составляющие соответствуют наиболее критичным, а второстепенные — наименее критичным ячейкам перекрестной классификации, принятой в данном исследовании27.Теоре-тические расчеты и практика доказывают, что для получения достоверных данных о мнении и предпочтениях населения такого крупного города, как Санкт-Петербург, достаточно опросить 700—800 человек. Однако большинство опросов населения здесь проходят на выборках объемом до 1,5 тыс. человек.