Тема 6. Обоснование системы выборки единиц наблюдения

1. Основные способы формирования обследуемой совокупности

2. Выборочный метод

3. Типы выборки

4. Репрезентативность выборки

Основные категории и понятия: основные способы формирования обследуемой совокупности, выборка, выборочный метод, типы выборки, генеральная совокупность, выборочная совокупность, единицы отбора, единицы анализа, репрезентативность выборки.

Задача построения выборки возникает всякий раз, когда необходимо собрать информацию о некоторой группе или большой совокупности людей. Выборку в той или иной форме используют в ориентированных на «жесткие» статистические методы опросах и даже при отборе «случаев» для включенного наблюдения и качественного анализа.

Статистические (или квазистатистические) обследования населения и ресурсов, судя по всему, зародились одновременно с первыми формами централизованной социальной и политической организации: развитые аграрные общества и древние города-государства нуждались в такой информации и использовали ее при решении разнообразнейших управленческих задач – от фискальной политики до строительства общественных бань. Эти обследования иногда принимали форму сплошных переписей населения (Об одной такой переписи рассказывает нам книга пророка Самуила: когда царь Давид (Х в. до н.э.) осуществил перепись населения древнего Израиля, в стране разразилась страшная эпидемия (2 Цар. 24). Однако значительно чаще приходилось довольствоваться сведениями о какой-то части совокупности: об урожайности судили по пробному обмолоту, о партии товара – по образцу, а о прихожанах – по их духовному наставнику.

Выборка – это подмножество заданной совокупности (популяции), позволяющее делать более или менее точные выводы относительно совокупности в целом.

Представление о том, что отбор наблюдений должен носить случайный, непредумышленный характер, в общем соответствует нашему интуитивному знанию об условиях вынесения объективного и непредвзятого суждения. Однако строгая, т.е. математико-статистическая, теория случайной выборки вплоть до конца XIX – начала XX вв. не пользовалась популярностью в среде профессиональных статистиков. Многим исследователям казалось, что в основе отбора должна лежать не «игра случая», а поиск типичных, характерных наблюдений. Это убеждение препятствовало применению в массовых обследованиях методов теории вероятности, достигшей высочайшего уровня развития уже в XVIII – первой половине XIX вв. Применимость выборочного метода для изучения случайно распределенных признаков, например, дохода или размера семьи, была впервые обоснована в работах норвежца А. Киэра, англичан А. Боули и К. Пирсона, а также русского статистика А.И. Чупрова.

Следующим принципиально важным шагом в развитии выборочного метода стала осуществленная Р. Фишером разработка техники рандомизации в эксперименте в выборочном наблюдении.

Примером пионерского успешного применения выборочного метода в исследовательской практике является исследовательская деятельность Дж. Гэллапа.

Обоснование системы выборки единиц наблюдения.В подавляющем большинстве случаев специалист использует тот или иной способ выделения из большой совокупности явлений и объектов изучения некоторую их часть в надежде, что на этой выборочной совокупности могут быть выявлены свойства объекта исследования в целом.

Выборочный метод позволяет делать заключения о характере распространения изучаемых признаков генеральной совокупности на основании рассмотрения некоторой ее части – выборочной совокупности; предполагает различные способы ее формирования, обеспечивающие возможность распространения выводов, полученных при ее рассмотрении, на изучаемую (генеральную) совокупность.

Основное назначение выборочного метода: применяется для того, чтобы изучить характеристики минимума объектов, произвести по ним оценку параметров генеральной совокупности. Он значительно сокращает затраты труда, времени, средств на решение той или иной проблемы; повышает качество и надежность процедур сбора и обработки данных; позволяет изучать объекты, сплошное исследование которых невозможно из-за большого объема затрат.

Область применения выборочного метода: неприменим для изучения объектов, элементы которых не обладают качественной однородностью признаков, значимых с точки зрения целей исследования.

Основные нормативные требования к выборочному методу: каждый элемент генеральной совокупности должен иметь определенную, принципиально задаваемую вероятность попасть в выборку. Предполагает наличие необходимой системы показателей генеральной совокупности, отражающих ее качественные и количественные характеристики.

Программа применения выборочного метода является составной частью программы исследования; ведущими задачами при этом являются: 1) предварительный сбор информации об исследуемой совокупности с целью составления основы выборки, выделения единиц отбора и анализа; 2) выбор и обоснование схем выборки; 3) организация извлечения единиц отбора из генеральной совокупности по выбранной схеме отбора; 4) расчет характеристик выборочной совокупности; 5) оценка параметров генеральной совокупности по результатам измерения признаков выборочной совокупности.

Генеральная совокупность – это множество объектов, являющихся предметом изучения в пределах, очерченных программой исследования и территориально-временными границами.

Выборочная совокупность представляет собой модель генеральной совокупности, результат определенным образом построенного извлечения части элементов генеральной совокупности, выступающих в качестве объектов наблюдения.

Основа выборки – перечень элементов генеральной совокупности, если он удовлетворяет требованиям полноты, точности, адекватности, удобства работы с ним, отсутствия дублирования единиц анализа. В качестве основы могут служить алфавитные списки сотрудников учреждения, домовые книги, картотеки отдела кадров. Наиболее полно удовлетворяют требованиям выборки социальные карты организаций, регионов, представляющие собой пространственные распределения показателей для определенных организаций или регионов и включающие демографические, экономические, политические и другие социальные показатели.

Единицы отбора – это элементы генеральной совокупности, отбираемые на каждом этапе выборки. Единицы анализа – это элементы сформированной выборочной совокупности, подвергающиеся непосредственному исследовании.

Наиболее строгие требования предъявляют к выборкам дескриптивных и аналитико-экспериментальных исследований, наименее строгие – к исследованиям по разведывательному плану. В последнем случае отбор «единиц наблюдения» на объекте подчиняется довольно простым правилам: следует выделять полярные группы по существенным для анализа критериям. Численность таких несистематических выборок строго не определяется. Все зависит от состояния получаемой информации. Наблюдение или опрос в таком исследовании продолжаются до тех пор, пока не обнаружится, что получена информация, достаточно разнообразная для формулировки гипотез. Следовательно, состав и объем выборки заранее не фиксируются, а устанавливаются опытным путем по мере развития исследования.

В исследовании дескриптивного плана выборка, напротив, должна быть строго репрезентативной.

Требования репрезентативности выборки означают, что по выделенным параметрам (критериям) состав обследуемых должен приближаться к соответствующим пропорциям в генеральной совокупности.

Репрезентативность – это свойство выборочной совокупности представлять параметры генеральной совокупности, значимые с точки зрения задач исследования. Она означает, что с некоторой наперед заданной или вычисленной погрешностью можно отождествить установленное на выборочной совокупности распределение изучаемых признаков с их действительным распределением в генеральной совокупности.

Оценка репрезентативности выводится на основе анализа и расчета ошибок: процедурных/систематических (допущенных при регистрации признаков) и случайных (зависящих от степени изменчивости изучаемого признака). Случайные ошибки связаны с природой любых статистических погрешностей. Систематические зависят от организации выборочного обследования. Это разнообразные смещения выборки в сторону одного из полюсов выборочного параметра.

Таким образом, мера подобия выборочной модели структуре генеральной совокупности оценивается ошибкой выборки, а пределы допустимой ошибки зависят от цели исследования.

Между тем, строго репрезентативную выборку по всем важным для проблематики исследования параметрам обеспечить невозможно, и поэтому следует гарантировать репрезентацию по главному направлению анализа данных.

Прежде всего надо уяснить, какие из имеющихся сведений о характеристиках генеральной совокупности существенны для целей исследования. Во многих случаях это половозрастной, социально-профессиональный, имущественный состав обследуемых, их пространственная локализация. Половозрастная структура «замыкает» на себя многие показатели семейного состояния, уже известные по другим данным. Возраст содержит указания на жизненный опыт и, как правило, на рабочий или профессиональный стаж. Социально-профессиональные, социально-статусные характеристики – это свидетельство о различиях в системе реального положения людей и их особых интересов, позиций. Пространственная локализация (по территории, подразделениям предприятий и учреждений, по другим административным и производственным «локалам») важна и с точки зрения особенностей условий этой деятельности (например, центр и периферия, основные и вспомогательные службы), и с точки зрения адресности итоговых выводов и рекомендаций, которые должны быть «привязаны» к административным или производственным ячейкам, имеющим четкие границы и часто самоуправляемым. В сочетании трех названных параметров – половозрастной структуры, социального состава, пространственной локализации – можно, как правило, быть уверенным, что выборка будет представительна для решения многих социальных проблем. Понятно, что это правило имеет исключения в зависимости от конкретных условий и особых целей исследования (например, в этнически неоднородной среде существенно иметь в виду репрезентацию по критерию национальной принадлежности).

Численность (объем) выборки зависит от уровня однородности или разнородности изучаемых объектов. Чем более они однородны, тем меньшая численность может обеспечить статистически достоверные выводы. Но степень однородности социального объекта зависит, в сущности, от того, насколько детально мы намерены его исследовать. Практически любой, самый «элементарный» объект оказывается чрезвычайно сложным. Лишь в анализе мы представляем его как относительно простой, выделяя те или иные его свойства. Чем более основательным и детальным будет анализ, чем больше свойств данного объекта мы намерены принять во внимание в их сочетании, а не изолированно, тем больше должен быть объем выборки.

Объем выборки определяется аналитическими задачами исследования, а ее репрезентативность – целевой установкой программы. Именно программа задает образ необходимой генеральной совокупности для проведения выборки. Будет ли это все население или особые его структурные образования, все элементы изучаемого объекта или только выделяемые по заданным программой критериям, генеральную совокупность составляют все единицы определенного в программе объекта.

Теперь следует обеспечить равную их вероятность попадания в выборочную совокупность.

Качество выборки зависит от трех условий: 1) от меры однородности социальных объектов по наиболее существенным для исследования характеристикам; 2) от степени дробности группировок анализа, планируемых по задачам исследования; 3) от целесообразного уровня надежности выводов из предпринимаемого исследования.

Из множества типологий видов выборки наиболее востребованной в исследовательской практике является следующая: виды выборки типологизируются в соответствии с возможностью использования теории вероятности. В тех случаях, когда такая возможность существует, принято говорить о методах вероятностного отбора. Примерами вероятностной, случайной выборки являются: простая случайная (повторная или бесповторная) выборка, систематическая (механическая/шаговая) выборка, кластерная (серийная/«гнездовая») выборка, стратифицированная выборка, многоступенчатая выборка, комбинированная выборка, многофазовая выборка.

Простая случайная выборка строится с помощью таблиц случайных чисел. Систематический отбор производится через интервал в перечне объектов. В кластерной выборке единицами случайного отбора являются определенные «гнезда», группы (семьи, коллективы, жилые кварталы и пр.). Стратифицированная выборка – это случайная выборка, с любой техникой, в которой процедуре отбора предшествует выделение в генеральной совокупности однородных групп (страт). Многоступенчатая выборка – это случайная выборка в несколько ступеней; на каждой меняется единица отбора. Комбинированная выборка – это случайная выборка, на каждой ступени которой меняется единица и техника отбора. Многофазовая выборка производится путем формирования подвыборки меньшего объема без изменения единиц отбора.

В том случае, если при построении выборки невозможно использование теории вероятности, используются не строго случайные методы отбора. Им соответствуют три типа выборки: целенаправленная (целевая/социологическая), квотная и стихийная выборки.

Целенаправленная выборка предполагает выбор типичных элементов по установленным критериям. Квотная выборка строится как модель, воспроизводящая структуру генеральной совокупности в виде квот распределения признаков изучаемых объектов. Стихийная выборка – это выборка «первого встречного» (в данном случае критерии не определены).

Все методы вероятностного отбора, в отличие от не строго случайных методов, являются репрезентативными.

Следует учитывать, что наряду с выборочным методом существуют и другие способы формирования обследуемой совокупности: сплошное исследование (требует полного охвата объекта, всех его элементов без исключения); исследование основного массива (изучается большая часть объекта или его важнейшие элементы); монографическое исследование (изучается типичная для всего объекта часть по ряду критериев). Выборочный метод является экономически наиболее выгодным: выборка экономит силы и средства исследователей; выборочная процедура представляет собой удобную и экономичную форму индуктивного вывода; эта процедура реализует фундаментальный принцип рандомизации, т.е. случайного отбора.

Напомним, что в методическом разделе программы наряду с определением принципиального (стратегического) плана исследования, с обоснованием системы выбора единиц наблюдения также осуществляется определение основных процедур сбора и анализа исходных данных. О процедурах сбора первичной информации мы будем говорить в последующих лекциях при рассмотрении количественных и качественных методов сбора исходных данных. Об анализе исходных данных речь пойдет в последующем семестровом курсе «Организация и проведение социологических и маркетинговых исследований».

Наши рекомендации