К методам не сплошного наблюдения относятся монографический метод, метод основного массива и, собственно, выборочный метод.
Монографический метод применяется для подробного описания объекта, имеющего какие-либо яркие особенности. Например: медико-социальное обследование национальностей Крайнего Севера или социально-гигиеническое описание промышленного центра. Выводы, которые получаются путем таких обследований, относятся либо только к конкретному объекту исследования, либо могут быть распространены на весьма ограниченную группу аналогичных объектов.
Метод основного массива предусматривает обследование контингентов, которые могут быть сосредоточены на конкретном объекте. Например: изучение госпитализированной заболеваемости в стационаре. Данные о структуре заболеваний, тяжести течения и их прогнозе, полученные в этом исследовании, могут иметь значение только для решения частных вопросов. Судить о распространенности патологии за пределами такого стационара по этим данным нельзя.
Собственно выборочное исследование охватывает выборочную совокупность или просто выборку из генеральной совокупности. Такое исследование имеет ряд весьма существенных преимуществ перед сплошным наблюдением. Во-первых, оно дает значительную экономию средств и требует существенно меньше времени, чем сплошное. Во-вторых, при выборочном исследовании может быть достигнута большая глубина и детальность изучения вопроса. В-третьих, при меньшем числе наблюдений уменьшаются вероятности систематических ошибок наблюдения, возникающих, когда объектам приписывают искаженные данные.
Виды выборок
Процедура формирования выборки определяется методом, на основании которого отбираются единицы генеральной совокупности. При формировании выборки используются случайные (вероятностные) и неслучайные (детерминированные, невероятностные)методы.
Если все единицы генеральной совокупности имеют известный шанс (вероятность) быть включенными в выборку, то она называется вероятностной или случайной. Если этот шанс (вероятность) неизвестен, то выборка является невероятностной.
Вероятностные выборки предполагают, что в основе их формирования лежит принцип случайности, когда каждая единица генеральной совокупности имеет равные шансы попасть в выборку. Случайность при этом рассматривается не в обыденном смысле слова, а как некая система организации отбора, при которой именно случай определяет включение той или иной единицы плюральной совокупности в выборку.
Простая случайная выборка предполагает, что вероятность быть включенными в выборку известна и является одинаковой для всех единиц генеральной совокупности. При этом отбор производится независимо от признаков, которыми обладают отдельные единицы (то есть независимо от пола, возраста, образования, уровня доходов и т.д). Вероятность быть включенным в выборку определяется отношением се размера к объему генеральной совокупности.
Систематическая выборка также может использоваться только в том случае, когда исследователь располагает полным списком единиц генеральной совокупности. Техника формирования данной выборки предполагает определение выборочного шага («интервала скачка») и стартового номера. Первый определяется как отношение объема генеральной совокупности к размеру выборки, второй — случайным образом (лотерейным подбором, по таблице случайных чисел). Предположим, что проводится исследование успеваемости студентов. На первом курсе обучается 800 человек. Определено, что исследованием будет охвачено 100 студентов. Выборочный шаг равен 8 (800 : 100). Случайным образом определяется стартовый номер (к примеру, 3). Таким образом, в выборку попадут студенты-первокурсники под номерами 3, 11, 19, 27 и т.д.
Возможности использования систематической выборки во многом определяются наличием для различных видов генеральных совокупностей списков (например, спецификаций, телефонных справочников). Систематическая выборка была бы полностью адекватна случайной, если бы единицы генеральной совокупности попадали в нее случайным образом. Такому условию не удовлетворяет ни один реальный список. Поэтому на практике систематический отбор считают эквивалентным случайному, если порядок расположения единиц в списке никак не связан с исследуемыми признаками.
При достаточно простой процедуре формирования систематическая выборка даже при небольших своих размерах позволяет охватить сравнительно большие по объему генеральные совокупности. Данный метод является более экономичным и оперативным по сравнению с методом простого случайного отбора. В то же время, при использовании систематической выборки получаются менее репрезентативные результаты.
Стратифицированная выборка предполагает, что исследуемая совокупность подразделяется на страты, то есть на более мелкие совокупности по какому-либо признаку, который связан с исследуемой проблемой (например, взрослое население можно разбить на следующие страты: 18-25, 26-35, 36-45 лет и т.д.). Существенным моментом при стратификации является то, что каждая единица генеральной совокупности попадает только в одну страту. Из выделенных страт производится отбор единиц методами простой случайной или систематической выборки.
Если размер выборки для определенной страты пропорционален размеру страты по отношению ко всей совокупности, то выборка называется пропорционально стратифицированной. В случае непропорционально стратифицированной выборки необходимо использовать весовые коэффициенты, уравновешивающие размеры страт.
При применении данного метода обычно используются признаки, которые находятся в известной корреляции с проблемами, являющимися предметом исследования. Исходными принципами при выборе признаков для стратификации считаются: минимизация различий между единицами каждой страты и максимизация различий между стратами. Первый принцип обеспечивает однородность единиц каждой страты, то есть является гарантией ее гомогенности. Необходимость этого связана с предположением, что лица, попадающие в одну и ту же страту, будут проявлять достаточно сходное поведение. Соблюдение же второго принципа гарантирует достаточные различия в поведении респондентов разных страт. В противном случае, формирование стратифицированной выборки не имеет смысла.
Стратифицированная выборка является более точной по сравнению с простой случайной и предпочтительна, когда генеральная совокупность очень неоднородна по качественному составу. Однако, стратифицированная выборка может быть сформирована при наличии дополнительной информации обо всей генеральной совокупности или результатов предыдущих исследований.
Приведем пример формирования стратифицированной выборки. Предположим, что на определенном курорте в настоящее время отдыхает 2000 туристов, из которых: в возрасте 16-20 лет — 500 человек; 20-30 лет — 800; 30-40 лет — 400; свыше 40 лет — 300. Стратифицированная выборка может выглядеть следующим образом: n = 200 человек, из которых: 50 человек в возрасте 16-20 лет; 80 — в возрасте 20-30 лет; 40 — в возрасте 30-40 лет; 30 — в возрасте свыше 40 лет.
Кластерная выборка, как и стратифицированная, предусматривает разделение генеральной совокупности на более мелкие. Основное различие между ними состоит в том, что при кластерной выборке производится отбор определенных частей (кластеров), из которых, в свою очередь, случайным образом осуществляется отбор лиц, попадающих в выборку. При стратификации в выборку включаются лица из каждой страты целевой совокупности. Тогда каждая страта является гомогенной по тому или иному признаку (например, полу, возрасту). В случае же кластерной выборки каждый кластер представляет собой уменьшенную модель генеральной совокупности. При этом единицы кластера должны быть максимально разнородными, а сами кластеры — как можно более однородными.
При исследовании здоровья населения страны кластеры могут быть сформированы по принципу территориальной привязки к определенному региону. Страна разбивается на четко определяемые части (кластеры), например области. Считается, что выделенные кластеры являются идентичными и состояние здоровья населения отдельных областей характерно для страны в целом. Далее случайным образом выбирается одна из областей (один кластер), формируется выборка, проводится соответствующее исследование, а выводы относятся к совокупности населения всей страны.
Достоинство кластерной выборки состоит в том, что при ее формировании отсутствует необходимость (как в случае стратифицированной) в сведениях относительно распределения совокупности но отдельным признакам (полу, возрасту, образованию, специальному статусу и т.д.). Одним из самых существенных преимуществ кластерных выборок является и то, что при их использовании исследования отличаются относительно небольшими затратами вследствие компактности отдельных кластеров, в качестве которых могут рассматриваться не только территориально-географические образования.
На практике не всегда имеется в наличии полный список единиц генеральной совокупности, что затрудняет или делает в принципе невозможным использование вероятностной выборки. Поэтому при проведении исследований широко применяются невероятностные (неслучайные)выборки, отличающиеся простотой формирования, а также требующие меньших временных и финансовых затрат. В то же время, они не обладают такой точностью и высокой степенью представительности и достоверности, которая характерна для вероятностных (случайных) выборок. При формировании невероятностных выборок подбор единиц в определенной степени является преднамеренным, а не случайным. Поэтому, в отличие от вероятностных выборок, статистические выводы применительно ко всей генеральной совокупности в этом случае делать не вполне правомерно.
Репрезентативность выборки
Конечной целью изучения выборочной совокупности всегда является получение информации о генеральной совокупности. Для этого выборочное исследование должно удовлетворять определенным условиям. Одно из главных условий — репрезентативность (представительность) выборки. Как обсуждалось ранее, выделяют качественную и количественную репрезентативность.
Случайность, гарантирующая качественную (структурную) репрезентативность статистических исследований, достигается выполнением ряда условий формирования выборочных групп (совокупностей):
1. Каждый член генеральной совокупности должен иметь равную вероятность попасть в выборку.
2. Отбор единиц наблюдения из генеральной совокупности необходимо проводить независимо от изучаемого признака. Если отбор проводится целенаправленно, то и при этом необходимо соблюдать условия независимости распределения изучаемого признака.
3. Отбор должен проводиться из однородных групп.
Соблюдение условий, гарантирующих максимальную близость выборочной и генеральной совокупностей, обеспечивается специальными способами отбора. В зависимости от способа формирования различают следующие выборки:
1. Выборки, не требующие разделения генеральной совокупности на части (собственно, случайная повторная или бесповторная выборка).
2. Выборки, требующие разбиения генеральной совокупности на части (механическая, типическая или типологическая выборки, когортная, парно-сопряженная выборки).
Собственно, случайная выборка формируется случайным отбором — наудачу. В основе случайного отбора лежит перемешивание. Например: выбор шара в спортлото после перемешивания всех шаров, выбор выигрышных номеров лотереи, случайный выбор карточек больных для исследования и т.п. Иногда используют случайные числа, получаемые из таблиц случайных чисел или с помощью генераторов случайных чисел. Согласно этим числам из заранее пронумерованного массива генеральной совокупности выбираются единицы наблюдения с номерами, соответствующими выпавшим случайным числам.
При составлении случайной выборки после того, как объект выбран, и все необходимые данные о нем зарегистрированы, можно поступать двояко: объект можно вернуть, или не вернуть в генеральную совокупность. В соответствии с этим выборку называют повторной(объект возвращается в генеральную совокупность) или бесповторной (объект не возвращается в генеральную совокупность). Поскольку в большинстве статистических исследований разница между повторной и бесповторной выборками практически отсутствует, то априорно принимается условие, что выборка повторная.