Методы формирования случайной выборки

Простая случайная выборка (Simple Random Sampling — SRS)

Вероятностный метод выборки, согласно которому каждый элемент генеральной совокупности имеет известную и равную вероятность отбора. Каждый элемент выбирается независимо от каждого другого элемента, и выборка формируется произвольным отбором элементов из основы выборки.

Простая случайная выборка имеет очевидные преимущества. Этот метод прост для понимания.

· Результаты исследования можно распространять на изучаемую совокупность,

· Большинство подходов к получению статистических выводов предусматривают сбор информации с помощью простой случайной выборки.

Однако метод простой случайной выборки имеет как минимум четыре существенных ограничения.

· часто сложно создать основу выборочного наблюдения, которая позволила бы провести простую случайную выборку.

· результатом применения простой случайной выборки может стать большая совокупность, либо совокупность, распределенная по большой географической территории, что значительно увеличивает время и стоимость сбора данных.

· результаты применения простой случайной выборки часто характеризуются низкой точностью и большей стандартной ошибкой, чем результаты применения других вероятностных методов.

· в результате применения SRS может сформироваться нерепрезентативная выборка.

Хотя выборки, полученные простым случайным отбором, в среднем адекватно представляют генеральную совокупность, некоторые из них крайне некорректно представляют изучаемую совокупность. Вероятность этого особенно велика при небольшом объеме выборки. Простая случайная выборка не часто используется в маркетинговых исследованиях. Более популярен метод систематической выборки.

Систематическая выборка

При проведении систематической выборки (systematic sampling) сначала задают произвольную отправную точку, а затем из основы выборочного наблюдения последовательно выбирают каждый 1-й элемент. Обшей чертой систематической выборки и простой случайной выборки является то, что каждый элемент генеральной совокупности имеет известную и равную вероятность выбора.

При систематической выборке исследователь предполагает, что элементы совокупности расположены в определенном порядке. В некоторых случаях принцип сортировки (например, алфавитный перечень в телефонной книге) не имеет отношения к исследуемой характеристике. В других случаях сортировка непосредственно связана с исследуемой характеристикой. Например, имена владельцев кредитных карточек приводятся с учетом суммы их баланса, а названия фирм определенной отрасли располагаются согласно годовому объему их продаж. Если элементы совокупности расположены по принципу, не связанному с исследуемой характеристикой, результаты систематической выборки аналогичны результатам SRS.

С другой стороны, если принцип расположения элементов связан с исследуемой характеристикой, систематический отбор увеличивает репрезентативность выборки. Если фирмы какой либо отрасли расположены по принципу увеличения годового объема продаж, систематическая выборка будет включать как мелкие, так и крупные фирмы. Простая случайная выборка в данном случае может быть нерспрезентативной, включая, например, только мелкие фирмы или непропорциональное число мелких фирм. Если расположение элементов выборки носит циклический характер, систематическим методом можно уменьшать представительность выборки.

Систематическая выборка дешевле и проще, чем простая случайная, поскольку случайный отбор осуществляется только один раз. Кроме того, случайные числа не должны соответствовать определенным элементам, как в SRS. Учитывая, что некоторые перечни содержат миллионы элементов, использование этого метода значительно экономит время, что, в свою очередь, способствует снижению затрат, связанных с исследованием. Если совокупность обладает информацией об исследуемой характеристике, систематический отбор дает возможность получить более репрезентативную и достоверную (с меньшей ошибкой выборки) выборку, чем метод SRS.

Еще одно важное преимущество: систематический отбор можно применять даже не зная структуру основы выборочного наблюдения. Например, можно опросить каждого /-го человека, покидающего универмаг или торговый центр. Поэтому систематический отбор часто применяется при проведении почтовых и телефонных опросов, а также интервью-"перехватов" в торговых центрах.

Стратифицированная выборка

Стратифицированная, или расслоенная, выборка (stratified sampling) — это процесс, состоящий из двух этапов, в котором совокупность делится на подгруппы (слои, страты, strata). Слои должны взаимно исключать и взаимно дополнять один другого, чтобы каждый элемент совокупности относился к одному и только одному слою, и ни один элемент не был упущен. Далее, из каждого слоя случайным образом выбираются элементы, при этом обычно используется метод простой случайной выборки. Формально, выбор элементов из каждого слоя может осуществляться только с помощью SRS. Однако на практике иногда применяется систематический отбор и другие вероятностные выборочные методы. Отличие стратифицированной выборки от квотной состоит в том, что элементы в ней выбираются скорее случайно, а не из удобства или на основании мнения исследователя. Главная задача стратифицированной выборки — увеличение точности без увеличения затрат.

Кроме того, стратификационные переменные должны быть тесно связаны с исследуемой характеристикой. Чем больше переменные соответствуют этим критериям, тем эффективнее уменьшение нежелательных отклонений в выборке. В конце концов, переменные должны снижать стоимость процесса расслоения, будучи простыми в оценке и применении. Как правило, для стратификации используют такие переменные, как демографические характеристики, разновидность покупателя (владельцы кредитной карточки или те, кто ее не имеет), величина фирмы или отрасль промышленности. Для стратификации можно использовать несколько переменных, однако больше двух применяют редко, поскольку это непрактично и экономически неоправданно. Несмотря на то, что количество слоев в расслоенной выборке остается предметом спора, опыт показывает, что использовать нужно не больше шести. При использовании больше шести слоев любое повышение точности сводится на нет увеличением стоимости расслоения и отбора.

Кластерная выборка (cluster sampling)

Сначала изучаемая совокупность делится на взаимоисключающие и взаимодополняющие подгруппы, называемые кластерами. Затем с помощью вероятностного метода выборки, такого как простая случайная выборка, отбираются кластеры. В выборку включаются либо все элементы отобранного кластера, либо проводится их отбор вероятностным методом.

Основное различие между кластерной и стратифицированной выборкой состоит в том, что в первом случае используются только отобранные подгруппы (кластеры), в то время как в стратифицированной выборке все подгруппы (слои) используются для дальнейшего отбора. Эти методы преследуют разные цели. Цель кластерной выборки — увеличить эффективность выборки, уменьшив затраты на ее проведение. Цель стратифицированной выборки увеличение точности. По однородности и неоднородности критерии формирования кластеров прямо противоположны критериям формирования слоев. Элементы кластера должны быть максимально разнородны, а сами кластеры — как можно более однородными. В идеале каждый кластер должен представлять собой небольшую модель генеральной совокупности.

При кластерной выборке основа выборочного наблюдения необходима только для кластеров, которые вошли в выборку.

Распространенная форма кластерной выборки — территориальная выборка (area sampling), в которой кластеры состоят из географических территорий, таких как округа, жилые районы или кварталы. Если отбор основных элементов проводится в один этап (например, исследователь выбирает некоторые кварталы, а затем все семьи, живущие в этих кварталах, включаются в выборку), такой выборочный метод называется одноступенчатой территориальной выборкой. Если отбор основных элементов проводится в два (или больше) этапа (исследователь выбирает

кварталы, а затем в каждом таком квартале отбирает семьи, которые будут включены в выборку), такой метод называется двухступенчатой (или многоступенчатой) территориальной выборкой. Отличительная черта одноступенчатой территориальной выборки заключается в том, что все семьи из выбранных кварталов (или географических регионов) включаются в выборку.

Различия

Стратифицированная кластерная
Однородность внутри групп Однородность между группами
Не однородность между группами Наблюдается гетерогенность внутри
Включены все группы (страты) Проводиться случайный отбор групп, но полностью
Эффективность выборки растет за счет того, что точность растет быстрее стоимости Стоимость падает быстрее точности

Другие методы вероятностной выборки

Кроме четырех основных, существует множество других методов вероятностной выборки, большинство из которых — разновидности базовых. Они разработаны для решения сложных проблем, возникающих в процессе выборки. Среди них определенную важность для маркетинговых исследований представляет метод последовательной выборки и метод двойного контроля, При последовательной выборке (sequential sampling) отбор элементов генеральной совокупности проводится последовательно, при этом на каждом этапе собирается и анализируется информация и принимается решение о дополнительном отборе элементов популяции.

Объем выборки изначально не известен, однако, перед тем как начинать отбор, исследователи устанавливают критерии формирования выборки. На каждом этапе отбора такие критерии определяют, продолжать выборку или получено достаточно информации. Метод последовательной выборки использовался, чтобы определить, какую из альтернатив предпочтут

потребители. В одном из опросов респондентов спросили, какую из альтернатив они предпочитают, и процесс отбора прекратили, когда собрали достаточно информации для определения предпочтений потребителей. Этот метод также применялся для установления ценовой разницы между обычной и усовершенствованной моделями потребительских товаров длительного пользования.

Последовательная выборка (sequential sampling)

Метод вероятностный выборки, согласно которому отбор элементов генеральной совокупности проводится последовательно, на каждом этапе собирается и анализируется информация и принимается решение о дополнительном отборе элементов генеральной совокупности.

При использовании метода двойного контроля (double sampling), который еще называют методом двухэтапнои выборки, некоторые элементы популяции отбираются дважды. На первом этапе проводится выборка и собирается некоторое количество информации обо всех ее элементах. На втором этапе из элементов начальной выборки создается подгруппа и дальнейшая информация собирается уже об ее элементах. Этот процесс может состоять из трех или больше этапов, и различные этапы могут проводиться как одновременно, так и в разное время. Метод двойного контроля полезен, когда нельзя сразу воспользоваться основой выборки для отбора конечных элементов выборки, но известно, что его элементы входят в более полную основу выборки. Например, исследователь хочет отобрать в определенном городе семьи, которые пьют яблочный сок. Исследуемые семьи входят в совокупность всех городских семей, но исследователь не знает, какие из них любят яблочный сок. При применении метода двойного контроля маркетолог на первом этапе создает основу выборочного наблюдения, состоящую из всех семей.

Основу выборки можно приобрести или составить, воспользовавшись городской адресной книгой. Далее методом систематического случайного выбора проводится отбор семей для опре-

деления количества купленного яблочного сока. На втором этапе будут отобраны семьи, употребляющие яблочный сок, и стратифицированы в соответствии с количеством потребляемого яблочного сока. Затем создается стратифицированная случайная выборка и задаются детальные

вопросы относительно потребления яблочного сока.

Метод двойного контроля (double sampling)

Метод выборки, в соответствии с которым некоторые элементы совокупности отбираются дважды.

Наши рекомендации