Определение объема и процедуры выборки
Определение соответствующей совокупности согласно поставленным целям исследования. Получение «списка» совокупности для установления контура выборки. Проектирование выборочного плана – определение состава и объема выборки. Определение методов доступа к совокупности. Достижение нужной численности выборки. Проверка выборки на соответствие требованиям. Необходимость в формировании новой выборки.
Количество информации, запрашиваемой у респондентов, сильно меняется от одного исследования к другому. Например, одно исследование своей целью ставит получение разнообразной информации о продукте и его марке, о жизненном стиле покупателей и их демографических характеристиках. В то время как другое — пытается только определить, что посетитель магазина запомнил из рекламы у входа в данный магазин.
Традиционно телефонные обследования являются самыми короткими, в то время как личное интервью — достаточно пространным.
Все другие методы сбора данных занимают промежуточное положение. Часто комбинированно применяют несколько методов сбора данных. Например, после короткого телефонного интервью проводится опрос по почте.
Поскольку опросить всех потребителей невозможно, выбирается лишь часть всех потребителей, или образец, отражающий свойства всей группы. Этот образец называется выборкой. Выборка ( sample) — это часть исследуемой группы объектов (потребителей), выбранная для маркетингового исследования и представляющая всю группу. Выборка должна отражать целевой рынок, т. е. представлять его характеристики, или быть репрезентативной.
План выборки содержит ответы на три вопроса:
Во-первых, это единица выборки ( sampling unit), т. е. кого нужно опрашивать. Исследователь должен определить, какая информация необходима и кто наиболее вероятно ею располагает. Так, например, если нужно исследовать поведение потребителей сотовых телефонов, стоит вопрос: кого опрашивать — студентов, бизнесменов, школьников, врачей, продавцов или всех их?
Второй вопрос плана выборки — как много людей должно быть опрошено, или размер выборки ( sample size). Большие выборки дают более надежные результаты, чем малые. Однако для надежных результатов совсем необязательно опрашивать большинство людей популяции. Хорошо сформированная выборка, составляющая менее одного процента популяции, часто может дать хорошую надежность.
Третий вопрос плана выборки: как выборка должна формироваться, или процедура выборки ( sampling procedure). Выборка может быть случайной, вероятностной ( probability sample), или неслучайной, невероятностной ( nonprobability sample). Случайная выборка дает каждому члену совокупности, или популяции, известный и одинаковый шанс быть выбранным, и ошибка выборки может быть измерена. Однако если случайная выборка слишком дорого обходится или требует слишком длительного времени, может использоваться неслучайная выборка. Хотя ошибка неслучайной выборки не может быть измерена. Метод выборки зависит от потребностей исследования. Нередко методы комбинируются.
Существенное влияние на выбор метода сбора данных оказывает степень чувствительности изучаемой темы, т.е. степень затрагивания личных интересов, взглядов, морально-этических аспектов (сдача крови, расовые проблемы, личная гигиена, пожертвования в благотворительных целях и др.). Опыт изучения данных проблем говорит о том, что здесь менее всего подходит персональное интервью, а чаще всего используется телефонное интервью или интервью с помощью компьютера.
Выбор надлежащего метода следует основывать на одновременном учете всех указанных факторов, что чрезвычайно сложно и что порой дает противоречивые результаты. Окончательный выбор во многом зависит от квалификации и опыта работы исследователей, глубины владения ими отдельными методами сбора данных. В общем плане при выборе метода опроса надо руководствоваться ответами на следующий вопрос: «Какой метод сбора данных позволит получить наиболее полную репрезентативную информацию в пределах отпущенных времени и денежных средств?»
Чтобы установить необходимый объем выборки следует учесть несколько факторов. Один из наиболее важных – гомогенность – степень близости друг к другу членов данной совокупности с точки зрения изучаемых нами характеристик. Если каждый индивидуум в совокупности в точности такой же, как все остальные, то, выбрав всего лишь одного из них, мы получим действительно репрезентативную выборку. Напротив, если каждый индивидуум в совокупности абсолютно не похож ни на какой другой, то, прежде чем мы сможем утверждать, что у нас имеется репрезентативная выборка, нам потребуется провести перепись всей совокупности. В первом случае совокупность называют полностью гомогенной, во втором–полностью гетерогенной. Разумеется, в действительности большинство совокупностей располагается между этими двумя полюсами.
Чем гомогенное данная совокупность, т.е. чем меньше различий между ее членами, тем меньшая по объему выборка необходима для ее представления. Напротив, чем гетерогеннее совокупность, т.е. чем больше различий между ее членами, тем большая выборка необходима для ее представления. Это особенно важно учитывать при стратифицированном формировании выборки, поскольку самим актом стратификации мы создаем подгруппы, более гомогенные, чем совокупность в целом. Таким образом, внутри уровней можно использовать, не теряя при этом репрезентативности, выборки меньшего объема, чем следовало бы для всей совокупности.
Стратифика́ция (от лат. stratum и — «расслаивание»)
ВЫБОРКИ РЕПРЕЗЕНТАТИВНОСТЬ - свойство выборки (см.), заключающееся в ее способности адекватно представлять состояние дел в генеральной совокупности (см.). В количественных исследованиях различают статистическое и нестатистическое обоснование репрезентативности.
Типы выборок
Выборки делятся на два типа:
- вероятностные
- невероятностные
1. Вероятностные выборки
1.1 Случайная выборка (простой случайный отбор)
Такая выборка предполагает однородность генеральной совокупности, одинаковую вероятность доступности всех элементов, наличие полного списка всех элементов. При отборе элементов, как правило, используется таблица случайных чисел.
1.2 Механическая (систематическая) выборка
Разновидность случайной выборки, упорядоченная по какому-либо признаку (алфавитный порядок, номер телефона, дата рождения и т.д.). Первый элемент отбирается случайно, затем, с шагом ‘n’ отбирается каждый ‘k’-ый элемент. Размер генеральной совокупности, при этом – N=n*k
1.3 Стратифицированная (районированная)
Применяется в случае неоднородности генеральной совокупности. Генеральная совокупность разбивается на группы (страты). В каждой страте отбор осуществляется случайным или механическим образом.
1.4 Серийная (гнездовая или кластерная) выборка
При серийной выборке единицами отбора выступают не сами объекты, а группы (кластеры или гнёзда). Группы отбираются случайным образом. Объекты внутри групп обследуются сплошняком.
2. Невероятностные выборки
Отбор в такой выборке осуществляется не по принципам случайности, а по субъективным критериям – доступности, типичности, равного представительства и т.д..
2.1. Квотная выборка
Изначально выделяется некоторое количество групп объектов (например, мужчины в возрасте 20-30 лет, 31-45 лет и 46-60 лет; лица с доходом до 30 тысяч рублей, с доходом от 30 до 60 тысяч рублей и с доходом свыше 60 тысяч рублей) Для каждой группы задается количество объектов, которые должны быть обследованы. Количество объектов, которые должны попасть в каждую из групп, задается, чаще всего, либо пропорционально заранее известной доле группы в генеральной совокупности, либо одинаковым для каждой группы. Внутри групп объекты отбираются произвольно. Квотные выборки используются в маркетинговых исследованиях достаточно часто.
2.2. Метод снежного кома
Выборка строится следующим образом. У каждого респондента, начиная с первого, просятся контакты его друзей, коллег, знакомых, которые подходили бы под условия отбора и могли бы принять участие в исследовании. Таким образом, за исключением первого шага, выборка формируется с участием самих объектов исследования. Метод часто применяется, когда необходимо найти и опросить труднодоступные группы респондентов (например, респондентов, имеющих высокий доход, респондентов, принадлежащих к одной профессиональной группе, респондентов, имеющих какие-либо схожие хобби/увлечения и т.д.)
2.3 Стихийная выборка
Опрашиваются наиболее доступные респонденты. Типичные примеры стихийных выборок – опросы в газетах/журналах, анкеты, отданные респондентам на самозаполнение, большинство интернет-опросов. Размер и состав стихийных выборок заранее не известен, и определяется только одним параметром – активностью респондентов.
2.4 Выборка типичных случаев
Отбираются единицы генеральной совокупности, обладающие средним (типичным) значением признака. При этом возникает проблема выбора признака и определения его типичного значения.
Статистическое обоснование репрезентативности применяется к случайным (вероятностным, статистическим) выборкам - простым, стратифицированным, кластеризованным, многоступенчатым. Оно обеспечивается оцениванием случайной ошибки выборки для наиболее важных, с точки зрения целей исследования, переменных.
Нестатистическое обоснование репрезентативности применяется к целевым (квотным, "основного массива", "снежного кома" и т.п.) выборкам. Репрезентативность квотной выборки обычно обосновывается соответствия распределения выборки распределению генеральной совокупности по наиболее важным социально-демографическим показателям, таким как пол, возраст, образование и т.п., а также применением рандомизирующих процедур при отборе респондентов, таких как использование элементов маршрутной выборки, запрет на опрос родственников и знакомых и др. Для выборки, полученной методом "основного массива" или "снежного кома", обоснование репрезентативности строится на основе оценки неохваченной части генеральной совокупности - ее объема, а также существенности отличий от выборки исследования.