Часть 2. Важнейшие факторы, влияющие на выбор холодильника
Пример заполнения вопросника
Продолжение
Продолжение
Часть 3. Оценка вашего холодильника (если у вас их несколько, ответьте только об одном из них)
Вам предлагается несколько утверждений, характеризующих ваш холодильник. Скажите, насколько каждое из утверждений соответствует действительности. Выберите один из пяти вариантов ответа.
Марка холодильника
Продолжение
Часть 4. Оценка нового холодильника
Вниманию проводящего опрос!
Дайте детальное описание холодильника «Super Snow», покажите рисунок, объясните технические характеристики. Ответьте на все возникшие вопросы.
При описании холодильника «Super Snow» будьте абсолютно беспристрастны.
Продолжение
Вниманию проводящего опрос!
После детального описания холодильника «Super Snow» попросите респондента оценить его по каждому из следующих утверждений. Переходите к этой части после того, как определите степень готовности купить «Super Snow» (вопросы 4-А — 4-Е).
Продолжение
Часть 5. Данные о респонденте
(пункты 5-1 и 5-2 заполняет проводящий опрос)
4.11. Разработка выборочного плана и определение объема выборки
Основные понятия
Рассмотрим основные понятия, используемые при проведении выборочных исследований.
На данном этапе маркетинговых решений возникает необходимость получить информацию о параметрах «группы», среди членов которой будет проводиться маркетинговое исследование. Например, управляющий маркетингом желает иметь данные об объеме сбыта продуктов его компании через различные типы розничных магазинов («группа»). Такая «группа» в статистике называется генеральной совокупностью или просто совокупностью. Иногда совокупность является достаточно малой по своей численности, и менеджер может изучить всех ее членов. Обычно же это сделать невозможно: изучить, например, мнение всех детей возраста от 3-х до 5 лет относительно игрушек определенного типа. Следовательно, проводится изучение только части совокупности, называемой выборкой.
Выборка является базовым уровнем проводимых исследований.
Необходимо отметить, что, поскольку выборка является частью изучаемой совокупности, полученные от выборки данные скорее всего не будут в точности соответствовать данным, которые можно было бы получить от всех единиц совокупности. Различие между данными, полученными от выборки, и истинными данными называется ошибкой выборки. Ошибка выборки обусловливается двумя факторами: методом формирования выборки и размером выборки. Эти вопросы будут рассмотрены ниже.
Формирование выборки прежде всего основывается на знании контура выборки (sampling frame), под которым понимается список всех единиц совокупности, из которого выбираются единицы выборки. Например, если в качестве совокупности рассматривать все автосервисные мастерские города Москвы, то надо иметь список таких мастерских, рассматриваемый как контур, в пределах которого формируется выборка.
Контур выборки неизбежно содержит ошибку, называемую ошибкой контура выборки и характеризующую степень отклонения от истинных размеров совокупности. Очевидно, что не существует полного официального списка всех автосервисных мастерских города Москвы, включая полулегальный и нелегальный бизнес в данной области. Исследователь должен информировать заказчика работы о размерах ошибки контура выборки.
Существуют три главные проблемы формирования выборки.
Прежде всего, исходя из сути рассматриваемой задачи, необходимо определить, кто является единицей выборки. Например, фирма — производитель сотовых телефонов решила изучить потенциальный рынок на свою продукцию. Было принято решение изучить мнение по данному вопросу как лиц, принимающих решения по выбору коммуникационного оборудования в различных организациях, так и глав семейств, определяющих данную политику в семье.
Далее необходимо четко определить, кто рассматривается в качестве единицы выборки. В нашем примере единицами выборки являются начальники коммуникационных отделов и главы семейств.
Очень важным является также определение контура выборки. Например, список всех домовладельцев определенного региона. В целях выполнения правила репрезентативности проводимого исследования необходимо обратить внимание на метод, с помощью которого выбираются единицы выборки из контура выборки. Здесь разговор идет о планировании выборки.
И наконец, необходимо решить вопрос об объеме выборки, который определяет число изучаемых единиц выборки. Объем выборки очень редко зависит от размера совокупности. Поэтому объем выборки для одного региона необязательно существенно меньше объема выборки для государства в целом.
При формировании выборки используются вероятностные (случайные) и не вероятностные (неслучайные) методы.
Если все единицы выборки имеют известный шанс (вероятность) быть включенными в выборку, то выборка называется вероятностной (случайной). Если этот шанс (вероятность) неизвестен, то выборка называется невероятностной (неслучайной). К сожалению, в большинстве маркетинговых исследований из-за невозможности точного определения размера совокупности не представляется возможным точно рассчитать вероятности. Поэтому термин «известная вероятность» скорее основан на использовании определенных методов формирования выборки, чем на знании точных размеров совокупности.
Вероятностные методы включают в свой состав: простой случайный отбор, систематический отбор, кластерный отбор и стратифицированный отбор.
Простой случайный отбор предполагает, что вероятность быть избранным в выборку известна и является одинаковой для всех единиц совокупности. Вероятность быть включенным в выборку определяется отношением объема выборки к размеру совокупности.
Простой случайный отбор может осуществляться с помощью следующих методов: формирование выборки вслепую и с помощью таблицы случайных чисел.
При использовании метода формирования выборки вслепую единицы совокупности в соответствии с их фамилиями, названиями или другими признаками вносятся в карточки, которые в перемешанном виде помещаются в какую-то непрозрачную емкость (ящик, коробку и т.п.). Из данной емкости кто-то случайным образом вытягивает число карточек, определяемое объемом выборки.
В таблицах случайных чисел содержатся числа, порядок включения которых в таблицу осуществлен случайным образом. Единицам совокупности присваивают порядковые номера. В таблице случайных чисел выбирают любую начальную точку и, двигаясь в произвольном направлении и произвольно меняя направление движения, выбирают необходимое количество номеров из числа присвоенных, равное заранее установленному объему выборки.
Использование простого случайного отбора гарантирует, что каждая единица совокупности известна и имеет равные шансы быть включенной в выборку.
Однако, чтобы можно было эти методы использовать, необходимо предварительно определить каждую единицу совокупности, что при больших размерах совокупности сделать достаточно сложно, а порой и невозможно.
Данный недостаток существенно снижается при использовании компьютера для присвоения единицам совокупности номеров и формирования выборки. При телефонном интервью компьютер может генерировать случайным образом телефонные номера: он имеет генератор случайных чисел.
Начальная часть метода систематического отбора соответствует начальной части метода простого случайного отбора: необходимо получить полный список единиц генеральной совокупности.
Однако далее вместо присвоения порядковых номеров используется показатель «интервал скачка», рассчитанный как отношение размера совокупности к объему выборки. Например, если используется телефонный справочник и интервал скачка был определен равным 250, то это означает, что каждый 250-й телефонный номер включается в выборку. Для определения же начальных страницы и колонки справочника используются случайные числа.
Очевидно, что данный метод является более экономичным и быстрым по сравнению с методом простого случайного отбора. Случайные числа используются только на начальной стадии его реализации. Вместе с тем такой метод дает менее репрезентативные результаты по сравнению с методом простого случайного отбора.
Особенно широко метод систематического отбора используется, когда для различных видов совокупностей имеются различные справочники, списки, спецификации и т.п. материалы.
Другим методом вероятностного отбора является кластерный отбор, основанный на делении совокупности на подгруппы, каждая из которых представляет совокупность в целом. Базовая концепция данного метода очень похожа на базовую концепцию метода систематического отбора, однако реализация этой концепции осуществляется по-другому. Предположим, что исследуется мнение населения какого-то региона относительно марки какого-то товара.
Регион разбивается на четко определяемые части (кластеры), например области. Исследователь может считать, что выделенные кластеры являются идентичными и мнение населения этих областей характерно для региона в целом. Далее одна из областей (один кластер) выбирается случайным образом, определяется совокупность для этой области, в ней проводится соответствующее исследование, а выводы обобщаются на совокупность всего региона (одноступенчатый подход).
Формирование выборки можно осуществить и на основе двухступенчатого подхода. В этом случае после первоначального случайного формирования выборки кластеров (в нашем примере случайным образом выбирается несколько областей) используется один из вероятностных методов для проведения исследований среди единиц выборки. Очевидно, что репрезентативность результатов, полученных на основе исследований для группы кластеров, является более высокой, чем для одного кластера. Однако этот подход является более дорогим по сравнению с одноступенчатым подходом.
Иногда при проведении исследований, когда общую исследуемую территорию можно разбить на отдельные зоны, при формировании выборки используется выборочная решетка, накладываемая на карту обследуемой территории. Каждая ячейка решетки определяет конкретный кластер. Далее используется один из описанных методов формирования выборки. К сожалению, метод выборочной решетки не учитывает административные, естественные (реки, улицы и т.п.) и другие границы.
В основе всех описанных методов лежит предположение, что любая совокупность характеризуется симметричным распределением ее ключевых характеристик. Другими словами, каждая выборка достаточно полно характеризует всю совокупность, различные крайности в выборке уравновешивают друг друга. Но такая ситуация на практике встречается крайне редко. Скажем, исследуется рыночный потенциал определенного региона для какого-то товара. Население больших, средних и малых городов, сельской местности данного региона отличается по уровню образования, дохода, образу жизни и т.п.
В случае несимметричного распределения совокупности последняя разделяется на различные подгруппы (страты), например по уровню доходов, и выборки формируются из этих подгрупп, по сути дела являющихся сегментами рынка. Такой метод носит название стратифицированного отбора.
При использовании данного метода прежде всего следует выбрать некоторую наблюдаемую характеристику (признак), характеризующую каждую единицу совокупности, например уровень дохода.
Далее для каждой страты с помощью случайного отбора формируется выборка.
Если размер выборки для определенной страты пропорционален размеру страты по отношению ко всей совокупности, то выборка называется пропорционально стратифицированной. В случае непропорционально стратифицированной выборки необходимо использовать весовые коэффициенты, уравновешивающие размеры страт.
При применении невероятностных методов отбора формирование выборки осуществляется без использования понятий теории вероятностей, вследствие чего невозможно рассчитать вероятность включения в выборку единицы совокупности.
Кратко охарактеризуем следующие невероятностные методы отбора: отбор на основе принципа удобства, отбор на основе суждений, формирование выборки в процессе обследования и формирование выборки на основе квот.
Смысл метода отбора на основе принципа удобства заключается в том, что формирование выборки осуществляется самым удобным с позиций исследователя образом, например, с позиций минимальных затрат времени и усилий, с позиции доступности респондентов. Выбор места исследования и состава выборки производится субъективным образом, например, опрос покупателей осуществляется в магазине, ближайшем к месту жительства исследователя. Очевидно, что многие представители совокупности не принимают участия в опросе.
Данный метод скорее применяется для поиска респондентов с заданными характеристиками. Например, в универсаме путем первоначального задания вопросов выявляется, что из себя представляют опрашиваемые и только некоторые из их числа подвергаются дальнейшему обследованию. Данный метод является дешевым и простым, и существуют методы оценки ошибки формирования выборки при его использовании, которые будут рассмотрены ниже.
Формирование выборки на основе суждения основано на использовании мнения квалифицированных специалистов, экспертов относительно состава выборки. На основе такого подхода часто формируется состав фокус-группы. Например, изучается потребность в издании кулинарной книги для приготовления в микроволновой печи низкокалорийной пищи. На основе мнения исследователей в состав фокус-группы было включено 12 домохозяек; шестеро из них владело микроволновыми печами более трех лет, трое — менее трех лет и трое только собирались их купить. По мнению исследователей, такой состав группы достаточно полно соответствует целям проводимого исследования. Результаты работы фокус-группы были признаны удовлетворительными; они послужили основой для крупномасштабных региональных опросов, проведенных на основе вероятностных методов.
Формирование выборки в процессе опроса основано на расширении числа опрашиваемых на основе предложений респондентов, которые уже приняли участие в обследовании. Первоначально исследователь формирует выборку намного меньшую, чем требуется в проводимом исследовании, затем она по мере проведения обследования расширяется. Данный метод применяется там, где контуры выборки являются очень ограниченными, например, при проведении маркетинговых исследований продукции производственно-технического назначения.
Формирование выборки на основе квот (квотный отбор) предполагает предварительное, исходя из целей исследования, определение численности групп респондентов, отвечающих определенным требованиям (признакам). Например, в целях исследования было принято решение, что в универсаме должно быть опрошено пятьдесят мужчин и пятьдесят женщин. Интервьюер проводит опрос, пока не выберет установленную квоту. Такой метод обычно применяется в случае, когда имеется четкое суждение о характеристиках респондентов, мнение которых целесообразно изучить в проводимом исследовании. Он дает возможность контролировать деятельность интервьюеров, ограничивая выбор респондентов определенными требованиями.
На практике имеет место параллельное использование нескольких методов формирования выборки. Так, формирование выборки для оценки мнения населения России относительно различных марок какого-либо товара, например холодильника, может осуществляться по следующей схеме [11]:
1. Россия, согласно ее административно - территориальному делению, делится на 89 субъектов Федерации.
2. Осуществляется случайным образом выбор девяти субъектов (исключая Москву и С.-Петербург).
3. Все населенные пункты (исключая Москву и С.-Петербург) в зависимости от численности населения делятся на шесть групп: до 1000 жителей, от 1000 до 10 000 (поселки), от 10 000 до 100 000, от 100 000 до 500 000, свыше 500 000 (города). Москва и С.-Петербург исследуются отдельно.
4. На основе квотного метода устанавливается, что для каждого из девяти выбранных субъектов Федерации исследуются три города и два поселка (по крайней мере, по одному населенному пункту из этих двух типов поселков и трех типов городов должно принадлежать каждой категории). Для этого берется каждый пятый населенный пункт из справочника Госкомстата «Численность населения Российской Федерации по городам, рабочим поселкам и районам на 1 января 1993 г.» и определяется, в какую из категорий он попадет (систематический отбор). Так поступают до тех пор, пока не наберется нужное количество населенных пунктов.
Если, дойдя до конца списка, не будет найдено квотное число населенных пунктов, процесс выбора населенных пунктов начинается сначала, но берется каждый четвертый населенный пункт, и т.д.
5. Выбирается случайным образом в каждом выбранном городе и поселке по меньшей мере 20 респондентов.
Таким образом, кроме Москвы и С.-Петербурга должно быть проинтервьюировано 900 респондентов. В Москве и С.-Петербурге опрашивается по 50 респондентов. В итоге должно быть проинтервьюировано 1000 респондентов.
4.11.2. Этапы разработки выборочного плана
Рассмотренные выше понятия выстраиваются в определенную логическую последовательность отдельных шагов (этапов) по разработке выборочного плана, целью которого является получение конечного варианта выборки. Можно выделить следующие этапы разработки выборочного плана:
1. Определение соответствующей совокупности.
2. Получение «списка» совокупности.
3. Проектирование выборочного плана.
4. Определение методов доступа к совокупности.
5. Достижение нужной численности выборки.
6. Проверка выборки на соответствие требованиям.
7. В случае необходимости формирование новой выборки.
Кратко охарактеризуем отдельные этапы разработки выборочного плана.
На первом этапе определяется целевая совокупность, определяемая целями исследования. Четко устанавливаются характеристики, которым должны удовлетворять единицы совокупности и которые дают возможность отличить целевую совокупность от других возможных совокупностей.
На втором этапе устанавливается, откуда может быть получен перечень единиц совокупности. Это нужно для установления контура выборки. Здесь используются соответствующие справочники, данные переписи населения и местных органов власти, материалы различных консультационных организаций.
На данном этапе также необходимо оценить ошибку контура выборки. Для этого необходимо: 1. Определить, насколько список людей (юридических лиц), включенных в контур выборки, отличается от совокупности в целом. 2. Установить, какой контингент людей не вошел в состав контура выборки.
Обычно ответы на начальные вопросы вопросника дают возможность идентифицировать опрашиваемых и установить, входят ли они в состав изучаемой совокупности. Далее, если исследователь не может установить причины, по которым невключение в контур выборки определенных единиц совокупности негативно влияет на состав окончательной выборки, то ошибка контура выборки считается допустимой.
Например, в городе автосервисная компания изучает мнение водителей относительно содержания определенного ремонтного набора для автомобиля. Было принято, что наиболее полным списком совокупности является список автовладельцев, имеющийся в городской ГАИ. Однако не все новые жильцы—автовладельцы зарегистрировали автомобили в положенные сроки. Кроме того, услугами автосервисной компании могут пользоваться проезжие автовладельцы. Но число незарегистрированных автовладельцев скорее всего будет незначительным на фоне общего числа автовладельцев города, а вкусы и потребности проезжих автовладельцев вряд ли кардинальным образом отличаются от потребностей автовладельцев-резидентов. Поэтому в данном случае ошибку контура выборки можно считать допустимой. (Мы не рассматривали вопрос: а возможно ли в ГАИ получить данный список.)
На третьем этапе с учетом ранее выполненных работ осуществляется проектирование самой выборки. Здесь необходимо найти баланс между структурой выборки, затратами на сбор данных и объемом выборки; в деталях обсудить выборочные методы. Выборочный план должен соответствовать целям проводимого обследования и существующим ограничениям.
Определение методов доступа к совокупности обусловливается тем, кто осуществляет сбор данных. Многие маркетинговые исследования основаны на привлечении фирм, специализирующихся на сборе информации. Такие фирмы обычно имеют свои отработанные методы выхода на изучаемую совокупность. Например, фирмы, проводящие телефонное интервьюирование, имеют свои подходы к осуществлению повторных звонков в случае, если телефон был занят или на звонок никто не ответил. Это касается также числа повторных звонков по занятому номеру.
Достижение нужной численности выборки осуществляется в два этапа. Прежде всего устанавливается единица выборки, затем от этой единицы должна быть получена требуемая информация. Однако очевидно, что на ряд выбранных респондентов в силу тех или иных причин невозможно выйти и что не каждый выбранный респондент выразит желание отвечать на вопросы. Возникает проблема замены респондентов, которая может быть решена с помощью трех методов: выбор следующего по списку респондента, использование выборки больших размеров и формирование повторной выборки.
Первый метод чаще всего применяется в случае систематической выборки. Скажем, в качестве контура выборки используется телефонный справочник и необходимо опросить каждого сотого абонента. Если не удается получить ответ от первого респондента, то звонят абоненту, следующему по справочнику, и так поступают, пока не удастся получить ответы на задаваемые вопросы; только после этого осуществляется «скачок» в сто номеров.
Использование выборки больших размеров осуществляется в случае, когда заранее известен процент респондентов, не принимающих участие в опросе. Например, известно, что на письма при почтовом опросе отвечает только 20% респондентов (в ряде случаев этот процент бывает существенно меньше). Поэтому, чтобы получить окончальную выборку численностью в 200 человек, письма следует направить тысяче потенциальных респондентов.
Если процент ответов намного ниже, чем ожидалось, то контуры исходной выборки расширяются за счет дополнительных имен, найденных, скажем, случайным образом. В этом заключается смысл метода формирования повторной выборки.
Проверка выборки на соответствие требованиям может осуществляться по-разному, например, путем сравнения профиля данной выборки с профилем выборки, использованной ранее при проведении аналогичных исследований. Цель данной проверки заключается в том, чтобы убедить клиента в репрезентативности выборки.
Такая проверка может быть осуществлена только в случае, когда возможно провести сравнение данной выборки с аналогичными выборками, использованными ранее.
Формирование новой выборки осуществляется тогда, когда проверка показала, что выборка не представляет совокупность в целом. В этом случае выбираются новые респонденты, и они добавляются к ранее использованной выборке, пока не достигается удовлетворительный уровень репрезентативности.
Определение объема выборки
В реальности решение об объеме выборки является компромиссом между теоретическими предположениями о точности результатов обследования и возможностями их практической реализации, прежде всего имеются в виду затраты на проведение опроса.
Следует отметить, что объем выборки никак не влияет на репрезентативность полученных результатов. Предположим, например, что в целях изучения степени использования в России персональных компьютеров в научной работе проводился опрос на основе принципа удобства на одном из московских перекрестков. И хотя было опрошено 5000 респондентов, полученные результаты не являются репрезентативными даже для Москвы. Это обусловлено тем, что был использован невероятностный метод формирования выборки, который в данном случае применять было нельзя.
На практике используется несколько подходов к определению объема выборки. Прежде всего опишем наиболее простые.
Произвольный подход основан на применении «правила большого пальца». Например, бездоказательно принимается, что для получения точных результатов выборка должна составлять 5% от совокупности. Данный подход является простым и легким в исполнении, однако не представляется возможным установить точность полученных результатов. При достаточно большой совокупности он к тому же может быть и весьма дорогим.
Объем выборки может быть установлен исходя их неких заранее оговоренных условий. Скажем, заказчик маркетингового исследования знает, что при изучении общественного мнения выборка обычно составляет 1000—1200 человек, поэтому он рекомендует исследователю придерживаться данной цифры. В случае, если на каком-то рынке проводятся ежегодные исследования, то в каждом году используется выборка одного и того же объема. В отличие от первого подхода здесь при определении объема выборки используется известная логика, которая, однако, является весьма уязвимой. Например, при проведении определенных исследований может потребоваться точность меньше, чем при изучении общественного мнения, да и объем совокупности может быть во много раз меньше, нежели при изучении общественного мнения. Таким образом, данный подход не принимает в расчет текущие обстоятельства и может быть достаточно дорогим.
В ряде случаев в качестве главного аргумента при определении объема выборки используется стоимость проведения обследования. Так, в бюджете маркетинговых исследований предусматриваются затраты на проведение определенных обследований, которые нельзя превышать. Очевидно, что ценность получаемой информации не принимается в расчет. Однако в ряде случаев и малая выборка может дать достаточно точные результаты.
Представляется разумным учитывать затраты не абсолютным образом, а по отношению к полезности информации, полученной в результате проведенных обследований. Заказчик и исследователь должны рассмотреть различные объемы выборки и методы сбора данных, затраты, учесть другие факторы.
Объем выборки может определяться на основе статистического анализа. Этот подход основан на определении минимального объема выборки исходя из определенных требований к надежности и достоверности получаемых результатов. Он также используется при анализе полученных результатов для отдельных подгрупп, формируемых в составе выборки по полу, возрасту, уровню образования и т.п. Требования к надежности и точности результатов для отдельных подгрупп диктуют определенные требования к объему выборки в целом.
Наиболее теоретически обоснованный и корректный подход к определению объема выборки основан на расчете доверительных интервалов. Рассмотрение данного подхода начнем с краткой характеристики ряда базовых понятий математической статистики (см. подробнее, например, в [10]).
Понятие вариации характеризует величину несхожести (схожести) ответов респондентов на определенный вопрос. В более строгом плане вариацией значений какого-либо признака в совокупности называется различие его значений у разных единиц данной совокупности в один и тот же период или момент времени. Результаты ответов на вопросы опроса обычно представляются в форме кривой распределения. При высокой схожести ответов говорят о малой вариации (узкая кривая распределения) и при низкой схожести ответов — о высокой вариации (широкая кривая распределения). На рис. 4.5 приводятся кривые распределения результатов ответа на вопрос: «Сколько миль за год проходит ваш автомобиль?» для низкой и высокой вариации ответов.
6 8 12 15 17 19 20