Проблема выборки и репрезентативности
Маркетологу приходится уделять значительное внимание построению выборки. Для маркетинговых исследований весьма типично подвергать опросу лишь очень небольшую часть той группы людей (генеральной совокупности), которая представляет интерес для исследователей. Она обычно составляет несколько сотен, иногда тысячу респондентов. Поэтому исходным пунктом расчета выборки становится вопрос об определении размеров выборочной совокупности. Численность выборочной совокупности зависит от двух факторов: стоимости сбора информации и стремления к определенной степени статистической достоверности результатов, которую надеется получить исследователь. Конечно, даже не искушенные в статистике и социологии люди интуитивно понимают, что чем больше размеры выборки, т.е. чем ближе они к размерам генеральной совокупности в целом, тем более надежны и достоверны полученные данные. Однако выше мы уже говорили о практической невозможности сплошных опросов в тех случаях, когда они проводятся на объектах, численность которых превышает десятки, сотни тысяч и даже миллионы. Понятно, что стоимость выборки (включающая в себя оплату тиражирования инструментария, труда анкетеров, полевых менеджеров и операторов по компьютерному вводу) зависит от той суммы, которую готов выделить заказчик, и слабо зависит от исследователей. Что же касается второго фактора, то мы остановимся на нем чуть подробнее.
Итак, чем больше величина выборки, тем меньше возможная ошибка. Хотя необходимо отметить, что при желании увеличить точность вдвое, вам придется увеличить выборку не в два, а в четыре раза. Например, чтобы сделать в два раза более точной оценку данных, полученных путем опроса 400
Кудяков В.А. Анкетирование в системе маркетинговых исследований // http://www.bma.ru/lib/lib 10.htm
человек, вам потребуется опросить не 800, а 1600 человек. Впрочем, вряд ли любое маркетинговое исследование испытывает нужду в 100%-ной точности. Если пивовару необходимо узнать, какая часть потребителей пива предпочитает его марку, а не пиво конкурента, — 60 или 40%, то на его планы никак не повлияет разница между 57, 60 или 63%.
Определение объема выборки зависит также от уровня доверительного интервала допустимой статистической ошибки. Здесь имеются в виду так называемые случайные ошибки, которые связаны с природой любых статистических погрешностей10.
Ошибка выборки может зависеть не только от ее величины, но и от степени различий между отдельными единицами внутри генеральной совокупности, которую мы исследуем. Например, если нам нужно узнать, какое количество пива потребляется, то мы обнаружим, что внутри нашей генеральной совокупности нормы потребления у различных людей существенно различаются (гетерогенная генеральная совокупность).В другом случае мы будем изучать потребление хлеба и установим, что у разных людей оно различается гораздо менее существенно (гомогенная генеральная совокупность). Чем больше различия (или гетерогенности) внутри генеральной совокупности, тем больше величина возможной ошибки выборки. Собственно, указанная закономерность лишь подтверждает то, что нам подсказывает простой здравый смысл. Таким образом, как справедливо утверждает В. Ядов, «чис-
Врезка
Выборка репрезентативна?
Некоторые маркетинговые фирмы вместо указания величины выборки часто озвучивают лозунг: «Информация достоверна, поскольку выборка репрезентативна». В подтверждение приводится пример: по контрольному показателю, т.е. по полу, получили количество мужчин, равное 46% плюс-минус 1,2%. Значит, выборка репрезентативна, и данные очень высокого качества. Но основная информация, полученная в результате исследования, вовсе не соответствует уровню 46%, 50 или 70% от опрошенных. Иногда она характеризуется уровнем 5-10%. А на этом уровне очень велика взаимосвязь между величиной выборки и точностью получаемых результатов. Для того чтобы определить долю мужчин в популяции, достаточно опросить 100 человек. А вот чтобы определить, сколько мужчин носят усы и сотовый телефон — уже понадобится опросить 1000, 2000 или даже 3000 человек. Поэтому такие горе-исследователи иногда вводят заказчика в заблуждение, ручаясь за точность данных, полученных на недостаточном количестве опрошенных. Мы всегда пользуемся таблицей доверительных интервалов, отражающей числовые промежутки, в пределах которых с 95%-ной вероятностью
находятся истинные значения результатов. Когда речь идет о маленьких долях, т.е. о дробле нии выборки на множество категорий в зависи мости от полученных ответов, например, npi> составлении различных рейтингов, то первук тройку-пятерку лидеров получить просто. Ест
же нужны данные о второй, третьей десятке, т< следует делать выборку гораздо больше. Ина че погрешность превысит само значение, flpi составлении проекта каждого исследования пс этой таблице определяется необходимая вели чина выборки в зависимости от поставленны задач. В одних случаях — наиболее простых -достаточно опроса 100 компаний, в других, бо лее сложных, их требуется 500 или 1000, а то i больше.
Источник: Как проводятся маркетинговые исследо вания // http://www.ci.ru/inform6_98/toy_opin.htm
Паниотто В.И., Максименко B.C. Количественные методы в социологических исследованиях. Киег 1982. С. 81.
ленность (объем) выборки зависит от уровня однородности или разнородности изучаемых объектов. Чем более они однородны, тем меньшая численность может обеспечить статистически достоверные выводы»''.
Определение объема выборки зависит также от уровня доверительного интервала допустимой статистической ошибки. Здесь имеются в виду так называемые случайные ошибки, которые связаны с природой любых статистических погрешностей. В.И. Паниотто приводит следующие расчеты репрезентативной выборки с допущением 5%-ной ошибки12 (табл. 7):
Таблица 7 Расчеты репрезентативной выборки
Объем генеральной совокупности | 100 000 | |||||||
Объем выборки |
Это означает следующее. Если вы, опросив, предположим, 400 человек в районном городе, где численность взрослого платежеспособного населения составляет 100 тыс. человек, выявили, что 33% опрошенных покупателей предпочитают продукцию местного мясокомбината, то с 95%-ной13 вероятностью можете утверждать, что постоянными покупателями этой продукции являются 33(±5)% (т.е. от 28 до 38%) жителей этого города.
Можно также воспользоваться расчетами института Гэллапа для оценки соотношения размеров выборки и ошибки выборки (табл. 8):
Таблица 8 Отношение между размером выборки и ошибкой выборки по Гэллапу
Размер выборки | Интервал доверия, % |
+2 | |
±3 | |
±4 | |
+5 | |
±6 | |
±8 | |
±11 |
Следует выделить наиболее существенные ошибки, которые допускают маркетологи при сборе первичных данных:
♦ при планировании маркетингового исследования нечетко сформулированы цели и задачи, вследствие чего получено большое количество несущественной информации, затрудняющей принятие правильного маркетингового решения;
Ядов В.А. Социологическое исследование. С. 72. 12 Паниотто В.И., Максименко B.C. Количественные методы в социологических исследованиях. Киев, 1982. С. 81.
Уровень уверенности в 95% — это условие, используемое социологами: оно показывает 95% уверенности в том, что параметр популяции попадает в пределы допуска ошибки выборочной статистики.
♦ в период подготовки исследования ошиблись в выборе метода (телефон ный опрос, анкетирование и т.д.). Такого рода ошибка может привести i тому, что потенциальные потребители ответят на ограниченный круг воп росов, у них не будет возможности высказаться по другим, не менее важным с их точки зрения, вопросам;
♦ маркетологи ошиблись в выборе объекта исследования. Фирма, котора; планирует реализацию своей продукции непосредственно потребителю, оп росила менеджеров оптовых фирм, чьи взгляды могут значительно отличать ся от мнения покупателей. Таким образом, при экономии средств, выражаю щейся в меньшем количестве интервьюируемых оптовиков, фирма може-понести потери, серьезно превышающие затраты, необходимые на организа цию опроса значительно большего количества рядовых потребителей;
♦ ошибка при составлении выборки (круга опрашиваемых), на основа нии которой выбиралась стратегия продаж. Например, недостаточная репрезентативность выборки (по регионам, сегментам рынка и т.д.), ее мальп объем (некорректно делать выводы о рейтинге предпочтений потребителе]; на всем рынке на основании 10—20 анкет);
♦ вопросы, предложенные респондентам, были либо некорректны, либс сложны для понимания; в этом случае возможно снижение интереса к анке те и повышение вероятности сбора поверхностной информации;
♦ на этапе анализа данных были сделаны ошибки в ходе их интерпретации, а следовательно, и при формировании дальнейшей стратегии фирмы|4
Врезка _____