Проблема выборки и репрезентативности

Маркетологу приходится уделять значительное внимание построению выбор­ки. Для маркетинговых исследований весьма типично подвергать опросу лишь очень небольшую часть той группы людей (генеральной совокупности), которая представляет интерес для исследователей. Она обычно составляет несколько со­тен, иногда тысячу респондентов. Поэтому исходным пунктом расчета выборки становится вопрос об определении размеров выборочной совокупности. Числен­ность выборочной совокупности зависит от двух факторов: стоимости сбора ин­формации и стремления к определенной степени статистической достоверности результатов, которую надеется получить исследователь. Конечно, даже не иску­шенные в статистике и социологии люди интуитивно понимают, что чем больше размеры выборки, т.е. чем ближе они к размерам генеральной совокупности в целом, тем более надежны и достоверны полученные данные. Однако выше мы уже говорили о практической невозможности сплошных опросов в тех случаях, когда они проводятся на объектах, численность которых превышает десятки, сотни тысяч и даже миллионы. Понятно, что стоимость выборки (включающая в себя оплату тиражирования инструментария, труда анкетеров, полевых менеджеров и операторов по компьютерному вводу) зависит от той суммы, которую готов вы­делить заказчик, и слабо зависит от исследователей. Что же касается второго фак­тора, то мы остановимся на нем чуть подробнее.

Итак, чем больше величина выборки, тем меньше возможная ошибка. Хотя необходимо отметить, что при желании увеличить точность вдвое, вам придется увеличить выборку не в два, а в четыре раза. Например, чтобы сде­лать в два раза более точной оценку данных, полученных путем опроса 400

Кудяков В.А. Анкетирование в системе маркетинговых исследований // http://www.bma.ru/lib/lib 10.htm

человек, вам потребуется опросить не 800, а 1600 человек. Впрочем, вряд ли любое маркетинговое исследование испытывает нужду в 100%-ной точнос­ти. Если пивовару необходимо узнать, какая часть потребителей пива пред­почитает его марку, а не пиво конкурента, — 60 или 40%, то на его планы ни­как не повлияет разница между 57, 60 или 63%.

Определение объема выборки зависит также от уровня доверительного интервала допустимой статистической ошибки. Здесь имеются в виду так называемые случайные ошибки, которые связаны с природой любых стати­стических погрешностей10.

Ошибка выборки может зависеть не только от ее величины, но и от сте­пени различий между отдельными единицами внутри генеральной совокуп­ности, которую мы исследуем. Например, если нам нужно узнать, какое ко­личество пива потребляется, то мы обнаружим, что внутри нашей генераль­ной совокупности нормы потребления у различных людей существенно различаются (гетерогенная генеральная совокупность).В другом случае мы будем изучать потребление хлеба и установим, что у разных людей оно раз­личается гораздо менее существенно (гомогенная генеральная совокупность). Чем больше различия (или гетерогенности) внутри генеральной совокупно­сти, тем больше величина возможной ошибки выборки. Собственно, указан­ная закономерность лишь подтверждает то, что нам подсказывает простой здравый смысл. Таким образом, как справедливо утверждает В. Ядов, «чис-

Врезка

Выборка репрезентативна?

Некоторые маркетинговые фирмы вместо ука­зания величины выборки часто озвучивают ло­зунг: «Информация достоверна, поскольку вы­борка репрезентативна». В подтверждение при­водится пример: по контрольному показателю, т.е. по полу, получили количество мужчин, рав­ное 46% плюс-минус 1,2%. Значит, выборка репрезентативна, и данные очень высокого ка­чества. Но основная информация, полученная в результате исследования, вовсе не соответству­ет уровню 46%, 50 или 70% от опрошенных. Иногда она характеризуется уровнем 5-10%. А на этом уровне очень велика взаимосвязь меж­ду величиной выборки и точностью получаемых результатов. Для того чтобы определить долю мужчин в популяции, достаточно опросить 100 человек. А вот чтобы определить, сколько муж­чин носят усы и сотовый телефон — уже пона­добится опросить 1000, 2000 или даже 3000 человек. Поэтому такие горе-исследователи иногда вводят заказчика в заблуждение, руча­ясь за точность данных, полученных на недоста­точном количестве опрошенных. Мы всегда пользуемся таблицей доверительных интервалов, отражающей числовые промежут­ки, в пределах которых с 95%-ной вероятностью

находятся истинные значения результатов. Ког­да речь идет о маленьких долях, т.е. о дробле нии выборки на множество категорий в зависи мости от полученных ответов, например, npi> составлении различных рейтингов, то первук тройку-пятерку лидеров получить просто. Ест

проблема выборки и репрезентативности - student2.ru

же нужны данные о второй, третьей десятке, т< следует делать выборку гораздо больше. Ина че погрешность превысит само значение, flpi составлении проекта каждого исследования пс этой таблице определяется необходимая вели чина выборки в зависимости от поставленны задач. В одних случаях — наиболее простых -достаточно опроса 100 компаний, в других, бо лее сложных, их требуется 500 или 1000, а то i больше.

Источник: Как проводятся маркетинговые исследо вания // http://www.ci.ru/inform6_98/toy_opin.htm

Паниотто В.И., Максименко B.C. Количественные методы в социологических исследованиях. Киег 1982. С. 81.

ленность (объем) выборки зависит от уровня однородности или разнород­ности изучаемых объектов. Чем более они однородны, тем меньшая числен­ность может обеспечить статистически достоверные выводы»''.

Определение объема выборки зависит также от уровня доверительного интервала допустимой статистической ошибки. Здесь имеются в виду так называемые случайные ошибки, которые связаны с природой любых стати­стических погрешностей. В.И. Паниотто приводит следующие расчеты реп­резентативной выборки с допущением 5%-ной ошибки12 (табл. 7):

Таблица 7 Расчеты репрезентативной выборки

Объем генеральной совокупности 100 000
Объем выборки

Это означает следующее. Если вы, опросив, предположим, 400 человек в районном городе, где численность взрослого платежеспособного населения составляет 100 тыс. человек, выявили, что 33% опрошенных покупателей предпочитают продукцию местного мясокомбината, то с 95%-ной13 вероят­ностью можете утверждать, что постоянными покупателями этой продукции являются 33(±5)% (т.е. от 28 до 38%) жителей этого города.

Можно также воспользоваться расчетами института Гэллапа для оценки соотношения размеров выборки и ошибки выборки (табл. 8):

Таблица 8 Отношение между размером выборки и ошибкой выборки по Гэллапу

Размер выборки Интервал доверия, %
+2
±3
±4
+5
±6
±8
±11

Следует выделить наиболее существенные ошибки, которые допускают маркетологи при сборе первичных данных:

♦ при планировании маркетингового исследования нечетко сформулиро­ваны цели и задачи, вследствие чего получено большое количество несуще­ственной информации, затрудняющей принятие правильного маркетинго­вого решения;

Ядов В.А. Социологическое исследование. С. 72. 12 Паниотто В.И., Максименко B.C. Количественные методы в социологических исследованиях. Киев, 1982. С. 81.

Уровень уверенности в 95% — это условие, используемое социологами: оно показывает 95% уверен­ности в том, что параметр популяции попадает в пределы допуска ошибки выборочной статистики.

♦ в период подготовки исследования ошиблись в выборе метода (телефон ный опрос, анкетирование и т.д.). Такого рода ошибка может привести i тому, что потенциальные потребители ответят на ограниченный круг воп росов, у них не будет возможности высказаться по другим, не менее важным с их точки зрения, вопросам;

♦ маркетологи ошиблись в выборе объекта исследования. Фирма, котора; планирует реализацию своей продукции непосредственно потребителю, оп росила менеджеров оптовых фирм, чьи взгляды могут значительно отличать ся от мнения покупателей. Таким образом, при экономии средств, выражаю щейся в меньшем количестве интервьюируемых оптовиков, фирма може-понести потери, серьезно превышающие затраты, необходимые на организа цию опроса значительно большего количества рядовых потребителей;

♦ ошибка при составлении выборки (круга опрашиваемых), на основа нии которой выбиралась стратегия продаж. Например, недостаточная реп­резентативность выборки (по регионам, сегментам рынка и т.д.), ее мальп объем (некорректно делать выводы о рейтинге предпочтений потребителе]; на всем рынке на основании 10—20 анкет);

♦ вопросы, предложенные респондентам, были либо некорректны, либс сложны для понимания; в этом случае возможно снижение интереса к анке те и повышение вероятности сбора поверхностной информации;

♦ на этапе анализа данных были сделаны ошибки в ходе их интерпрета­ции, а следовательно, и при формировании дальнейшей стратегии фирмы|4

Врезка _____

Наши рекомендации