Пример определения объема выборки при опросе потребителей одежды Нижнего Новгорода
При определении объема выборки учитывались два условия: во-первых, она должна быть “статистически значимой” для того, чтобы получить, насколько это возможно, достоверную информацию: во-вторых, ей предстояло быть достаточно “экономной”, чтобы не увеличивать стоимость маркетингового исследования и сроков его проведения.
Для определения объема выборочной совокупности использована эмпирической формула расчета объема выборки, приведенная в работе “Статистика рынка товаров и услуг”1:
,
где t - коэффициент доверия, зависящий от той вероятности, с которой можно гарантировать, что предельная ошибка выборки не превышает t-кратную среднюю ошибку (чаще всего t = 2); s2 - дисперсия изучаемого признака (определяется на основе эксперимента); D - предельная (заданная) ошибка выборки; N - число единиц в изучаемой (генеральной) совокупности.
Для осуществления расчета была определена дисперсия изучаемого признака (s2). В качестве изучаемого признака использовался средний размер (в млн. руб.) покупки. Для его определения было проведен эксперимент – пилотажное исследование, включавшее в себя наблюдение и устный опрос контрольной группы, состоящей из 50 покупателей. В результате были получены следующие данные:
Изучаемый признак | Ответы покупателей | |||||||||
Размер Покупки (млн. руб.2) (х) | №1 | №2 | №3 | №4 | №5 | №6 | №7 | №8 | №9 | №10 |
4,0 | 3,5 | 2,1 | 4,2 | 1,2 | 0,6 | 3,71 | 7,2 | 4,1 | 1,01 | |
№11 | №12 | №13 | №14 | №15 | №16 | №17 | №18 | №19 | №20 | |
1,62 | 9,5 | 3,6 | 2,72 | 2,18 | 0,8 | 1,2 | 4,7 | 4,32 | 3,48 | |
№21 | №22 | №23 | №24 | №25 | №26 | №27 | №28 | №29 | №30 | |
8,6 | 2,8 | 0,3 | 4,7 | 2,14 | 5,58 | 3,71 | 1,79 | 2,13 | 2,37 | |
№31 | №32 | №33 | №34 | №35 | №36 | №37 | №38 | №39 | №40 | |
13,68 | 0,44 | 2,41 | 3,59 | 1,08 | 2,92 | 5,07 | 0,93 | 2,36 | 1,64 | |
№41 | №42 | №43 | №44 | №45 | №46 | №47 | №48 | №49 | №50 | |
7,2 | 3,92 | 1,48 | 0,52 | 4,95 | 3,67 | 2,38 | 3,81 | 1,19 | 5,0 | |
Среднее значение размера покупки – 3,362 млн. руб. ( ) |
Дисперсия среднего размера покупки рассчитывалась по формуле:
млн. руб., (9)
где: - средний размер покупки; хi - размер покупки i-го покупателя; n - число опрошенных покупателей.
Принимая во внимание, что потенциальными потребителями являются взрослые (старше 16 лет) жители Нижнего Новгорода, а их численность по данным Нижегородского Областного комитета государственной статистики в 1996 году составила 1040030 человек, мы приняли эту цифру за объем генеральной совокупности. Предельная (заданная) ошибка выборки имеет значение 0,336 млн. руб. (10% от 3,362 млн. руб.). Отсюда численность выборки (n), рассчитанная по формуле (8), составила в конкретных цифрах:
На первый взгляд, объем выборки может показаться не очень большим. Однако это явилось неизбежным следствием достаточно высокого уровня однородности экспериментальной совокупности в пилотаже. Кроме того, многолетний опыт социологов-практиков свидетельствует, что выборка численностью 200 человек в принципе достаточна – в особенности для разведывательных (пилотажных) опросов. Она гарантирует достаточно достоверные предварительные результаты исследования. Была использована следующая система оценки надежности результатов: повышенная надежность допускает ошибку выборки до 3%, обыкновенная — до 3-10%, приближенная — от 10 до 20%, ориентировочная — от 20 до 40%.
Итак:
1. Объем выборки не влияет на репрезентативность результатов (влияет метод ее формирования)
2. Чем больше величина выборки, тем меньше ее возможная ошибка
3. Чем больше различий (гетерогенность) внутри генеральной совокупности, тем больше величина возможной ошибки выборки
4. Решение об объеме выборки является компромиссом между точностью результатов исследования и возможностями его практической реализации.
Практическое задание
Ниже приводятся четыре генеральных совокупности и контуры выборки для них.
Вариант | Генеральная совокупность | Контур выборки |
Покупатели зубной пасты (определенного региона) | Список почтовой рассылки каталогов предметов гигиены (для определенного региона) | |
Слушатели классической музыки, передаваемой местной радиостанцией | Телефонный справочник (городской) | |
Перспективные покупатели электронных записных книжек | Члены российской Ассоциации менеджеров по продажам | |
Владельцы дачных участков, использующие пленочные покрытия (определенного региона) | Зарегистрированные посетители последней выставки товаров для огородников |
Задание 1. Определите: а) членов генеральной совокупности, не вошедших в контур выборки;
б) единицы контура выборки, которые не являются частью генеральной совокупности;
в) более точный контур выборки;
Задание 2. Определите наиболее подходящий для вашего варианта метод формирования и тип выборки. Опишите процедуру выборки. Недостающие данные возьмите произвольно.
Задание 3. Возможно ли в Вашей ситуации использование многоступенчатой выборки? Если да, то каким образом? Недостающие данные возьмите произвольно.
Задание 4. Какой метод определения объема выборки Вы предпочтете и почему?
Задание 5. Что будет означать для исследователя 5% ошибка выборки?