Выделение объектов генеральной совокупности
Генеральная совокупность— это множество всех единиц, являющихся объектами исследования.
На этом этапе подготовки исследования необходимо определить, какие субъекты составляют исследуемую генеральную совокупность
Определение метода обследования.В зависимости от объема генеральной совокупности ицелей исследования могут быть использованы методы сплошного или выборочного обследования.
Метод сплошного обследованиязаключается в изучении всех единиц генеральной совокупности. Метод связан с высокими затратами на проведение исследования, его использование оправдано, например, в случае малого количества потребителей, представляющих сегмент, или в случае, когда объем покупок данного клиента составляет значительную долю от емкости рынка в целом.
Выборка— это группа объектов исследования, которая является носителем характеристик всех единиц генеральной совокупности, например группа потребителей, представляющих интересы и вкусы всего целевого рынка.
Метод выборочного обследованияпредоставляет информацию о генеральной совокупности на основании обследования только ее части, поэтому данные, полученные в ходе выборочного обследования, имеют вероятностный характер.
Процедуры формирования выборки. Процедура составления выборки— это последовательность отбора респондентов в выборку.
Отбор респондентов может сопровождаться систематическими и случайными ошибками. Систематические ошибкивозникают при неправильно выбранной процедуре составления выборки. Случайные ошибкисуществуют всегда, поскольку связаны с влиянием сложно-предсказуемых факторов.
Неслучайные процедуры формирования выборки Неслучайныепроцедуры составления выборки самим процессом формирования предполагают неслучайный выбор респондентов, чье мнение может отличаться от мнения генеральной совокупности в целом, порождая тем самым наличие неслучайной (систематической) ошибки данных в результатах исследования. При использовании неслучайных процедур отбор респондентов в выборку производится на основе каких-либо принятых условий, ограничивающих круг вероятных участников исследования. Например, в выборку отбираются только те респонденты, которые владеют компьютером или зашли в магазин с 10 до 11 часов.
Возможны следующие виды неслучайных выборок:
• произвольная выборка — элементы выбираются без плана, бессистемно; способ недорог и удобен, но порождает неточность и нерепрезентативность;
• типовая выборка — набор ограничен лишь характерными (типичными) элементами генеральной совокупности; используется, например, при формировании фокус-групп; требует, однако, наличия сведений о типичности изучаемых объектов;
• квотированная выборка — структура выборки строится по аналогии с распределением определенных признаков в генеральной совокупности; от каждой группы генеральной совокупности отбираются участники исследования, количество которых пропорционально представительству группы в генеральной совокупности.
Случайные процедуры формирования выборки.При формировании случайной выборкиприменяют следующие процедуры.
• простая выборка — элементы выбираются с помощью случайных чисел; при данном подходе предполагается, что для всех единиц генеральной совокупности вероятность быть избранной в выборочную совокупность одинакова (значение вероятности равняется отношению объема выборки к объему генеральной совокупности. Метод очень трудоемок и обязывает иметь список всех единиц генеральной совокупности;
• систематическая (механическая) выборка — первый элемент выбирается с помощью случайных чисел, остальные элементы выборки отбираются через равные интервалы (интервал скачка
Многоступенчатые выборки.Любой тип выборки может быть как одно-, так и многоступенчатым. Многоступенчатая выборка применяется в тех случаях, когда извлечь выборку из генеральной совокупности прямым путем затруднительно, при этом все единицы отбора на каждой ступени равноценны для обследования.
Многоступенчатый отбор, соединяющий различные процедуры формирования выборки, делает выборку комбинированной.
Стратифицированная (типическая или групповая) выборка — генеральная совокупность делится на группы с набором определенных признаков (сегменты или страты), в каждой из которой с помощью случайного отбора формируется своя выборка; весовой коэффициент каждой страты в общем объеме выборки соответствует ее удельному весу в генеральной совокупности;
Определение объема выборки. Определение размера выборки является некоторым компромиссом между теорией о точности результатов исследования и возможностью ее практической реализации по объему затрат на сбор информации.
Наиболее применимы следующие методы определения объема выборки:
1. Произвольный метод расчета; в этом случае объем выборки определяется на уровне 5-10 % от генеральной совокупности.
2. Традиционный метод расчета; связан с проведением периодических ежегодных исследований, охватывающих, например, 500, 1000 или 1500 респондентов.
3. Статистический метод расчета; основывается на определении статистической надежности информации.
4. Метод расчета с помощью номограмм.
5. Эмпирический метод; в этом случае выборка считается достаточной, когда все новые сведения вносят лишь незначительные изменения (которыми можно пренебречь) в уже собранные результаты исследования.
6. Затратный метод; основан на размере расходов, которые допустимо затратить на проведение исследования.
Статистический метод расчета объема выборки
На объем статистической выборки влияют следующие факторы:
1. Наличие сведений об объеме генеральной совокупности и степени ее однородности.
2. Требуемая точность результатов, регулируемая величиной максимально допустимой ошибки репрезентативности и величиной доверительной вероятности, с которой делается заключение о достоверности результатов исследования.
3. Наличие сведений о средних показателях генеральной совокупности по исследуемому признаку или об интервале варьирования признака(дисперсии).
4. Возможность повторного попадания единицы генеральной совокупности в выборку.
При определении объема выборки для больших совокупностей (когда объем выборки составляет менее 5% генеральной совокупности) могут использоваться следующие формулы:
а) повторная выборка (при возможности повторного попадания единицы генеральной совокупности в выборку) при неизвестном объеме генеральной совокупности, но известном распределении контролируемого признака:
где t — нормированное отклонение, которое определяется по выбранному уровню доверительной вероятности (при 95% доверительной вероятности t = 1,96; при 99% доверительной вероятности t = 2,58); р — найденная вариация генеральной совокупности, в % или в долях; q = 100 - р; Д — допустимая ошибка, в % или в долях;
б) повторная выборка при известной дисперсии изучаемого признака (о):
в) бесповторная выборка (при исключении возможности повторного попадания единицы генеральной совокупности в выборку) при известном объеме генеральной совокупности и известном распределении контролируемого признака:
где N — объем генеральной совокупности;
г) бесповторная выборка при известной дисперсии изучаемого признака:
Выборка признается малой, если ее объем превышает 5% генеральной совокупности, в этом случае объем выборки может быть откорректирован:
где п — объем выборки для малой совокупности, п — объем статистической выборки, N — объем генеральной совокупности.
Расчет статистической выборки при нормированном отклонении t = 2 и допустимой ошибке 5% (см. табл. 4.2) показывает, что для больших совокупностей объем выборки может быть определен любым способом, поскольку используемые практические приемы приводят скорее к завышению объема обследуемой совокупности.
Использование номограмм для расчета объема выборки
Стремление упростить процедуру расчета объема выборки приводит к созданию таблиц, шкал или программ, которые ориентированы на обеспечение статистической надежности информации, но при этом не обременяют пользователя знаниями специальных формул из области статистики. Например, существует калькулятор выборки (www. shortway. to/few/calculator, htm), на сайте Gallup (www. gallup. ru) можно найти таблицу, связывающую показатели размера выборки, распределения ответов с величиной стандартной ошибки
Номограмма является графическим способом определения размера выборки. Номограмма включает три шкалы
На шкале слева устанавливается разметка показателя среднеквадратического отклонения или распределения доли признака. На правой шкале наносится разметка точности измерения в виде допустимой ошибки (половины интервала) при заданной доверительной вероятности 95 или 99%. На средней шкале делается разметка, соответствующая
требуемому объему выборки. На правой и левой шкалах делаются отметки на уровне желаемых значений показателей (доли признака и допустимой ошибки). Линейкой эти две отметки соединяются, на пересечении линейки со средней шкалой делается отметка, соответствующая тому объему выборки, который отвечает пожеланиям исследователя.