Виды, методы и способы отбора

Выборочная совокупность будет полно и адекватно отражать свойства генеральной совокупности в том случае, если она будет репрезента­тивной (представительной). Репрезентативность выборки зависит от применяемых видов, методов и способов отбора единиц.

Достоверность результатов наблюдения достигается за счет соблюдения основного принципа выборочного наблюдения: обеспечение случайности отбора единиц (равная возможность единиц попасть в выборку)

В теории выборочного наблюдения разработаны различные виды, методы и способы отбора единиц из генеральной совокупности.

Различают два вида отбора единиц в выборочную совокупность: по­вторный и бесповторный.

При повторном отбореотобранная единица подвергается обследованию, возвращается в генеральную совокупность и снова может быть выбранной («схема возвратного шара»). В результате вероятность попадания отдельной единицы в выборку не меняется независимо от числа отобранных единиц. На практике такой отбор применяется, когда объем генеральной совокупности не известен и теоретически возможно повторение единиц с уже встречавшимися значениями регистрируемых признаков (например, в маркетинговых исследованиях). В социально-экономических исследованиях повторный отбор встречается редко.

При бесповторном отбореотобранная единица подвергается обследованию и в дальнейшей процедуре отбора не участвует («схема безвозвратного шара»). Тем самым, вероятность попасть в выборку для оставшихся единиц увеличивается с каждым шагом отбора. Такой вид отбора практически возможен, когда объем генеральной совокупности четко определен.

В ходе выборочного наблюдения могут применяться следующие способы отбора единиц из генеральной совокупности:

§ индивидуальный отбор - в выборку отбираются отдельные единицы совокупности;

§ групповой отбор - в выборку попадают качественно однород­ные группы или серии единиц;

§ комбинированный отбор – сочетание индивидуального и группового способов отбора.

Выборочная совокупность может быть сформирована с помощью следующих методов отбораединиц:

1. случайный (собственно-случайный);

2. механический;

3. типический (расслоенный, стратифицированный);

4. серийный (гнездовой);

5. комбинированный.

Приведем краткую характеристику этих методов отбора единиц.

Собственно-случайный (случайный) отбор – индивидуальный отбор единиц, каждой из которых присвоен порядковый номер, с помощью жеребьевки или таблицы случай­ных чисел (Приложение 3). Генеральная совокупность предварительно не разделяется на какие-либо группы. Условием репрезентативности выборки служит принцип случайности (равная возможность каждой единицы попасть в выборку). Собственно-случайная выборка может осуществляться по схемам повторного и бесповторного обора (например, проведение тиражей денежно-вещевой лотереи).

Механический отбор – отбор из предварительно упорядоченной и разбитой на равные интервалы (группы) генеральной совокупности. Размер ин­тервала равен обратной величине доли выборки. Например, при 5 % - ной выборке отбирается каждая 20-я единица (1/0,05), при 10 %-ной выборке - каждая 10-я единица (1/0,1) и т.д. В результате, генеральная совокупность как бы механически разбивается на равновеликие группы. Из каждой группы в выборку отбирается лишь одна единица. При этом отбор начинается не с первой единицы совокупности, а с се­редины первого интервала. Для обеспечения репрезентативности все единицы генеральной сово­купности должны располагаться в определенном порядке. Механический отбор всегда бывает бесповторным. Он имеет преимущество перед случайным отбором, т.к. его легче организовать.

Типический отбор(расслоенный, стратифицированный) – неоднородная генеральная совокупность вначале разбивается на качественно однородные типические группы (не обязательно равные). Затем из каждой группы производится индивидуальный отбор случайным или механическим методом. Типическая выборка применяется при изучении сложных статистических совокупностей и дает более точные результаты по сравнению с другими методами отбора. В частности, случайная ошибка при типическом отборе меньше, чем при собственно-случайном и механическом отборе. Это объясняется тем, что имевшееся соотношение между группами единиц генеральной совокупности, сохраняется и в выборочной совокупности. Типический отбор бывает повторным и бесповторным.

Из каждой типической группы в выборочную совокупность можно отбирать определенное число единиц с помощью следующих разновидностей типического отбора:

1. пропорциональный типический отбор – число единиц выборки n пропорционально удельному весу каждой группы в генераль­ной совокупности: Виды, методы и способы отбора - student2.ru

где: Виды, методы и способы отбора - student2.ru - объем выборки из Виды, методы и способы отбора - student2.ru - ой типической группы;

Виды, методы и способы отбора - student2.ru - объем Виды, методы и способы отбора - student2.ru - ой типической группы в генеральной совокупности.

2. непропорциональный типический отбор - число единиц выборки непропорционально удельному весу каждой группы в гене­ральной совокупности:

Виды, методы и способы отбора - student2.ru ,

где Виды, методы и способы отбора - student2.ru - число выделенных типических групп.

3. отбор с учетом вариации признака -число единиц выборки пропорционально удельному весу в генеральной совокупно­сти с учетом вариации признака по группам:

- для средней Виды, методы и способы отбора - student2.ru , где Виды, методы и способы отбора - student2.ru - среднее квадратическое отклонение i – й группы;

- для доли Виды, методы и способы отбора - student2.ru

Серийный (гнездовой)отбор – это отбор, при котором в случайном порядке отбираются не отдельные единицы, а целые группы единиц (серии, гнезда), которые подвергаются сплошному наблюдению. Отбор отдельных серий осуществляется на основе случайного или механического метода. Серийный отбор применяется в том случае, если генеральная совокупность разбита на группы еще до начала выборочного наблюдения. На практике чаще применяется бесповторный отбор с равными сериями. Ошибка серийной выборки больше, чем при другом методе отбора. Но серийный отбор обладает организационными преимуществами, поэтому довольно часто применяется на практике. Серийную выборку применяют в двух случаях: 1) все серии имеют одинаковое количество единиц; 2) серии различны по объему. Серийный отбор обеспечивает экономию средств, если об­следования распространяются на обширную территорию и гнезда­ми являются территориальные единицы.

В рассмотренных выше методах осуществлялся одноступенчатый и много­ступенчатый отбор единиц в выборочную совокупность.

При одноступенчатой выборке каждая отобранная едини­ца сразу же подвергается изучению по заданному признаку (собственно-случайный и серийный отбор).

При многоступенчатой выборке применяется несколько ста­дий (ступеней) отбора. Производят отбор отдельных групп из ге­неральной совокупности, затем из групп выби­раются отдельные единицы (механический отбор). При этом каждая стадия имеет свою еди­ницу отбора. Число ступеней определяется числом типов единиц отбора. Например, на последней ступени единица отбора совпадает с едини­цей выборки. Ошибка всей выборки складывается из ошибок на отдельных ступенях отбора.

При построении многоступенчатой выборки используется комбинация разных методов отбора, поэтому такой метод отбора иногда называют комбинированной выборкой.

От многоступенчатого отбора следует отличать многофазный отбор. В отличие от многоступенчатого отбора, он предполагает сохранение одной и той же единицы отбора на всех этапах его проведения. При этом отобранные на каждой стадии единицы подвергаются обследованию по более широкой программе. Многофазная выборка используется для расширения программы обследования.

Особым видом выборочного наблюдения явления моментное наблюдение, т.е. выборочное наблюдение во времени. При этом все единицы изучаемой совокупности подлежат сплошному учету: объектами выборки служат отрезки времени. Поэтому понятия генеральной и выборочной совокупности относятся не к совокупности единиц, а ко времени наблюдения.

Ошибки выборки

Выборочное наблюдение носит несплошной характер, поэтому оно сопровождается ошибками (погрешностями).

Ошибки выборочного наблюдения возникают в двух случаях: 1. при сборе данных (ошибки регистрации); 2. в результате неполного учета единиц генеральной совокупности (ошибки репрезентативности).

Таким образом, любому выборочному наблюдению свойственна ошибка репрезентативности - расхождение между характеристиками выборочной и генеральной совокупности (рис 7.1).

Виды, методы и способы отбора - student2.ru

Рис 7.1. Виды ошибок репрезентативности

Ошибка репрезентативности возникает в результате того, что вы­борочная совокупность не полностью отражает закономерности, присущие генеральной совокупности. Величина случайной ошибки репрезентативности зависит:

1) от объема выборки;

2) от степени вариации признака в генеральной совокупности;

3) от метода отбора единиц и т.д.

По данным выборочной совокупности оценивают показатели (параметры) генеральной совокупности. Например, используют оценку 2-х параметров:

- генеральной средней величины изучаемого признака (для количественного признака);

- генеральной доли (для альтернативного признака).

Теоретическое обоснование появления случайных ошибок выборки объясняют предельные теоремы теории вероятностей. Так как случайная ошибка выборки возникает в результате случайных различий между границами выборочной и генераль­ной совокупностей, то при достаточно большом объеме выборки эта ошибка будет сколь угодно мала. Поэтому характеристики выборки могут достаточно хорошо представлять характеристики генеральной совокуп­ности. Случайные ошибки могут быть доведены до незначительных размеров, что позволит определить их размеры и пределы с достаточной степенью точности на основании закона больших чисел.

Выборочное распределение средней величины будет прибли­жаться к нормальному распределению по мере увеличения объема выборки Виды, методы и способы отбора - student2.ru , незави­симо от характера распределения генеральной совокупности. С увеличением численности выборки Виды, методы и способы отбора - student2.ru величина выборочной средней Виды, методы и способы отбора - student2.ru приближается к генеральной средней Виды, методы и способы отбора - student2.ru .

Одной из задач выборочного метода является определение ошибок выборки, т.е. возможных расхождений характеристик совокупностей:

1) между выборочной средней ( Виды, методы и способы отбора - student2.ru )и генеральной средней ( Виды, методы и способы отбора - student2.ru );

2) между выборочной долей еди­ниц Виды, методы и способы отбора - student2.ru , обладающих изучаемым признаком, и генеральной до­лей (р).

Методы математиче­ской статистики позволяют измерить эти ошибки и указать границы их колеблемости. Величину ошибок можно оценить по формулам:

Виды, методы и способы отбора - student2.ru ; Виды, методы и способы отбора - student2.ru .

В статистике различают три вида ошибок выборки:

- средняя ошибка Виды, методы и способы отбора - student2.ru ;

- предельная ошибка Виды, методы и способы отбора - student2.ru ;

- относительная ошибка Виды, методы и способы отбора - student2.ru .

Вид формулы средней ошибки выборки зависит от метода отбора. Рассмотрим порядок расчета ошибок выборки при собственно-случайном отборе.

Средняя ошибка выборки Виды, методы и способы отбора - student2.ru -характеризует среднюю величи­ну возможных расхождений выборочных (средняя Виды, методы и способы отбора - student2.ru , доля Виды, методы и способы отбора - student2.ru ) и генеральных характеристик (средняя Виды, методы и способы отбора - student2.ru , доля Виды, методы и способы отбора - student2.ru ) совокупности. Представляет собой среднее квадратическое отклонение возможных значений характеристик выборочной совокупности от характеристик генеральной совокупности.

Рассмотрим формулы средней ошибки выборки Виды, методы и способы отбора - student2.ruдлясредней Виды, методы и способы отбора - student2.ru и долиВиды, методы и способы отбора - student2.ruпри повторном и бесповторном отборе:

1. При повторном отборе:

1.1. Средняя ошибка выборочной средней Виды, методы и способы отбора - student2.ru :

Виды, методы и способы отбора - student2.ru

1.2. Средняя ошибка выборочной доли Виды, методы и способы отбора - student2.ru :

Виды, методы и способы отбора - student2.ru

2. При бесповторном отборе:

2.1. Средняя ошибка выборочной средней Виды, методы и способы отбора - student2.ru :

Виды, методы и способы отбора - student2.ru

2.2. Средняя ошибка выборочной доли Виды, методы и способы отбора - student2.ru :

Виды, методы и способы отбора - student2.ru

где Виды, методы и способы отбора - student2.ru - дисперсия признака в генеральной совокупности;

Виды, методы и способы отбора - student2.ru - объем выборки;

Виды, методы и способы отбора - student2.ru - выборочная доля единиц, обладающих изучаемым признаком; Виды, методы и способы отбора - student2.ru дисперсия доли (альтернативного признака).

Замечание. На практике величина дисперсии признака в генеральной совокупности Виды, методы и способы отбора - student2.ru , как правило, неизвестна. Поэтому в формулы ошибки выборки подставляют дисперсию выборочной совокупности Виды, методы и способы отбора - student2.ru . Это возможно, поскольку между дисперсиями генеральной и выборочной совокупностей существует следующая взаимосвязь:

Виды, методы и способы отбора - student2.ru

При большой численности выборочной совокупности Виды, методы и способы отбора - student2.ru сомножитель Виды, методы и способы отбора - student2.ru стремится к единице, и выборочная дисперсия Виды, методы и способы отбора - student2.ru практически совпадает с генеральной Виды, методы и способы отбора - student2.ru , т.е. Виды, методы и способы отбора - student2.ru Виды, методы и способы отбора - student2.ru Виды, методы и способы отбора - student2.ru .

Замечание. Поскольку при бесповторном отборе в ходе выборки объем генеральной совокупности Виды, методы и способы отбора - student2.ru сокращается, то в формулу для расчета средней ошибки включают дополнительный множитель Виды, методы и способы отбора - student2.ru .

Средняя ошибка выборки при собственно-случайном повторном отборе зависит от:

- объема выборки Виды, методы и способы отбора - student2.ru (обратная зависимость);

- степени вариации признака (прямая зависимость).

Чем больше вариация признака, тем больше ошибка выборки. Для ее уменьшения необходимо увеличить объем выборочной совокупности.

Формулы расчета средних ошибок Виды, методы и способы отбора - student2.ru для различных методов отбора приведены в табл. 7.2.

Таблица 7.2

Формулы средних ошибок Виды, методы и способы отбора - student2.ru для различных методов отбора

Метод отбора Оцениваемый параметр Вид отбора  
повторный бесповторный
  Собственно-случайный и механический средняя Виды, методы и способы отбора - student2.ru Виды, методы и способы отбора - student2.ru Виды, методы и способы отбора - student2.ru
доля Виды, методы и способы отбора - student2.ru Виды, методы и способы отбора - student2.ru Виды, методы и способы отбора - student2.ru
    Типический (пропорциональный) средняя Виды, методы и способы отбора - student2.ru Виды, методы и способы отбора - student2.ru Виды, методы и способы отбора - student2.ru
доля Виды, методы и способы отбора - student2.ru Виды, методы и способы отбора - student2.ru Виды, методы и способы отбора - student2.ru
    Серийный средняя Виды, методы и способы отбора - student2.ru Виды, методы и способы отбора - student2.ru Виды, методы и способы отбора - student2.ru
доля Виды, методы и способы отбора - student2.ru Виды, методы и способы отбора - student2.ru Виды, методы и способы отбора - student2.ru
Комбинированный:   - типический и серийный     - собственно-случайный и серийный     cредняя Виды, методы и способы отбора - student2.ru   Виды, методы и способы отбора - student2.ru     Виды, методы и способы отбора - student2.ru
  cредняя Виды, методы и способы отбора - student2.ru   Виды, методы и способы отбора - student2.ru   Виды, методы и способы отбора - student2.ru  
         

Условные обозначения в таблице:

Виды, методы и способы отбора - student2.ru - средняя из групповых дисперсий;

Виды, методы и способы отбора - student2.ru доля единиц i-й типической группы (серии) выборки, обладающих изучаемым признаком;

Виды, методы и способы отбора - student2.ru - средняя из групповых дисперсий для доли.

М, m – количество равных серий соответственно в генеральной и выборочной совокупностях;

Виды, методы и способы отбора - student2.ru - межгрупповая выборочная дисперсия,

где Виды, методы и способы отбора - student2.ru средняя в i-й серии; Виды, методы и способы отбора - student2.ru общая выборочная средняя;

Виды, методы и способы отбора - student2.ru - межгрупповая выборочная дисперсия доли, где Виды, методы и способы отбора - student2.ru - доля единиц, обладающих признаком в выборке. При равновеликих сериях Виды, методы и способы отбора - student2.ru Виды, методы и способы отбора - student2.ru

Следует иметь в виду, что в каждой конкретной выборке разность Виды, методы и способы отбора - student2.ru может быть меньше, больше или равна величине средней ошибки Виды, методы и способы отбора - student2.ru . Вероятность такой ошибки различна. Поэтому рассчитывают предельную ошибку выборки Виды, методы и способы отбора - student2.ru .

Предельная ошибка выборки Виды, методы и способы отбора - student2.ru - это максимально возможное расхождение характеристик выборочной (средняя Виды, методы и способы отбора - student2.ru , доля Виды, методы и способы отбора - student2.ru ) и генеральной совокупности (средняя Виды, методы и способы отбора - student2.ru , доля Виды, методы и способы отбора - student2.ru ), т.е. максимум ошибки при заданной вероятности ее появления.

Величина предельной ошибки определяется по формуле:

Виды, методы и способы отбора - student2.ru

где Виды, методы и способы отбора - student2.ru - коэффициент доверия, который определяется по таблице значений интеграла Лапласа при заданной доверительной вероятности Виды, методы и способы отбора - student2.ru Он показывает, во сколько раз предельная ошибка выборки отличается от средней ошибки.

Соответственно, формулы предельной ошибки для средней Виды, методы и способы отбора - student2.ru и доли Виды, методы и способы отбора - student2.ru , имеют вид:

Виды, методы и способы отбора - student2.ru Виды, методы и способы отбора - student2.ru

Значения интеграла Лапласа табулированы в зависимости от значений коэффициента Виды, методы и способы отбора - student2.ru (Приложение 2). Поэтому на практике пользуются готовыми таблицами значений. Приведем наиболее часто употребляемые уровни доверительной вероятности Виды, методы и способы отбора - student2.ru и соответствующие им значения Виды, методы и способы отбора - student2.ru :

Виды, методы и способы отбора - student2.ru 1,0 1,96 2,0 2,58 3,0
Виды, методы и способы отбора - student2.ru 0,683 0,950 0,954 0,990 0,997

Таким образом, предельная ошибка выборки отвечает на вопрос о точности выборки с определенной вероятностью, величина которой зависит от значения коэффициента доверия t.

Например, при t = 1 с вероятностью 0,683 можно утверждать, что расхождение между выборочными и генеральными характеристиками не превысит одной величины средней ошибки выборки, т.е. Виды, методы и способы отбора - student2.ru

При t = 2 вероятность Виды, методы и способы отбора - student2.ru =0,954, значит, в среднем 954 выборки из 1000 дадут показатели выборки (средняя Виды, методы и способы отбора - student2.ru , доля Виды, методы и способы отбора - student2.ru ), которые будут отличаться от генеральных показателей (средняя Виды, методы и способы отбора - student2.ru , доля Виды, методы и способы отбора - student2.ru ) не более чем на величину двукратной средней ошибки выборки, т.е. Виды, методы и способы отбора - student2.ru или Виды, методы и способы отбора - student2.ru

Появление ошибки в три раза большей, чем средняя ошибка выборки, маловероятно (1-0,997=0,003), и считается практически невозможным событием.

Пределы, в которых с данной вероятностью Виды, методы и способы отбора - student2.ru будет находиться неизвестная величина изучаемого показателя генеральной совокупности, называют доверительным интервалом, а вероятность Виды, методы и способы отбора - student2.ru - доверительной вероятностью.

В качестве доверительной вероятности обычно принимают значения вероятностей Р и соответствующие им уровни значимости Виды, методы и способы отбора - student2.ru (табл. 7.3)

Таблица 7.3

Соотношение между значениями доверительной вероятности Виды, методы и способы отбора - student2.ru

и уровнями значимости Виды, методы и способы отбора - student2.ru

Вероятность Виды, методы и способы отбора - student2.ru Уровень значимости Виды, методы и способы отбора - student2.ru
0,90 0,10, или 10 %
0,95 0,05, или 5 %
0,99 0,01, или 1 %

Например, 10 %-ный уровень значимости означает, что в 90 случаях из 100 характеристика генеральной совокупности, выявленная на основе выборки, будет лежать в пределах доверительного интервала. То есть, в 10 случаях из 100 существует риск совершить ошибку по выборочным данным при оценке генеральной совокупности.

Очевидно, что чем больше значение предельной ошибки Виды, методы и способы отбора - student2.ru , тем больше величина доверительного интервала, т.е. ниже точность оценки.

Формулы предельной ошибки позволяют определить:

§ доверительные интервалы, в которых будут находиться значения генеральных параметров:

- генеральная средняя: Виды, методы и способы отбора - student2.ru

- генеральная доля: Виды, методы и способы отбора - student2.ru

§ необходимую численность выборки Виды, методы и способы отбора - student2.ru , обеспечи­вающую с определенной вероятностью заданную точность наблюдения ( Виды, методы и способы отбора - student2.ru );

§ вероятность Виды, методы и способы отбора - student2.ru допуска той или иной заданный ошибки (определяется Виды, методы и способы отбора - student2.ru и находится вероятность).

Наряду с абсолютной величиной предельной ошибки выборки Виды, методы и способы отбора - student2.ru рассчитывают и относительную ошибку выборки Виды, методы и способы отбора - student2.ru .Она определяетсякак процентное отношение предельной ошибки выборки Виды, методы и способы отбора - student2.ru к соответствующей характеристике выборочной совокупности (средняя Виды, методы и способы отбора - student2.ru , доля Виды, методы и способы отбора - student2.ru ):

§ для средней Виды, методы и способы отбора - student2.ru = Виды, методы и способы отбора - student2.ru

§ для доли Виды, методы и способы отбора - student2.ru

Выборка считается репрезентативной, если Виды, методы и способы отбора - student2.ru 5 %.

Пример.В порядке случайной бесповторной выборки было обследовано n = 160 турфирм из N = 1500, и получены следующие данные об их объеме продаж за отчетный период (табл. 7.4).

Таблица 7.4

Наши рекомендации