Понятие выборочного наблюдения и способы формирования выборочных совокупностей
В практике статистики широко используется выборочный метод, при котором обобщающие показатели изучаемой совокупности устанавливаются по результатам изучения только части ее единиц. Эффективность этого метода заключается в том, что при минимальной численности обследуемых единиц проведение исследования осуществляется в более короткие сроки, с меньшими затратами труда и средств, а иногда выборочное обследование является единственно возможным (если определение характеристик связано с уничтожением или порчей продукции).
При этом вся совокупность называется генеральной, а часть ее, отобранная для обследования, - выборочной. Отбор единиц в выборочную совокупность может быть повторным и бесповторным. Повторным называется отбор, при котором каждая попавшая в выборку единица после фиксации значения изучаемого признака возвращается в генеральную совокупность и может участвовать в дальнейшем отборе. Если раз попавшая в выборку единица не возвращается в генеральную совокупность, а следовательно не участвует в дальнейшем отборе, то такой отбор будет бесповторным.
В статистике применяются различные способы формирования выборочных совокупностей.
При собственно случайной выборке отбор единиц в выборочную совокупность осуществляется по жребию. При этом для каждой единицы генеральной совокупности должна быть обеспечена равная возможность попадания в выборку.
При механической выборке отбор единиц осуществляется через строго определенный шаг из ранжированного списка единиц генеральной совокупности или из того порядка, в котором они фактически размещаются. Например, последовательность выхода готовой продукции с конвейера или поточной линии, порядок размещения единиц при хранении, транспортировке и т. д. Ширина шага равна обратной величине доли выборки. При 2%-й выборке отбирается каждая 50-я единица, при 5%-й – каждая 20-я и т. д. Механическая выборка всегда бесповторная.
При типической выборке генеральная совокупность вначале расчленяется на качественно однородные группы по тому или иному признаку, Затем из каждой типической группы производится индивидуальный отбор единиц в выборочную совокупность по методу собственно случайной или механической выборки.
При серийной выборке из генеральной совокупности отбирают не отдельные единицы, а целые их серии (гнезда), внутри которых обследуются все без исключения единицы, т. е. применяется сплошное наблюдение.
Если соблюдаются правила научной организации исследования, то выборочный метод дает достаточно точные результаты. Однако характеристики, полученные выборочным наблюдением, всегда будут отличаться от результатов сплошного наблюдения, поскольку выборочная совокупность (отобранная для обследования) не точно воспроизводит генеральную (всю исследуемую) совокупность. Разница в этих характеристиках называется ошибкой выборки или ошибкой репрезентативности (представительности выборки). Задача статистики – количественно измерить ошибку выборки. Доказано, что величина выборки зависит от объема выборки, степени вариации признака, методов отбора единиц в выборочную совокупность и принятого уровня достоверности результата исследования.
2. Определение ошибки выборочной средней.
Средняя величина признака в генеральной совокупности будет определена по следующей формуле:
,
где - средняя величина признака в выборочной совокупности;
- предельная ошибка выборки.
В математической статистике доказано, что , где t - коэффициент доверия, зависящий от значения вероятности Р и определяемый по таблице значений P(t); - средняя ошибка.
При вероятности Р=0,683 значение t=1;
при Р=0,954 t=2;
при Р=0,997 t=3.
Для собственно случайной и механической выборки средняя ошибка при повторном отборе вычисляется по формуле:
где - дисперсия количественного признака, определяемая по формуле:
или ,
n – число единиц выборочной совокупности.
При бесповторном отборе
где N – численность генеральной совокупности.
Средняя ошибка выборки для типической и серийной выборки рассчитывается по тем же формулам с той лишь разницей, что:
1) при типической выборке используется средняя из групповых дисперсий:
,
где - групповая дисперсия;
- число единиц в группе.
2) При серийной выборке – межгрупповая дисперсия:
,
где - групповая средняя
- общая средняя.
Кроме того, при серийном отборе формула средней ошибки выборки имеет следующий вид:
,
где s – число серий в выборке;
S – число серий в генеральной совокупности.
3. Определение ошибки выборочной доли.
Доля единиц, обладающих тем или иным признаком в генеральной совокупности
,
где - доля единиц, обладающих данным признаком в выборочной совокупности;
- предельная ошибка выборочной доли.
,
где - средняя ошибка выборочной доли.
Средняя ошибка выборочной доли определяется по следующим формулам:
1) для собственно случайной выборки:
при повторном отборе: ;
при бесповторном отборе: ;
2) для механической выборки: ;
3) для типической выборки: ;
4) для серийной выборки
4.Определение необходимой численности выборки
В практике организации выборочного наблюдения возникает потребность определения необходимой численности выборки для обеспечения заданной точности предельной ошибки выборки и ее вероятности. Определение необходимой численности выборки основывается на формуле предельной ошибки выборки.
Из формулы предельной ошибки выборки среднего значения признака при повторном отборе
находим .
При бесповторном случайном отборе необходимая численность выборки вычисляется по формуле: .
При типической выборке: .
При серийной выборке .
Необходимая численность выборки при определении доли исчисляется по аналогичным формулам с той разницей, что вместо дисперсии количественного признака, используется дисперсия альтернативного признака.
Так, для случайной бесповторной выборки формула необходимой численности выборки будет иметь следующий вид: