Расчет объема выборочной совокупности.
Каждый исследователь, желающий получить достоверные данные о генеральной совокупности изучаемых явлений и процессов, стоит перед проблемой определения объема выборочной совокупности (я). Он определяется исходя из заданных и наличных показателей. Заданными показателями в этом случае будут предельная ошибка репрезентативности (W или А), коэффициент доверия (0, а наличными — дисперсия (о) изучаемых признаков и (в некоторых случаях) численность генеральной совокупности (W).
Формулы расчета выборочной совокупности выводятся из формул расчета ошибок репрезентативности.
р( — р) Из формулы W = J-i-----'-, по которой рассчитывается ошибка
повторной выборки качественного признака при коэффициенте доверия /= 1, может быть легко вычислен объем выборки. Для
этого необходимо знать значение удельного веса признака и задать предельную ошибку выборки. Обратимся к известному примеру. Доля лиц, совершивших преступления в состоянии опьянения (Р), составляла 35%, или 0,35. Предельную ошибку (W) зададим равной ± 5%, или 0,05. В этом случае
^ Р( - Р) = 0,35(1 W
• 0,35)
0,0025
= 91 преступление (дело, статкарта, приговор).
Если задать ошибку, равной ± 4%, то следует изучить 143 единицы, ± 3% - 225, ±296- 575 и т.д.
Из формулы W = J— , по которой
I П
определяется однократная
ошибка повторной выборки количественного признака, объем выборочной совокупности можно рассчитать после нахождения дисперсии (о) и необходимой предельной ошибки выборки (W). Вновь обратимся к примеру о сроках лишения свободы. В нем а = = 2,29 года, W= ± 0,15 года. Найдем объем выборочной совокупности (/?):
2,29 0,0225
= 102 единицы.
Это означает, что если нас удовлетворяет ошибка выборки, равная ±0,15, то следует изучить 100 преступлений (дел, статкарт и т. д.), а если она допустима в пределах ± 0,3, то достаточно 25 единиц изучения.
Выше говорилось, что коэффициент доверия, равный 1 (/=1), недостаточно надежен, так как только 683 единицы из 1000 могут быть в пределах заданной ошибки репрезентативности. Поэтому чаще всего при расчете объема выборочной совокупности вводится коэффициент доверия, равный 2 (/=2), который означает, что в 954 случаях из 1000 число единиц выборочной совокупности будет находиться в пределах заданной ошибки репрезентативности. С этой целью в приведенные формулы, как и при расчете ошибки репрезентативности, вводится коэффициент /.
Из формул предельных ошибок повторной выборки для качественных и количественных признаков выведем формулы расчета объемов выборочной совокупности.
Из д
следует и =
(качественные признаки).
Из д = /J— следует п = -~- (количественные признаки).
V и А
Принимая / = 2 и используя данные предыдущих примеров, определяем объемы выборочных совокупностей для качественных и количественных признаков:
, ч 0,35(1-0,35) 4 "*"
п (кач.) =-----^ пппг, '— -- 364 преступления;
и (колич.) =
2,29 4
= 407 преступлений.
0,0225
Расчеты выборочных совокупностей показывают, что если повысить коэффициент доверия вдвое (/=2), то объем выборки необходимо увеличить вчетверо, ^то означает, что в пределах тех же ошибок репрезентативности ± 5% и ± 0,15 года теперь будет находиться не 683, а 954 единицы из 1000. В этих случаях ошибка выборки именуется двукратной, поскольку распространяется на все единицы выборочной совокупности, расположенные в пределах 28 нормального распределения.
Все предшествующие расчеты производились для повторной выборки. В реальной жизни криминологические и социально-правовые изучения проводятся, как правило, бесповторным способом, т. е. уголовное дело, статкарта, гражданское дело и т. д. по какому-то признаку изучаются или респонденты (при анкетировании) опрашиваются единожды. В этом случае применяются формулы для бесповторной выборки.
Из д =
- — следует и =
NtP( - Р)
= —-------i-------'—-
+ tP( - Р)
Л/ЬЧ
2,2
> = ',—1--7Г следует л = —
/1 I, N ) £f,, т, и
Эти формулы расчета выборочных совокупностей для качественных и количественных признаков являются наиболее полными. В них учтены коэффициент доверия, кратность предельной ошибки и бесповторность выборки. Пользуясь этими формулами, рассчитаем выборочные совокупности для известных данных.
Итак, дано:
Р (удельный вес признака)
А (предельная ошибка выборки)
/ (коэффициент доверия)
N (генеральная совокупность)
= 35 %, или 0,35;
= 5 %, или 0,05;
= 2;
— 5000.
п =
п (выборочная совокупность)
5000 • 4 • 0,35 • (1 - 0,35) _ 4600 O.OD25 5000 + 4 0,35 (1-0,35) ~ 13,42
= 343 преступления.
Если уменьшить ошибку выборки до ±3%, то выборочная совокупность должна быть увеличена до 848 единиц, если до ± 2 % — объем выборки должен составить 1575 единиц.
Второй пример решим применительно к количественному признаку.
Дано:
о (дисперсия) = 2,29 года;
Д (предельная ошибка выборки) = 0,15 года;
t (коэффициент доверия) = 2;
N (генеральная совокупность) = 3000.
(выборочная совокупность)
3000 4 2,29 27480
0,0225 3000 + 4 2,29 67,5 + 9,16
= 358 преступлений.
Увеличение генеральной совокупности вдвое, т. е. до 6000, увеличит выборку ненамного, лишь до 381 единицы. Это говорит о том, что объем генеральной совокупности — относительно второстепенный параметр даже при расчете объема бесповторной выборки, хотя он и стоит в формуле расчета. При повторной выборке объем генеральной совокупности не имеет никакого значения, поэтому он отсутствует в формуле расчета как дисперсии, так и численности выборки. Следовательно, там, где численность генеральной совокупности по тем или иным причинам точно не известна, ею можно пренебречь и рассчитывать выборочную совокупность по формулам повторной выборки или использовать приблизительную численность генеральной совокупности.
Для определения объема повторной выборки по качественному признаку можно использовать табл. 6. Как и табл. 5 (о пределах ошибок), она рассчитана применительно к коэффициенту доверия, равному 2 (/=2).
Таблица 6
Число наблюдений, необходимое для того, чтобы ошибка не превысила заданного предела (t=2)
Удельный вес | Предел ошибки, % | |||||
наблюдений, % | ||||||
10 (90) | ||||||
15 (85) | ||||||
20 (80) | ||||||
25 (Z5i | 75ПП | 19ПП | аза | ям | ||
30 (70) | ||||||
35 (65) | ||||||
40 (60) | ||||||
45 (55) | ||||||
50 (50) | 10 000 |
Примечание. Таблица приводится в сокращенном виде.
Предположим, что удельный вес изучаемого признака равен 25%. Находим этот показатель в первой графе табл. 6. Рассматривая строку (она подчеркнута), на которой находится 25% (75%), слева направо, мы увидим, что при заданной ошибке ± 1% численность выборки должна составить 7500 единиц, при ± 2% -1900, при ± 3% - 830, при ± 4% - 470, при + 5% - 300 единиц и т. д. Исходя из того, какая ошибка может быть признана допустимой при том или ином изучении, и определяется объем выборочной совокупности.
В криминологических и других социально-правовых исследованиях чаще всего бывает достаточной выборка до 300—400 единиц. Даже при максимальной колеблемости качественного признака 50% (дисперсия -- 0,25) предельная двукратная ошибка выборки составляет ±5%, при удельном весе признака 20% (80%) — ±4%, при удельном весе признака 10% (90%) — ± 3%.