Расчет выборочной совокупности

Каждый исследователь, желающий получить достоверные дан­ные о генеральной совокупности изучаемых явлений и процес­сов, стоит перед проблемой определения объема выборочной совокупности (я). Он определяется исходя из заданных и налич­ных показателей. Заданными показателями в этом случае будут предельная ошибка репрезентативности (W или А), коэффици­ент доверия (0, а наличными — дисперсия (о) изучаемых при­знаков и (в некоторых случаях) численность генеральной сово­купности (W).

Формулы расчета выборочной совокупности выводятся из фор­мул расчета ошибок репрезентативности.

\р(\ — р) Из формулы W = J-i-----'-, по которой рассчитывается ошибка

повторной выборки качественного признака при коэффициенте доверия /= 1, может быть легко вычислен объем выборки. Для

этого необходимо знать значение удельного веса признака и за­дать предельную ошибку выборки. Обратимся к известному при­меру. Доля лиц, совершивших преступления в состоянии опьяне­ния (Р), составляла 35%, или 0,35. Предельную ошибку (W) за­дадим равной ± 5%, или 0,05. В этом случае

^ Р(\ - Р) = 0,35(1 W

• 0,35)

0,0025

= 91 преступление (дело, статкарта, приговор).

Если задать ошибку, равной ± 4%, то следует изучить 143 еди­ницы, ± 3% - 225, ±296- 575 и т.д.

Из формулы W = J— , по которой

I П

определяется однократная

ошибка повторной выборки количественного признака, объем выборочной совокупности можно рассчитать после нахождения дисперсии (о) и необходимой предельной ошибки выборки (W). Вновь обратимся к примеру о сроках лишения свободы. В нем а = = 2,29 года, W= ± 0,15 года. Найдем объем выборочной совокуп­ности (/?):

2,29 0,0225

= 102 единицы.

Это означает, что если нас удовлетворяет ошибка выборки, равная ±0,15, то следует изучить 100 преступлений (дел, статкарт и т. д.), а если она допустима в пределах ± 0,3, то достаточ­но 25 единиц изучения.

Выше говорилось, что коэффициент доверия, равный 1 (/=1), недостаточно надежен, так как только 683 единицы из 1000 могут быть в пределах заданной ошибки репрезентативно­сти. Поэтому чаще всего при расчете объема выборочной сово­купности вводится коэффициент доверия, равный 2 (/=2), ко­торый означает, что в 954 случаях из 1000 число единиц выбо­рочной совокупности будет находиться в пределах заданной ошибки репрезентативности. С этой целью в приведенные фор­мулы, как и при расчете ошибки репрезентативности, вводит­ся коэффициент /.

Из формул предельных ошибок повторной выборки для каче­ственных и количественных признаков выведем формулы расчета объемов выборочной совокупности.

Из д

следует и =

(качественные признаки).

Из д = /J— следует п = -~- (количественные признаки).

V и А

Принимая / = 2 и используя данные предыдущих примеров, определяем объемы выборочных совокупностей для качествен­ных и количественных признаков:

, ч 0,35(1-0,35) 4 "*"

п (кач.) =-----^ пппг, '— -- 364 преступления;

и (колич.) =

2,29 4

= 407 преступлений.

0,0225

Расчеты выборочных совокупностей показывают, что если по­высить коэффициент доверия вдвое (/=2), то объем выборки не­обходимо увеличить вчетверо, ^то означает, что в пределах тех же ошибок репрезентативности ± 5% и ± 0,15 года теперь будет на­ходиться не 683, а 954 единицы из 1000. В этих случаях ошибка выборки именуется двукратной, поскольку распространяется на все единицы выборочной совокупности, расположенные в пре­делах 28 нормального распределения.

Все предшествующие расчеты производились для повторной выборки. В реальной жизни криминологические и социально-пра­вовые изучения проводятся, как правило, бесповторным спосо­бом, т. е. уголовное дело, статкарта, гражданское дело и т. д. по какому-то признаку изучаются или респонденты (при анкетиро­вании) опрашиваются единожды. В этом случае применяются формулы для бесповторной выборки.

Из д =

- — следует и =

NtP(\ - Р)

= —-------i-------'—-

+ tP(\ - Р)

Л/ЬЧ

2,2

> = ',—1--7Г следует л = —

/1 I, N ) £f,, т, и

Эти формулы расчета выборочных совокупностей для качествен­ных и количественных признаков являются наиболее полными. В них учтены коэффициент доверия, кратность предельной ошибки и бесповторность выборки. Пользуясь этими формулами, рассчи­таем выборочные совокупности для известных данных.

Итак, дано:

Р (удельный вес признака)

А (предельная ошибка выборки)

/ (коэффициент доверия)

N (генеральная совокупность)

= 35 %, или 0,35;

= 5 %, или 0,05;

= 2;

— 5000.

п =

п (выборочная совокупность)

5000 • 4 • 0,35 • (1 - 0,35) _ 4600 O.OD25 5000 + 4 0,35 (1-0,35) ~ 13,42

= 343 преступления.

Если уменьшить ошибку выборки до ±3%, то выборочная совокупность должна быть увеличена до 848 единиц, если до ± 2 % — объем выборки должен составить 1575 единиц.

Второй пример решим применительно к количественному при­знаку.

Дано:

о (дисперсия) = 2,29 года;

Д (предельная ошибка выборки) = 0,15 года;

t (коэффициент доверия) = 2;

N (генеральная совокупность) = 3000.

(выборочная совокупность)

3000 4 2,29 27480

0,0225 3000 + 4 2,29 67,5 + 9,16

= 358 преступлений.

Увеличение генеральной совокупности вдвое, т. е. до 6000, увеличит выборку ненамного, лишь до 381 единицы. Это гово­рит о том, что объем генеральной совокупности — относи­тельно второстепенный параметр даже при расчете объема бес­повторной выборки, хотя он и стоит в формуле расчета. При повторной выборке объем генеральной совокупности не имеет никакого значения, поэтому он отсутствует в формуле расчета как дисперсии, так и численности выборки. Следовательно, там, где численность генеральной совокупности по тем или иным причинам точно не известна, ею можно пренебречь и рассчи­тывать выборочную совокупность по формулам повторной вы­борки или использовать приблизительную численность гене­ральной совокупности.

Для определения объема повторной выборки по качественно­му признаку можно использовать табл. 6. Как и табл. 5 (о пределах ошибок), она рассчитана применительно к коэффициенту дове­рия, равному 2 (/=2).

Таблица 6

Число наблюдений, необходимое для того, чтобы ошибка не превысила заданного предела (t=2)

Удельный вес Предел ошибки, %
наблюдений, %  
 
10 (90)
15 (85)
20 (80)
25 (Z5i 75ПП 19ПП аза ям
30 (70)
35 (65)
40 (60)
45 (55)
50 (50) 10 000

Примечание. Таблица приводится в сокращенном виде.

Предположим, что удельный вес изучаемого признака равен 25%. Находим этот показатель в первой графе табл. 6. Рассматри­вая строку (она подчеркнута), на которой находится 25% (75%), слева направо, мы увидим, что при заданной ошибке ± 1% чис­ленность выборки должна составить 7500 единиц, при ± 2% -1900, при ± 3% - 830, при ± 4% - 470, при + 5% - 300 единиц и т. д. Исходя из того, какая ошибка может быть признана допу­стимой при том или ином изучении, и определяется объем выбо­рочной совокупности.

В криминологических и других социально-правовых исследо­ваниях чаще всего бывает достаточной выборка до 300—400 еди­ниц. Даже при максимальной колеблемости качественного при­знака 50% (дисперсия -- 0,25) предельная двукратная ошибка выборки составляет ±5%, при удельном весе признака 20% (80%) — ±4%, при удельном весе признака 10% (90%) — ± 3%.

Наши рекомендации