Выборку, при которой отбор проводится случайным обра-
Зом, называют случайной, если ее проводят механически через
Равные интервалы — то механической.
Метод типического отбора предполагает предварительное
Разделение генеральной совокупности на некоторые однород-
Ные группы, а затем отбор из них осуществляется одним из
Рассмотренных выше способов.
С точки зрения оценки ошибки репрезентативности выбо-
Рочных данных различают большие и малые выборки. Выбор-
Ку считают большой, если число единиц в ней более ста, и ма-
Лой — если число единиц двадцать-тридцать и менее.
Нахождение ошибок
И объема большой выборки
Одна из задач, которую позволяет решать выборочный ме-
Тод, — нахождение ошибки выборки. В теории статистики оп-
Ределяют среднюю (стандартную), предельную и относитель-
Ную ошибки выборочного наблюдения.
В теории вероятностей доказывается, что при случайном
И механическом отборах средняя ошибка выборки для средней
величины (Wi) находится следующим образом:
− для повторного отбора
; (7.1)
− для бесповторного отбора:
, (7.2)
Где — дисперсия количественного признака генеральной
Совокупности;
k — численность выборки;
n — численность генеральной совокупности.
В реальности , как правило, неизвестна. Поэтому ее за-
Меняют выборочной дисперсией . При большой выборке
≈ , при малой — соотношение между и определя-
Ется формулой
. (7.3)
Если мы рассматриваем качественный признак, то его дис-
Персия в генеральной совокупности определяется формулой
(6.42). При нахождении средней ошибки качественного призна-
Ка его дисперсия в генеральной совокупности, как правило, не-
Известна и заменяется выборочной дисперсией ( ).
Формулы для определения средней ошибки альтернатив-
ного (качественного) признака имеют вид:
− для повторного отбора
; (7.4)
− для бесповторного отбора
, (7.5)
Где
, (7.6)
Sв — доля единиц выборки, обладающая качественным
Признаком.
Величина всегда меньше единицы, следовательно,
Сопоставление приведенных выше формул говорит о том, что
Применение формул бесповторного отбора обеспечивает мень-
Шую ошибку.
Предельная ошибка выборки (Δ) есть t-кратная средняя
Ошибка, т. е.
Δi = t ⋅ Wi, (7.7)
где t — коэффициент доверия, который обычно берут равным
1, 2, 3.
Формула предельной ошибки вытекает из закона больших
Чисел. В частности, из теоремы Чебышева следует, что при до-
Статочно большом объеме выборки и ограниченной дисперсии
Генеральной совокупности выборочные обобщающие показа-
Тели будут сколь угодно мало отличаться от соответствующих
Показателей генеральной совокупности.
Например, для среднего арифметического на основании
Формулы (2.46) получим
:
− для t = 1 имеем ;
− для t = 2 имеем ;
− для t = 3 имеем ,
Где — выборочное среднее арифметическое;
— генеральное среднее арифметическое;
Φo (1); Φo (2); Φo (3) — находятся по таблице приложения 5.
То есть при t = 1 с вероятностью 0,6826 можно утверж-
Дать, что разность между выборочными и генеральными па-
раметрами не превзойдет одной средней ошибки выборки Wi..
При t = 2 с вероятностью 0,9544 она не превзойдет двукрат-
ной средней ошибки выборки 2Wi. При t = 3 с вероятностью
Она не превзойдет трехкратной средней ошибки вы-
борки 3Wi.
Вероятность появления ошибки, равной или большей 3Wi,
Очень мала и равна 0,0027. Такие события можно считать прак-
тически невозможными, а, следовательно, величину ΔI = t ⋅ Wi
Можно принять за предел возможной ошибки выборки.
Зная предельную ошибку выборки можно определить пре-
Дельные значения характеристик генеральной совокупности и
Их доверительные интервалы.
Например, для средней арифметической имеем:
, (7.8)
А для доли единиц выборки, обладающих каким-либо качест-
венным признаком, получим:
S = Sв + ΔS. (7.9)
При проектировании выборочного наблюдения, как прави-
Ло, задается допустимая ошибка выборки, а это дает возмож-
Ность, найти объем выборки, которая с определенной вероят-
Ностью обеспечит заданную точность наблюдения.
Необходимый объем выборки получают из формул (7.1),
(7.2), (7.4), (7.5).