Оптимальный объем представительной выборки
В процессе решения задач легко убедиться, что доверительный интервал оценки средней и оценки доли зависит от объема выборки. Чем больше выборка, тем уже будет интервал, тем точнее оценка генеральных статистик. В самом деле, во всех формулах расчета ошибки выборки объем выборки стоит в знаменателе, значит, между объемом выборки и ошибкой существует обратная связь. Самая большая выборка — это вся генеральная совокупность, и тогда оценка вообще будет точечной. При этом, конечно же, не будет соблюдаться экономичность исследования, которая и является целью выборочного метода. Поэтому следует найти такой оптимальный размер выборки, который будет удовлетворять всем требованиям.
Определение 13.8.Минимальный объем выборки, при котором ее можно назвать репрезентативной называется оптимальным объемом.
Объем выборки не должен быть меньше оптимального объема. Для различных способов отбора существуют свои формулы предельной ошибки Δ = t · μ и формулы средних ошибок выборки, определяются формулы необходимой численности выборки.
Так, для определения доверительного интервала оценки средней в генеральной совокупности минимальный объем репрезентативной выборки рассчитывается по формулам:
► при повторном отборе:
(13.14)
► при бесповторном отборе:
(13.15)
где σ2 — выборочная дисперсия значений признака,
п — объем выборки;
N — объем генеральной совокупности;
t — аргумент функции Лапласа, зависящий от надежности интервальной оценки средней,
Δ — предельная ошибка выборки.
Минимальный объем репрезентативной выборки для оценки генеральной доли рассчитывается по формулам:
► при повторном отборе:
(13.16)
► при бесповторном отборе:
(13.17)
где ω ·(1 — ω) — выборочная дисперсия доли значений признака;
п — объем выборки;
N — объем генеральной совокупности;
ω — доля обследованной совокупности;
t — аргумент функции Лапласа, зависящий от надежности интервальной оценки средней,
Δ — предельная ошибка выборки.
При расчете объема выборки надо учитывать, что оптимальное количество элементов в выборке — целое число, поэтому оно будет определяться с округлением до наибольшего целого. Например, если п, вычисленный по формуле, равен 58,013, то это число определяет минимальный объем репрезентативной выборки, поэтому округлять надо до большего целого, до 59.
Вопросы для самоконтроля
1. Поясните сущность выборочного метода. Какие теоремы теории вероятностей служат обоснованием выборочного метода?
2. Определите характеристики выборки, которые называются выборочными статистиками. Как они рассчитываются?
3. С какой целью используются выборочные данные?
4. От чего зависит качество точечных оценок параметров генеральной совокупности?
5. Какие величины являются точечными оценками для генеральной средней, генеральной доли?
6. Какие точечные оценки используются для генеральной дисперсии? Какие условия должны выполняться, чтобы статистики служили хорошими оценками параметров генеральной совокупности?
7. Как определяется интервальная оценка генеральной средней?
8. Что представляет собой доверительный интервал для оценки генеральной доли? Поясните сущность параметров, определяющих его размер.
9. Какие величины определяют размер предельной ошибки выборки?
10. Как заданная вероятность влияет на величину доверительного интервала для оценки генеральных параметров?
11. По каким формулам определяется средняя ошибка выборки в зависимости от способа отбора выборки?
12. От чего зависит ошибка выборки для оценки средней в генеральной совокупности?
13. Какие формулы используются для оценки генеральной доли в повторной и бесповторной выборке?
14. От чего зависит оптимальный объем представительной выборки?
15. Какая зависимость существует между размером доверительного интервала оценки генеральных параметров и объемом выборки?
16. Каким требованиям должен удовлетворять оптимальный размер выборки при оценке генеральных параметров?
17. По каким формулам рассчитывается минимальный объем репрезентативной выборки для оценки генеральной средней и генеральной доли?