Формулы предельных ошибок
Генеральная совокупность | Выборочная совокупность | ||
Для признака | Для доли | Для признака | Для доли |
∆x = t M x = t √ σ²/n | ∆x = t M p = t √pg/n | ∆x = t M x = t √σ²/n | ∆p = t M p = t √w(1-w)/n |
Ошибки выборки зависят не только от степени точности, но и от способа отбора:
1. случайный;
2. механический;
3. типический;
4. серийный;
5. смешанный.
Случайный отбор – это такой отбор, когда каждая единица изучаемой совокупности имеет одинаковую возможность попасть или не попасть в выборку.
Случайный отбор может быть повторным и бесповторным.
При бесповторном отборе каждая единица может попасть в выборку только 1 раз.
При повторном отборе – столько раз сколько раз производится выборка.
Теорией вероятности доказано, что меньше бесповторного отбора меньше ошибки повторного отбора в √(1- n/N) раз.
Ранее были даны формулы средних ошибок для повторного отбора.
Далее проводятся формулы расчета средних и предельных ошибок при бесповторном отборе.
Формулы расчета ошибок при бесповторном отборе.
Генеральная совокупность | Выборочная совокупность | ||
Для признака | Для доли | Для признака | Для доли |
Средние ошибки | |||
M x = √σ²/n (1-n/N) | M p = √pg/n (1-n/N) | M x = √σ²/n (1-n/N) | M p = √w(1-w)/n (1-n/N) |
Предельные ошибки | |||
∆x = t M x = √σ²/n (1-n/N) | ∆p = t M p = t √pg/n (1-n/N) | ∆x = t M x = t √σ²/n (1-n/N) | ∆p = t M p = t √w(1-w)/n (1-n/N) |
Механический отбор – вся совокупность разбивается на равные по объему группы по случайному признаку. Затем из каждой группы, как правило, берется одна единица. Все единицы предварительно располагаются в определенном порядке, – например, по алфавиту, местонахождению и т.п., а потом, в зависимости от объема выборки, механически через определенный интервал отбирается необходимое количество единиц. Чем меньше выборки, тем больше интервал (если выборка 5 %-ная, то отбирается каждый 20 студент).
МАЛАЯ ВЫБОРКА
В процессе оценки степени представительности данных выборочного наблюдения важное значение приобретает вопрос об объеме выборочной совокупности п. От него зависит не только величина пределов, которые с данной вероятностью не превзойдет ошибка выборки, но и способы определения этих пределов.
При большом числе единиц выборочной совокупности (n > 100)
распределение случайных ошибок выборочной средней в соответствии с теоремой А. М. Ляпунова нормально или приближается к нормальному по мере увеличения числа наблюдений. Вероятность выхода ошибки за определенные пределы оценивается на основе таблиц интеграла Лапласа. Расчет ошибки выборки базируется на величине генеральной дисперсии а2ген, так как при больших п коэффициент n/(n-1), на который для получения генеральной умножается выборочная дисперсия, большой роли не играет.
Однако в практике статистического исследования в условиях рыночной экономики все чаще приходится сталкиваться с небольшими по объему так называемыми малыми выборками. Под малой выборкойпонимается такое выборочное наблюдение, численность единиц которого не превышает 30. В настоящее время малая выборка используется более широко, чем раньше, прежде всего за счет статистического изучения деятельности малых и средних предприятий, коммерческих банков, фермерских хозяйств и т. д. Их количество в определенных случаях, особенно при региональных исследованиях, а также величина характеризующих их показателей (например, численность занятых) часто незначительны. Поэтому хотя общий принцип выборочного обследования (с увеличением объема выборки повышается точность выборочных данных) остается в силе, иногда приходится ограничиваться малым числом наблюдений. Наряду со статистическим изучением рыночных структур эта необходимость возникает при выборочной проверке качества продукции, в научно-исследовательской работе и в ряде других случаев.
Разработка теории малой выборки была начата английским статистиком В. С. Госсетом (печатавшимся под псевдонимом Стьюдент) в 1908 г. Он доказал, что оценка расхождения между средней малой выборки и генеральной средней имеет особый закон распределения.
При оценке результатов малой выборки величина генеральной
дисперсии в расчетах не используется. Для определения возможных пределов ошибки пользуются так называемым критерием Стьюдента,определяемым по формуле
T=(x%-x¯)/mмв
(8.26)
где µмв=s/(Ön-1)- мера случайных колебаний выборочной средней в малой выборке.
Величина s вычисляется на основе данных выборочного наблюдения. Она равна:
s=Öå(xi-x)²/n
(8.27)
Данная величина используется лишь для исследуемой совокупности, а не в качестве приближенной оценки а в генеральной совокупности. При небольшой численности выборки распределение Стьюдента отличается от нормального: большие величины критерия имеют здесь большую вероятность, чем при нормальном распределении.
Предельная ошибка малой выборки (мв) в зависимости от средней ошибки (mмв) представлена как
Dмв=t*mмв
(8.28)
Но в данном случае величина t иначе связана с вероятной оценкой, чем при большой выборке. Как указывалось ранее, английский ученый В. С. Госсет доказал, что при малой выборке действует особый закон распределения. Согласно распределению Стьюдента, вероятная оценка зависит как от величины t, так и от объема выборки в случае, если предельная ошибка не превысит t-кратную среднюю ошибку в малых выборках. Приведем выдержку из таблицы распределения Стьюдента (табл. 8.9).
Таблица 8.9
Распределение вероятности в малых выборках в зависимости
от коэффициента доверия t и объема выборки п*
N t | ∞ | |||||||||
0,5 1,0 1,5 2,0 2,5 3,0 | ||||||||||
* При п= ∞ в таблице даны вероятности нормального распределения. Для определения вероятности соответствующие табличные значения следует разделить на 1000. |
Как видно из табл. 8.9, при увеличении n это распределение стремится к нормальному и при n =20 уже мало от него отличается.
Покажем, как пользоваться таблицей распределения Стьюдента.
Пример. Предположим, что выборочное обследование 10 рабочих малого предприятия показало, что на выполнение одной из производственных операций рабочие затрачивали времени (мин): 3,4; 4,7; 1,8; 3,9; 4,2; 3,9; 4,2; 3,9; 3,7; 3,2; 2,2; 3,9. Найдем выборочные средние затраты:
x¯= (3,4 + 4,7 + 1,8 + … + 2,2 + 3,9)/10 = 3,49 мин.
Выборочная дисперсия
s² = (3,4 - 3,49)²+ (4,7 - 3,49)² + … + (3,9 - 3,49)² = 0,713
Отсюда средняя ошибка малой выборки
µмв = корень (0,713/(10-1) = 0,28 мин.
По табл. 8.9 находим, что для коэффициента доверия t = 2 и объема малой выборки n = 10 вероятность равна 0,924. Таким образом, с вероятностью 0,924 можно утверждать, что расхождение между выборкой и генеральной средней лежит в пределах от – 2µ до + 2µ, т. е. разность x-x¯ не превысит по абсолютной величине 0,56 (2 • 0,28). Следовательно, средние затраты времени во всей
совокупности будут находиться в пределах от 2,93 до 4,05 мин. Вероятность того, что это предположение в действительности неверно и ошибка по случайным причинам будет по абсолютной величине больше, чем 0,56, равна:
1 - 0,924 = 0,076.
Таблица вероятностей Стьюдента часто приводится в иной форме, нежели в табл. 8.9. Считается, что в ряде случаев такая форма более удобна для практического использования (табл. 8.10).
Таблица 8.10.