Комбинированная выборка
Комбинированная выборка предполагает использование нескольких способов выборки. Можно комбинировать, например, серийную выборку и случайную. В этом случае, разбив генеральную совокупность на серии (группы) и отобрав нужное число серий, производят случайную выборку единиц в серии. Такая комбинированная выборка может быть повторной (для групп и единиц) и бесповторной.
Средняя ошибка комбинированной выборки определяется по формулам (условные обозначения даны раньше):
При повторном отборе - ,
При бесповторном отборе -
Многоступенчатая выборка
Многоступенчатая выборка предполагает извлечение из генеральной совокупности сначала укрупненных групп единиц, затем групп, меньших по объему, и так до тех пор, пока не будут отобраны те группы (серии) или отдельные единицы, которые будут подвергнуты наблюдению. Выборка может быть двухступенчатой, когда генеральная совокупность разбивается на группы и производится отбор групп, а затем внутри групп — отбор единиц наблюдения. На обеих ступенях отбор может вестись в случайном порядке.
В отличие от типического отбора, где отбор производится из всех без исключения групп, при многоступенчатом отборе производится отбор самих групп, и, следовательно, не все они попадают в выборку.
Число ступеней отбора может быть и более двух. Если число ступеней отбора больше двух, то средняя ошибка выборки определяется по формуле
µ = ,
где µ1, µ2, µ3, …….- средние ошибки выборки на отдельных ступенях отбора,
n1, n2, ……. - численность выборок на соответствующих ступенях.
Многофазная выборка
При многофазной выборке выборочные совокупности образуются так, что одни сведения собираются от всех единиц отбора, затем отбираются еще некоторые единицы, которые и обследуются по более широкой программе. Расчет ошибки многофазной выборки производится для каждой фазы в отдельности.
Малые выборки
Выборки, при которых наблюдением охватывается небольшое число единиц (n < 30), принято называть малыми выборками. Они обычно применяются в том случае, когда невозможно или нецелесообразно использовать большую выборку (исследование качества продукции, если это связано с ее разрушением, в частности на прочность, на продолжительность срока службы и т. д.).
Предельная ошибка малой выборки определяется по формуле
Средняя (стандартная) ошибка малой выборки:
,
где S2 – дисперсия малой выборки:
,
где хср. – среднее значение признака по выборке,
n-1 – число степеней свободы (n -1 = k ),
t – коэффициент доверия малой выборки, зависящий не только от заданной доверительной вероятности, но и от численности единиц выборки.
Вероятность того, что генеральная средняя находится в определенных границах, определяется по формуле
,
где S(t) – значение функции Стьюдента.
Для расчета коэффициента доверия t определяют значение функции S(t) по формуле
S(t) = (Р+1)/2,
где Р – величина доверительной вероятности.
Затем по таблице распределения Стьюдента (смотри статистические таблицы) в зависимости от значения функции S(t) и числа степеней свободы k (k = n-1) определяют значение t.
Функция S(t) используется также для определения вероятностей того, что фактическое нормированное отклонение не превзойдет или превзойдет табличное значение.
Вероятность того, что фактическое отношение (tф) не превзойдет по абсолютной величине табличное значение (t), определяется по формуле
.
Вероятность того, что фактическое отношение (tф) превзойдет по абсолютной величине табличное значение (t), определяется по формуле
.
Пример. 5.
Из партии электроламп произведена малая выборка (отбор случайный, бесповторный) для определения продолжительности срока службы ламп. Результаты выборки даны в табл. 4.8.
Табл. 4.8.
№1 | |||||||||
Срок службы, час 1450 |
На основе приведенных данных требуется:
1) определить доверительные интервалы, в которых заключена средняя продолжительность службы ламп для всей партии, гарантируя результат с вероятностью 0,99;
2) определить вероятность того, что средний срок службы ламп для всей партии отличается от полученного по выборке не более чем на 40 ч.
Решение
1.Доверительные интервалы для генеральной средней:
, ,
Для расчета S использована вспомогательная табл. 4.9.
хср. = 13700/10 = 1370 ч; S = = 63.42 ч; = 20,06
Для определения t сначала исчисляется S(t) :
S(t) = (Р + 1)/2 = (0,99 + 1)/2 = 0.995.
Табл. 4.9.
Номер лампы | Срок горения | x-xср. | (х-хср.)2 |
-120 -10 -50 -70 | |||
Итого |
По статистическим таблицам при к = п - 1 = 10 - 1=9 и S(t) = 0,995 имеем t = 3,2.
Тогда = хср. ± t * µм.в. = 1370 ± 3,2 * 20,06 = 1370 ± 64,2.
Следовательно, с вероятностью 0,99 можно утверждать, что генеральная средняя колеблется в пределах от 1305,8 до 1434,2 час.
2.Для определения вероятности отклонения генеральной средней от выборочной средней не более, чем на 40 ч, имеются следующие данные:
= 40 ч; = 20,06 (см. п.1).
Отсюда
tф = = 40/20,6 = 1,994 2,0.
Пользуясь таблицей распределения Стьюдента, определяется значение функции S(t) при t — 2,0 и k = 10 - 1 = 9, имеем - S(t) = 0,962.
Вероятность того, что отклонение генеральной средней от выборочной средней не превзойдет 40 ч:
= 2 S(t) - 1 = 2*0,962 – 1 = 0,924
Вероятность того, что ошибка будет превышать 40 ч:
= 2[1- S(t)] = 2[1-0,962] = 0,076.
Следовательно, вероятность отклонения генеральной средней от выборочной средней по абсолютной величине, превышающей 40 ч, очень мала.