Обоснование численности выборки
Как видели выше, размер ошибки выборки прежде всего зависит от численности выборочной совокупности n. Из соответствующей формулы видели, что средняя ошибка выборки обратно пропорциональна √ n, т.е. например, при увеличении численности выборки в 4 раза ее ошибка уменьшается вдвое.
Увеличение численности выборки, следовательно, можно довести ее ошибку до каких угодно малых размеров. Само собой разумеется, что при доведении n до размеров N ошибка выборки .
Рассматривая такую гипотезу следует иметь в виду, что выборочная характеристика нередко получается при разрушении обследованных образцов (например, при проверке качества товара). Отсюда возникает проблема обоснования минимальной нормы отбора, но репрецентативного по результатам проверки. Это согласуется с спецификой (сущностью) выборочного наблюдения: получение необходимой информации с минимальными затратами времени и труда.
Поэтому вопрос об обосновании оптимальной численности выборки имеет важное практическое значение.
Повышение объема выборки ведет к увеличению объема статистической работы, вызывает дополнительные затраты труда и материальных и денежных средств. Однако всегда надо помнить и обратное: если в выборку взять недостаточное число образцов, то результаты статистического исследования могут содержать большие погрешности.
Определение необходимой численности выборки основывается на формуле предельной ошибки выборки:
Рассмотрим формулу
.
Решим это равенство относительно n
.
Отсюда необходимая численность выборки при расчете средней величины количественного признака ( ) выразится так:
.
Аналогично для доли альтернативного признака будем иметь.
и отсюда .
Для повторного отбора соответственно получим:
А) для доли альтернативного признака
;
Б) для средней величины количественного признака
.
Например, пусть исходя, из требований ГОСТа необходимо установить оптимальный объем выборки из партии нарезных батонов (2000 шт), чтобы с вероятностью, 0997 предельная ошибка не превышала 3% веса 500 граммового батона. По условию задачи г.
Определить заданную ГОСТом предельную величину ошибки выборки (в граммах) г.
Подставляя это значение в последнюю формулу, имеем штук.
Рассмотрим более подробно вывод формулы для n
а) для повторной схемы отбора возведем в квадрат обе части равенства и получим:
Теперь обе части равенства умножим на n. Имеем: .
Отсюда .
б) для бесповоротной схемы отбора
|
Пример на определение численности выборки
В ВУЗе в зимнюю сессию экзамен по дисциплине «Статистика» сдавали 500 студентов. Нужно определить размер выборки при случайном бесповторном отборе для изучения успеваемости по этой дисциплине, чтобы с вероятностью 0,954 (t=2) предельная ошибка выборки доли студентов, имеющих неудовлетворительную оценку, не превышала 5%, если процент неуспевающих по этому предмету обычно не превышала 10%.
Решение: При повторном отборе имеем:
Г) при бесповторном отборе:
12.4. Способы распространения характеристик выборки
на генеральную совокупность
При развитии рыночных отношений, как отмечалось выше, основной формой полученных статистических данных становится выборочное наблюдение. В зависимости от цели статистического исследования в этом случае по соответствующим показателям выборки оцениваются характеристик генеральной совокупности или прямым пересчетом показателей для генеральной совокупности, или посредствам расчета поправочных коэффициентов.
При способе прямого пересчета показатель выборки распространяется на генеральную совокупность с учетом предельной ошибки выборки.
.
Например, необходимо определить количество нестандартных изделий в поступившей партии товаров. Пусть при выборочном обследовании партии в 2000 единиц доля стандартных изделий в выборке составляет w=0.1 при установленной с вероятностью Фt=0.954 предельной ошибке выборки
.
На основе этих данных доля нестандартных изделий во всей партии составляет
.
Отсюда пределы абсолютной численности нестандартного изделия во всей партии составляют:
2000х0,04 = 80 шт. – минимальная численность;
2000х0,16= 820 шт. – максимальная численность.
Способ поправочных коэффициентов применяется, например, при использовании выборочного метода с целью уточнению результатов сплошного учета (например, переписи населения, оборудования, скота).
При уточнении данных ежегодных переписей скота у населения применяется 10%-ное выборочное обследование для определения так называемого процента недоучёта.
Пример. По данным выборочного обследования в дворах деревни было зарегистрировано 52 голов скота, а по данным сплошного учёта в этом массиве значится 50 голов. Отсюда коэффициент недоучёта составляет 4% . С учётом полученного поправочного многочисленного коэффициента вносится поправка в общую численность скота, находящегося у населения данной деревни.
Как правило распространение выборочных данных на генеральную совокупность производится с учётом доверительных интервалов. Для этого соответствующие обобщающие выборочные показатели корректируются на величину предельной ошибки выборки. Например
а) для доли ;
б) для средней величины признака
(*) Пример.
С целью изучения длительности горения электриками было проведено 5%-ное выборочное обследование партии из 1000 электроламп. Отбор проводился механическим способом . Были получения следующие результаты.
Длительность горения | Количество электроламп |
600-800 800-1000 1000-1200 1200-1400 1400-1600 | |
итого |
Нужно определить интервалы средней длительности горения электроламп для всей выборки с вероятностью 0,954 , а также интервалы доли электроламп с длительностью горения не менее 1200 ч с вероятностью = 0,9973 (t=3).
Решение: находим среднюю длительность горения одной лампы из 500 обследованных
.
2)Находим выборочную дисперсию изучаемого признака
.
3)Находим предельную ошибку выборки
.
4)Отсюда пределы изменения во всей партии`
или от 1149,6 ч до 1210,4 ч.
5)Для альтернативного признака
Находим долю ламп в выборке, длительность горения которых 1200ч и более (долю наличия признака у единиц выборочных совокупностей)
.
Находим предельную ошибку доли признака
.
Определяем интервал для альтернативного признака
(**) Пример.
С целью определения среднего разряда рабочих четырёх ведущих профессий был произведён 10%-ный типический отбор рабочих этих профессий. Были получены следующие данные
Профессия рабочих | Кол-во обследованных рабочих | Средний разряд | Дисперсия групповая | Доля рабочих 7-8 разрядов |
токарь фрезеровщик шлифовальщик слесарь | 5,6 5,0 5,2 6,0 | 1,0 0,9 0,9 0,7 | 0,25 0,2 0,2 0,3 |
Определить: 1) пределы изменения среднего разряда рабочих этих профессий по предприятию в целом с вероятностью 0,954;
2)пределы изменения доли рабочих 7-8 разрядов по предприятию в целом с вероятностью 0,997.
Решение:
1) расчёт среднего тарифного разряда рабочих
2) расчёт средней групповой дисперсии
3) расчёт предельной ошибки выборки
.
4) пределы изменения среднего разряда рабочих
Аналогичные расчёты для доли признака
5)расчёт средней доли рабочих 7-8 разрядов
.
6)расчёт средней втнутригрупповых дисперсий
7) расчёт предельной ошибки для альтернативного признака
8) пределы изменения доли высококвалифицированных рабочих по предприятию в целом
Имеем , т.е. высококвалифицированные рабочие по предприятию в целом составляют от 15,9% до 40,1%.
Результат маловероятный
(***)Пример:
Из партии в 10
Коробок комплектующих изделий проведено 10%-е выборочное обследование. В результате сплошного обследования качества изделий в 10 отобранных случайным образом коробках получены следующие результаты:
Серии, | сумма | ||||||||||
Количество упаковок, | |||||||||||
Из них соответствующие стандарту, | |||||||||||
Для стандартных изделий в упаковке, . | 1,00 | 0,972 | 0,917 | 0,944 | 0,944 | 1,00 | 0,944 | 0,917 | 0,944 | 1,00 | 0,958 |
С вероятностью 0,95 (t=1,96) установить пределы стандартной продукции во всей партии.
По формуле средней ошибки выборки для серийного отбора получим
.
Предельная ошибка выборки равна
Итак доверительный интервал для доли стандартных изделий во всей партии получим или 0,94<р<0.976 следовательно от 94% до 97,6% изделий в партии являются стандартными.