Выборочный метод в статистике
Выборочное наблюдение – это такое несплошное наблюдение, при котором отбор подлежащих обследованию единиц совокупности осуществляется случайно, отобранная часть подвергается обследованию, после чего результаты распространяются на всю исходную совокупность.
К использованию выборочного метода (или выборки) прибегают в различных случаях, когда само наблюдение связано с порчей или уничтожением наблюдаемых единиц (например, при контроле качества: испытание пряжи на крепость, консервов на доброкачественность), когда сплошное наблюдение нельзя осуществить из-за большого объема совокупности, когда исследование нужно провести в сжатые сроки при небольших затратах, и др.
Естественно, что при выборочном наблюдении возникают расхождения между показателями выборочной и генеральной совокупности. Ошибки выборки при строгом соблюдении принципа случайного отбора носят случайный характер.
Зависимость величины ошибки выборки от ее абсолютной численности и от степени варьирования признака находит выражение в формулах средней ошибки выборки.
Когда выборочное обследование ставит своей задачей измерить среднее значение многозначного признака при случайном повторном отборе, средняя ошибка выборочной средней рассчитывается по формуле
,
где (мю) – средняя ошибка выборочной средней; – дисперсия выборочной совокупности; n – численность выборки.
При бесповторном отборе она рассчитывается по формуле
,
где N – численность генеральной совокупности.
Доказано, что генеральные характеристики не отклоняются от выборочных на величину бльшую, чем ошибка выборки , и всегда имеют постоянную степень вероятности равную 0,683, т. е. из 1000 случаев в 683 случаях сводная генеральная совокупность отличается от сводной выборочной совокупности на величину , а в остальных 317 случаях может отличаться и в большей степени. При удвоенном значении ошибки вероятность нашего утверждения достигает 0,954. Это означает, что в 954 случаях из 1000 достигает вероятность утверждения, и лишь в 46 случаях выйдет за пределы .
Значит, с определенной степенью вероятности мы можем утверждать, что отклонения выборочных характеристик от генеральных не превышает некоторой величины, которая называется предельной ошибкой выборки и исчисляется по формуле
или ,
где ∆ – предельная ошибка выборки; t – коэффициент кратности ошибки (или еще его называют – коэффициент доверия); t – коэффициент доверия, зависит от значения вероятности P.
Ошибка выборки определяется степенью варьирования изучаемого признака, которая характеризуется дисперсией для альтернативного признака: .
Средняя ошибка выборки для доли альтернативного признака определяется по формуле
,
где р – доля признака в выборочной совокупности.
Расчетная формула средней ошибки выборки для доли альтернативного признака при случайном повторном отборе: .
При бесповторном отборе для частости: .
При проектировании выборочного наблюдения с заданным значением допустимой ошибки выборки необходимо определить численность выборочной совокупности исходя из формул: , отсюда , для доли (альтернативного признака) , .
Аналогично из формул предельной ошибки выборки для бесповторного отбора (для доли): .
РЕШЕНИЕ ТИПОВЫХ ЗАДАЧ
Задача 1
Методом случайной выборки было взято для проверки на вес 200 шт. деталей алюминиевого литья в литейном цехе завода. В результате был установлен средний вес детали 30 г при среднем квадратическом отклонении с вероятностью Р = 0,954.
Определить пределы, в которых находится средний вес детали в генеральной совокупности.
Решение:
1) Определяем предельную ошибку выборки по формуле:
.
Ответ: средний вес детали в генеральной совокупности находится в пределах от 29,44 до 30,56 г.
Задача 2
По схеме повторной выборки произведено выборочное измерение выработки на земляных работах у 144 рабочих. Средняя выработка составила 4,95 м3 на одного рабочего, а средний квадрат отклонений 2,25.
Определить среднюю ошибку выборки.
Решение:
.
Ответ: с вероятностью 0,683 можно утверждать, что средняя выработка у всех рабочих находится в пределах от 4,825 до 5,075 м3.
Задача 3
Среди выборочно обследованных 1000 семей по уровню душевого дохода (выборка 2%, механическая) малообеспеченных оказалось 300 семей.
Определить с вероятностью 0,997 долю малообеспеченных семей во всем регионе.
Решение:
1) определяем долю малообеспеченных семей:
;
2) определяем предельную ошибку доли:
.
Вывод: доля малообеспеченных семей в регионе колеблется от 28,6% до 31,4 %.
Задача 4
Для определения среднего возраста 1200 студентов экономического факультета необходимо провести выборочное обследование методом случайного бесповторного отбора. Среднее квадратическое отклонение возраста студентов 10 лет.
Определить: сколько студентов нужно обследовать, чтобы с вероятностью 0,954 средняя ошибка выборки не превышала 3 года.
Решение:
ЗАДАЧИ ДЛЯ РЕШЕНИЯ
Задача 1
На заводе с числом работающих 5000 человек было проведено 4%-ное выборочное обследование квалификации рабочих методом случайного бесповторного отбора. Получены следующие данные:
Квалификация рабочих (тарифные разряды) | ||||||
Число рабочих |
С вероятностью 0,997 определить пределы, в которых находится средний тарифный разряд рабочих завода. Среднее квадратическое отклонение – 1,1.
Задача 2
В порядке механической выборки пряжи было подвергнуто испытанию на разрыв 10 нитей из партии. В результате обследования установлена средняя крепость пряжи при среднем квадратическом отклонении σ = 20 г с вероятностью Р = 0,954. Определить пределы, в которых находится средняя крепость пряжи в партии.
Задача 3
В порядке случайной повторной выборки из партии, поступившей на хлебозавод, было взято 100 проб муки пшеничной. В результате исследования была установлена средняя влажность муки в выборке 9% при среднем квадратическом отклонении 1,5% с вероятностью 0,954. Определить пределы, в которых находится средняя влажность муки в партии.
Задача 4
В лесхозе в порядке случайной выборки обследовано 900 деревьев. По этим данным установлен средний диаметр одного дерева 235 мм, и среднее квадратическое отклонение равно 27 мм с вероятностью 0,683. Определить границы, в которых будет находиться средний диаметр деревьев в генеральной совокупности.
Задача 5
При обследовании 500 образцов изделий на фурнитурной фабрике, отобранных из партии готовой продукции в случайном порядке, 40 оказались нестандартными. С вероятностью 0,954 определить пределы, в которых находится доля нестандартной продукции, выпускаемой фабрикой.
Задача 6
В порядке случайной повторной выборки было обследовано 80 предприятий отрасли, из которых 20 предприятий имели долю нестандартной продукции выше 0,5%. С вероятностью 0,997 определить пределы, в которых находится доля предприятий, выпускающих более 0,5% нестандартной продукции в этой отрасли.
Задача 7
В порядке изучения мнения студентов о проведении определенных мероприятий из совокупности 10 тыс. человек методом случайного бесповторного отбора опрошено 600 студентов. Из них 240 одобрили план мероприятий. С вероятностью 0,954 определить пределы, в которых находится доля студентов, одобривших мероприятия, во всей совокупности.
Задача 8
На ткацкой фабрике работает 6 тыс. ткачих. Для установления норм выработки предполагается провести случайный бесповторный отбор ткачих. Предварительным обследованием установлено, что среднее квадратическое отклонение дневной выработки составляет 25 м. Определить необходимую численность выборки при условии, что с вероятностью 0,954 ошибка выборки не превысит 5 м.
Задача 9
С целью определения качества пряжи на прядильной фабрике предполагается провести выборочное обследование пряжи методом случайного повторного отбора. Какова должна быть численность выборки, чтобы с вероятностью 0,954 ошибка выборочной средней не превышала 4 г при среднем квадратическом отклонении 20 г?
Задача 10
На заводе предполагается провести выборочное обследование средней часовой выработки рабочих методом случайного повторного отбора. Какова должна быть численность выборки, чтобы с вероятностью 0,954 ошибка выборки не превышала 5 шт., если на основе предыдущих обследований известно, что дисперсия равна 225?
Задача 11
В районе проживает 2000 человек. Определить необходимую численность выборки с вероятностью 0,954 для определения среднего размера семьи при условии, что предельная ошибка выборки не должна превышать 0,8 человека. Среднее квадратическое отклонение 2 человека.
ТЕСТЫ
1. Генеральная средняя – это:
а) обобщающая характеристика совокупностей;
б) среднее значение варьирующего признака во всей совокупности;
в) среднее значение признака у единиц, которые подвергались выборочному наблюдению;
г) часть совокупности единиц, которая подвергалась выборочному обследованию.
2. Предельная ошибка выборки определяется по формуле:
а) ;
б) ;
в) ;
г) .
3. Формула средней ошибки выборки для средней при бесповторной выборке:
а) ;
б) ;
в) ;
г) .
4. Доля выборки – это:
а) средняя величина количественного признака;
б) относительная величина альтернативного признака;
в) средняя ошибка выборки;
г) отношение числа единиц выборочной совокупности к числу единиц генеральной совокупности.
Тема 8