П.1. Генеральная и выборочные совокупности
Математические основы выборочного метода.
Определение. Вся совокупность объектов, подлежащих изучению, называется генеральной совокупностью.
Если обследуется каждый объект генеральной совокупности, то говорят, что проводится сплошное обследование. Сплошное обследование позволяет изучить некоторый признак, присущий генеральной совокупности с той же полнотой, с какой мы можем изучить случайную величину по заданному закону распределения вероятностей. На практике сплошным обследованием пользуются достаточно редко. Это связано с несколькими причинами, например: генеральная совокупность содержит слишком много объектов (иногда их число бесконечно), обследование объекта приводит к его порче (исследование автомобиля на безопасность при его лобовом столкновении), проведение сплошного обследования требует больших затрат ресурсов и др.
В этих случаях из генеральной совокупности делают специально подготовленную выборку.
Определение. Выборочной совокупностью или выборкой называется часть объектов, извлеченная из генеральной совокупности для непосредственного изучения.
Изучение выборки позволяет избежать тех сложностей изучения генеральной совокупности, о которых говорилось выше. Однако при выборочном методе неизбежны ошибки в связи с изучением только части совокупности. Эти ошибки могут быть учтены и оценены заранее.
Сформулируем основную задачу выборочного метода.
Основной задачей выборочного метода является оценка параметров признака в генеральной совокупности по данным выборки.
Теоретической основой выборочного метода является закон больших чисел. Опираясь на него, можно утверждать, что при увеличении объема выборки выборочные характеристики сходятся по вероятности к соответствующим характеристикам генеральной совокупности.
Для применения закона больших чисел важно, чтобы выборка достаточно хорошо воспроизводила генеральную совокупность, т.е. была репрезентативной. Репрезентативность выборки достигается случайным отбором элементов из генеральной совокупности. Для достижения случайности отбора стараются обеспечить каждому элементу генеральной совокупности равную возможность попасть в выборку (использование жеребьевки, таблицы случайных чисел и др.).
На практике используют два способа образования выборки.
1. Повторный отбор. При повторном отборе каждый элемент, случайно отобранный из генеральной совокупности, изучается и возвращается обратно в генеральную совокупность.
Достоинство данного способа состоит в том, что он не меняет генеральную совокупность.
2. Бесповторный отбор. При бесповторном отборе отобранный объект не возвращается в общую совокупность.
Недостатком данного метода является то, что генеральная совокупность изменяется. Достоинство – простота в осуществлении.
Различают несколько видов выборок.
1. Собственно-случайная выборка – выборка, образованная случайным отбором элементов с использованием генеральной совокупности как единой целой.
2. Выборки, требующие разделения генеральной совокупности на части или группы, подразделяются на следующие виды.
а) Механическая выборка. Элементы из генеральной совокупности отбираются через определенный интервал. Например, если объем выборки должен составлять 10% от генеральной совокупности, то отбирается каждый десятый объект.
Один из самых известных примеров механических выборок дает нам Плутарх в жизнеописании Марка Красса. Сей древнеримский полководец для наказания когорты, бежавшей от войск Спартака, казнил без всяких разбирательств каждого десятого. Этим он добился того, что его солдаты боялись свое начальство больше, чем противника, а заодно заработал славу одного из главных идиотов античной истории.
б) Типическая выборка. Применяется в том случае, когда обследуемый признак колеблется в различных типических частях генеральной совокупности. В этом случае отбор осуществляется из каждой типической части генеральной совокупности.
Например, определенный тип автомобиля могут производить различные автозаводы. Тогда для определения качества сборки следует взять выборку по каждому типу завода.
в) Серийная выборка. В этом случае в выборку отбираются не элементы, а целые серии, которые подвергаются сплошному обследованию.
Например, если имеется большая группа однотипных станков, то можно изучить целиком продукцию нескольких станков.
В дальнейшем будем считать, что выборки, рассматриваемые в последующих параграфах, являются собственно-случайными.
Поскольку основные параметры (средняя арифметическая, дисперсия и др.) будут встречаться и для генеральной совокупности и для выборки, введем следующие обозначения:
N – объем генеральной совокупности;
n – объем выборки;
– средняя генеральной совокупности (генеральная средняя);
– выборочная средняя;
– дисперсия генеральной совокупности;
– выборочная дисперсия и т.д.