Теоретические основы формирования выборки
Методология исследования массовых статистических явлений в зависимости от полноты охвата изучаемого объекта (явления) различает сплошное и не сплошное наблюдение. Разновидностью не сплошного наблюдения является выборочное, которое все более широкое применение.
Под выборочным наблюдением понимается метод статистического исследования, при котором обобщающие показатели изучаемой совокупности устанавливаются по некоторой ее части на основе положений случайного отбора. При выборочном методе обследованию подвергается сравнительно небольшая часть всей изучаемой совокупности, получившая название выборочной совокупности или просто выборки.
Выборка должна быть представительной (репрезентативной), чтобы по ней можно было судить о генеральной совокупности. Репрезентативность означает, что объекты выборки достаточно хорошо представляют генеральную совокупность. Заметим, что при отборе объектов могут сыграть роль личные мотивы или психологические факторы, о которых исследователь, проводящий выборку, и не подозревает. При этом выборка, как правило, не будет репрезентативной.
Предупреждение систематических (тенденциозных) ошибок выборочного обследования достигается в результате применения научно обоснованных способов формирования выборочной совокупности, в зависимости от которых выборка может быть:
· собственно-случайной;
· механической;
· типической;
· серийной;
· комбинированной.
В табличном процессоре Microsoft Excel реализована собственно-случайная выборка.
Собственно-случайная выборка состоит в том, что выборочнаясовокупность образуется в результате случайного (непреднамеренного) отбора отдельных единиц из генеральной совокупности. Именно принцип случайности попадания любой единицы генеральной совокупности в выборку предупреждает возникновение систематических (тенденциозных) ошибок выборки. Собственно-случайная выборка может быть осуществлена по схемам повторного и бесповторного отбора. Повторный отбор предполагает возможность включения в выборку одного и того же элемента генеральной совокупности два раза и более. Бесповторный отбор исключает такую возможность. В Microsoft Excel реализована схема повторного отбора. На практике, особенно при большом объеме генеральной совокупности, дляорганизации собственно-случайной выборки часто используют таблицу случайных чисел или генератор случайных чисел. В Microsoft Excel выборка формируется на основе генератора случайных чисел.
Выборочный метод, обладая несомненным достоинством, состоящим в возможности значительно сократить время на контроль и получение основных статистических характеристик, приводит к появлению ошибки и уменьшению гарантии получения истинных характеристик генеральной совокупности. Данное обстоятельство особенно важно учитывать при формировании так называемых малых выборок. При этом достаточно сложной проблемой является определение необходимого (оптимального) объема выборки. В математической статистике доказывается, что необходимая численность собственно-случайной повторной выборки определяется выражением:
–предельная ошибка выборки;
σ2– дисперсия генеральной совокупности;
t – коэффициент доверия (определяется в зависимости от того, с какой доверительной вероятностью надо гарантировать результаты выборочного обследования).
Затруднительным моментом применения приведенной формулы на практике является расчет генеральной дисперсии σ2 . Для ее оценки пользуются или материалами предыдущих исследований, или производственно-техническими нормативами, или, если предыдущие варианты неосуществимы, проводят пробное обследование. По результатам пробного обследования оценивают значение генеральной дисперсии для последующего обоснования необходимого объема выборки.