Простой случайный отбор

Выборка с возвращением и без возвращения

Два важных понятия — выборка с возвращением и выборка без возвращения. В ситуации выборки с возвращением возможности наступления всех событий остаются постоянными, так как никакой случай не происходит вслед за появлением любого предыдущего события.

В ситуации выборки без возвращения появление определенного события исключает для него возможность произойти вновь, поскольку данный случай не повторяется. Выборка с возвращением обычно допускает применение теорем сложения и умножения. При выборке без возвращения вероятностная картина существенно меняется и распределение вероятностей принимает форму и свойства гипергеометрического распределения.

«закон больших чисел», местом рождения которого является игорный стол. Со времени его первой формулировки, данной Симоном де Пуассоном, прошло более ста лет. В течение этого времени он претерпел многообразные интерпретации. Иные математики обосновывали его преимущественно теоретически, другие главным образом со стороны практической статистики.

В редакции Антуана Огюстена Курно этот закон определяется следующим образом:

1. События, вероятность которых очень невелика, случаются очень редко.

2. Вероятность того, что отклонение относительной повторяемости от соответствующей вероятности не превышает заданную величину, будет тем больше, чем больше объем наблюдаемой серии.

Вывод: при достаточно большом объеме наблюдаемой серии относительная повторяемость соответствующей ей вероятности очень редко отклоняется больше, чем на заданную малую величину.

Ограничение генеральной совокупности:

Кого исследовать?

Сразу после того, как сформулирована задача исследования, следует установить (определить), какой круг лиц должен быть исследован, какую совокупность, “популяцию”, какой “универсум” должны описывать результаты исследования.

Даже для самого обычного опроса населения должны быть, например, определены возрастные границы: нужно ли исследовать мнения части населения, имеющей право голоса, или всех людей старше 16 лет, или, чтобы лучше учесть молодых покупателей, с 14 лет включительно. Следует ли проводить верхнюю возрастную границу, напри­мер: какие газеты читают люди в возрасте от 16 до 70 лет?

Таким образом, имеются многочисленные и разнообразные ограничения генеральной совокупности. Это могут быть, вероятно, одни лишь мужчины или одни лишь женщины, население определенного города или определенной области или жители одной какой-то категории населенных пунктов, например жители деревенских общин, подписчики ежедневной газеты, владельцы автомобилей, люди одной профессии, работники одного предприятия, а также, может быть, их жены. Здесь нужно принять решение - кто интересует исследователей.

Условием формирования выборки является, как правило, однозначное объективное определение изучаемой совокупности. Все примеры, перечисленные выше, содержат такие объективные характеристики, хотя, если подходить серьезно, они еще нуждаются в уточнении.

“Подписчики ежедневной газеты”: идет ли речь о главе семьи или о всех взрослых в семье подписчика? “Владельцы легкового автомобиля”: должны ли это быть “владельцы” в юридическом смысле слова или “имеющие в распоряжении” - например, лица, которым предоставлена служебная машина?

“Собственно статистическая проблема, - пишет Г. Келлерер о выборочных исследованиях, - возникает в связи со следующими тремя вопросами:

а) каков должен быть объем выборки;

Объем выборки.Может показаться, что чем больше выборка, тем лучше, однако это не всегда так. При увеличении выборки можно получить большую точность оценок, чем требуется на самом деле, и т. о. потратить ресурсы впустую. Во мн. случаях сосредоточение ресурсов на извлечении всей информ. из тщательно отобранной выборки дает больше пользы, чем сплошное обследование, когда невозможно ни проконтролировать сбор данных, ни проанализировать их с той тщательностью и полнотой, как при В. и. Если мы располагаем предварительными сведениями об изменчивости изучаемых характеристик, можно определить объем выборки, необходимый для получения их оценок с любым выбранным по нашему усмотрению уровнем точности. Объем генеральной совокупности никак не связан с объемом выборки, требуемым для заданного уровня точности оценок.

б) как должен происходить отбор элементов выборки;

“Каждый элемент генеральной совокупности в репрезентативном исследовании должен иметь соизмеримые и отличные от нуля возможности попасть в выборку”

в) в какой мере можно положиться на результаты выборки, то есть в какой степени они правильно отражают истинное положение вещей?

Репрезентативность.

Виды отбора

Простой случайный отбор.

При простом случайном отборе каждая единица должна иметь равную возможность быть извлеченной из совокупности в каждом выборе, причем каждый выбор должен производиться независимо от всех др.

Нужен перечень единиц генеральной совокупности. Для этого необходимо всю совокупность представить каким-либо образом в форме, доступной для процедуры выборки. Это могут быть либо полные и постоянно обновляемые списки или картотеки на всех членов совокупности

В одном ведомстве по вопросам труда заведены личные карточки, 8000 шт. (N=8000), по одной на каждого зарегистрированного человека. Объем выборки определен: n =400. Следуя традиционным путем, нужно было бы положить все карточки в большую емкость и хорошо перемешать, а затем вытащить 400 штук. Тысячи лотерейных билетов, скатанные в одинаковые ролики, можно привести с помощью барабана в случайный порядок, для карточек из картотеки такой способ вряд ли пригоден. Кроме того, карточки при этом были бы приведены в ненужный беспорядок, возможно, даже повреждены.

Выход в этой ситуации лежит в нумерации карточек от 1 до 8000 для последующего применения таблицы случайных чисел. Это табличные ряды, например, из 10 000 цифр, которые расположены в совершенно случайном порядке. Изготовление таких таблиц - множество их имеется в продаже - наряду с этим возможно также машинным спосо­бом...

Применяя такую таблицу следует действовать так:

Отмечаем начало в любом месте таблицы и постоянно берем четыре следующих друг за другом числа. Мы получаем, например, 1081,0412,6357,3180,0089... Тогда в картотеке мы отбираем карточки с порядковыми номерами 1081, 412, 6357, 3180, 89... Номера свыше 8000 мы пропускаем.

Наши рекомендации