Оценка необходимой численности выборки

Для того, чтобы выборочная совокупность была количественно репрезентативной по отношению к генеральной, необходимо первоначально оценить количество данных, которое требуется включить в выборочную совокупность.

При неизвестной величине генеральной совокупности величину повторной выборки, гарантирующую репрезентативные результаты, если результат отражается показателем в виде относительной величины (доли), определяют по формуле:

, (1)

где р – величина показателя изучаемого признака, в %; q = (100-p);

t – доверительный коэффициент, показывающий, какова вероятность того, что размеры показателя не будут выходить за границы предельной ошибки (обычно берется t = 2, что обеспечивает 95% вероятность безошибочного прогноза);

D — предельная ошибка показателя.

Например: одним из показателей, характеризующих здоровье рабочих промышленных предприятий, является процент не болевших в течение года работников. Предположим, что для промышленной отрасли, к которой относится обследуемое предприятие, этот показатель равен 25%. Предельная ошибка, которую можно допустить, чтобы разброс значений показателя не превышал разумные границы, 5%. При этом показатель может принимать значения 25% ±5%, т.е. от 20% до 30%. Допуская t = 2, получаем

В том случае, если показатель — средняя величина, то число наблюдений можно установить по формуле:

, (2)

где σ — среднее квадратическое отклонение, которое можно получить из предыдущих исследований, либо на основании пробных (пилотажных) исследований.

При бесповторном отборе и при условии известной генеральной совокупности для определения необходимого размера случайной выборки в случае использования относительных величин (доли)применяется формула:

(3)

для средних величин используется формула:

, (4)

где N — численность генеральной совокупности.

Исходя из условий приведенного выше примера и принимая численность генеральной совокупности N=500 рабочих, получаем:

Нетрудно заметить, что необходимая численность выборки при бесповторном отборе меньше, чем при повторном (соответственнo, 188 и 300 рабочих).

В целом, число наблюдений, необходимое для получения репрезентативных данных, изменяется обратно пропорционально квадрату допустимой ошибки.

Механическая выборка— выборка, когда из обследуемой совокупности единицы наблюдения отбираются механически. Например: отбор каждого пятого или каждого десятого рабочего по карточкам отдела кадров предприятия или по амбулаторным картам поликлиники МСЧ.

Типическая, типологическаяилирайонированная выборка предполагает разбивку генеральной совокупности на ряд качественно однородных групп. Например: при изучении заболеваемости студентов вуза для углубленного обследования на каждом курсе выбираются типичные по своему составу студенческие группы. Часто этот способ отбора комбинируется с другими способами. Например: территория города делится в зависимости от степени загрязнения на типичные районы, в этих районах путем случайного отбора формируются группы наблюдения.

Когортный отбор относится к целенаправленным отборам. При этом способе из генеральной совокупности отбираются лица (распределение на подгруппы при этом является неслучайным), объединенные моментом появления какого-либо признака или изучаемого воздействия, играющего существенную роль в исследовании (год рождения, начало болезни, прием препарата и т.п.).

Исследование по типу случай-контроль (СК) – тип эпидемиологического исследования, в котором распределение фактора риска сравнивается в группе пациентов с заболеванием и контрольной группе. Исследование (СК) относится к ретроспективным, поскольку исследователь, разделив пациентов на группы, по тому, есть или нет у них заболевание, выясняет у них информацию из прошлого.

Следует отдельно остановиться на использовании выборочного метода в санитарной статистике при изучении общей заболеваемости населения. Теоретические предпосылки выборочного метода были проверены в ходе специальных исследований. Так, В.С. Быховский и соавт. в 1928 году сделали параллельную обработку 132,8 тыс. карт с данными о заболеваниях сплошным методом и методом механического отбора каждой пятой карты. Анализ результатов этой обработки показал высокую репрезентативность данных выборочного исследования заболеваемости. Однако, вплоть до сегодняшнего дня, отсутствуют единые методические подходы проведения в широкой практике выборочных санитарно-статистических исследований.

Основы группировки данных

Программа разработки предусматривает реализуемые на втором этапе статистического исследования сводку и группировку статистических данных. Эти операции, осуществляемые на основе статистических таблиц, позволяют систематизировать полученные в ходе наблюдения данные, провести обработку и подсчет групповых итогов, расчеты простейших производных величин (статистических коэффициентов, средних величин). На этом же этапе, для повышения наглядности данных, предусматривается использование графических изображений. Иногда (в официальной статистике — почти всегда) на этом заканчивается весь процесс обработки собранных данных.

Группировка — основа статистической разработки (систематизации)первичного материала. Группировка, правильно спланированная на этапе подготовки исследования, позволяет облегчить регистрацию или повысить точность измерений на этапе сбора исходных данных без снижения результативности исследования в целом. Группировка собранной исходной информации определяет весь ход статистического анализа.

В ходе статистической разработки исследователю приходится сталкиваться со следующими вариантами группировок, каждый из которых имеет свои методические особенности:

• разделение анализируемой статистической совокупности на группы по тем или иным признакам. С такого рода группировкой приходится сталкиваться уже при подготовке программы сбора и в ходе реализации программы разработки любого исследования;

• объединение мелких однородных групп в более крупные. Этот вариант группировки применяется, как правило, уже в процессе статистической обработки данных, если выясняется несостоятельность мелких групп (малое число наблюдений, нечетко выраженный характер распределений и т.п.). Возможность такой группировки целесообразно предусмотреть уже на этапе подготовки программы сбора данных, т.е. обеспечить возможность укрупнения групп в соответствии с общепринятыми границами групп;

• комплексная группировка обеспечивает формирование комплексных оценок на основе многих учетных признаков, даже если они разнородны. Такая группировка часто делается на основе специально разрабатываемых алгоритмов или экспертных оценок (по аналогии — постановка диагноза на основе многих симптомов и результатов лабораторных обследований). Такая группировка представляет весьма сложную задачу и нередко сама по себе является самостоятельной целью исследования.

Выделяют следующие основные виды группировки в зависимости от конкретной цели статистического исследования (табл. 1).

Таблица 1

Классификация статистических группировок

Аналитические	Структурные	Типологические	Специальные (балансовые, матричные и т.д.)
Характеризуют взаимосвязи между признаками, проявляют основные тенденции	Выявляют состав, структуру обследованных групп	Характеризуют основные группы (типы групп признаков)	Используются при составлении балансов предприятий и учреждений, отраслей промышленности и т.п.

Аналитическая группировка выявляет взаимосвязи между явлениями (признаками их характеризующими). При этом они подразделяются на факторные и результативные. Взаимосвязь проявляется в систематическом изменении результативного признака в связи с изменением факторного. Например: температура тела влияет на частоту пульса, в зависимости от величины роста изменяется вес и т.п.

Структурная группировка выявляет состав, строение однородной в качественном отношении статистической совокупности. Например: состав больных по полу, возрасту, диагнозу и т.п. Сопоставление данных структурной группировки во времени дает представление о структурных сдвигах.

Группировка типологическая — с ее помощью в статистической совокупности выделяются качественно однородные в существенном отношении группы. Например: группы больных с одинаковым диагнозом, с одинаковым исходом заболеваний и т.п.

При статистической разработке материала любого исследования необходимо учитывать существующие правила и стандарты определения группировочных признаков и границ групп (возрастно-половые группировки, группировки по категориям тяжести труда и т.п.). Несоблюдение правил формирования этих группировок ведет к потере ценности данных.

В национальной статистике выделяют следующие возрастно-половые группы (в границах точного возраста):

1) Дети до 3 лет. Эта группа находится под наблюдением детских консультаций и обслуживается детскими яслями. Из них часто выделяются дети в возрасте 1 и 2 года жизни;

2) Дошкольники — дети от 3 до 7 лет. Обслуживаются детскими садами;

3) Дети и подростки школьного возраста от 7 до 13 лет и 13—16 лет;

4) Подростки от 16 до 18 лет;

5) Трудоспособный контингент — мужчины 16—60 лет, женщины 16—55 лет;

6) Лица пенсионного возраста — мужчины 60 лет и старше, женщины 55 лет и старше;

7) Женщины репродуктивного возраста — обычно от 15 до 45 лет.

Иногда для группировки по возрасту используют одногодичные или (для взрослых) пятилетние, реже десятилетние интервалы. Группировка с пятилетним интервалом выглядит следующим образом: до 20 лет, 20—24, 25—29, 30—35 и т.д. С десятилетним интервалом: до 20 лет, 20—29, 30—39 и т.д. При изучении заболеваемости в связи с производственными факторами обычно используются аналогичные 5- и 10-летние интервалы группировок по стажу работы: 1—4 года, 5—9 лет, 10—14 лет и т.д. При этом, к группе 1—4 года относятся лица со стажем от 1 года до 4 лет 11 мес. 29 дней. Аналогично, к группе со стажем от 5 до 10 лет относятся лица, отработавшие от 5 лет до 9 лет 11 мес. и 29 дней.

В ряде случаев целесообразно расчленять отдельные крупные группы на более мелкие. Например: до 20 лет, 20—29, 30—39, 40—44, 45—49, 50—59, 60 и старше.

Группировка данных по своей сути представляет собой принцип классификации, т.е. установление принадлежности явлений и объектов к определенным классам. В государственной статистике для этого используются классификаторы — специальные справочники, инструкции и указатели в виде алфавитных и систематических словарей, дополняемых стандартным перечнем объектов и их групп. Использование классификаторов в официальной статистике является обязательным и имеет силу государственного стандарта. Основные классификаторы рассчитаны на длительное использование. Однако, с течением времени они пересматриваются, дополняются, в них вносятся необходимые коррективы. Так, с 1983 до 1999 года в СССР, а затем в России общепринятой считалась Международная статистическая классификация болезней, травм и причин смерти 9-го пересмотра. С 1999 года была введена классификация 10-го пересмотра (с 01.01.99 г. по Приказу Минздрава России № 3 от 12.01.98 г.).

В медико-биологических научных исследованиях использование государственных и международных классификаторов болезней и причин смерти не является строго обязательным. Однако, только их прямое применение или возможность путем вторичной группировки привести данные исследований в рамки, определяемые общепринятыми классификаторами, гарантирует сопоставимость статистических материалов о заболеваемости, причинах смерти разных категорий населения на различных территориях страны и зарубежом.

1. Вопросыпотемезанятия:

1. Основные этапы научного исследования.

2. Цели, задачи и план исследования.

3.Способы получения исходных данных для исследования.

4. Понятия текущего и единовременного наблюдения.

5. Сплошное и не сплошное исследование. Методы.

6. Виды выборок.

7. Понятия повторной и бесповторной выборки.

8. Оценка численности выборки для доли в случае повторного отбора.

9. Оценка численности выборки для доли в случае бесповторного отбора.

10. Оценка численности выборки для среднего в случае повторного отбора.

11. Оценка численности выборки для среднего в случае бесповторного отбора.

12. Группировка собранной исходной информации.

2. Тестовые задания по теме с эталонами ответов:

1. ПЕРВЫЙ ЭТАП СТАТИСТИЧЕСКОГО ИССЛЕДОВАНИЯ ВКЛЮЧАЕТ В СЕБЯ

1) анализ результатов

2) вычисление первичных итогов

3) определение целей и задач, составление плана исследования

4) углубленную математико-статистическую обработку данных

2. ПО ОХВАТУ СТАТИСТИЧЕСКОЙ СОВОКУПНОСТИ ИССЛЕДОВАНИЕ МОЖЕТ БЫТЬ

1) сплошное или единичное

2) сплошное или не сплошное

3) не сплошное или выборочное

4) первичное или вторичное

3. КО ВТОРОМУ ЭТАПУ СТАТИСТИЧЕСКОГО ИССЛЕДОВАНИЯ ОТНОСИТСЯ

1) анализ полученных результатов, выводы

2) наблюдение, сводка и группировка полученных статистических материалов

3) определение целей и задач

4) углубленная математико-статистическая обработка данных

4. ПРИЗНАКИ, ПОДЛЕЖАЩИЕ РЕГИСТРАЦИИ В ХОДЕ СТАТИСТИЧЕСКОГО ИССЛЕДОВАНИЯ, НАЗЫВАЮТСЯ

1) количественные

2) учетные

3) качественные

4) случайные

5. УЧЕТНЫЕ ПРИЗНАКИ ПО ВИДУ МОГУТ БЫТЬ

1) качественные или количественные

2) первичные или факторные

3) результативные или вторичные

4) вероятные или достоверные

6. ПО РОЛИ В СТАТИСТИЧЕСКОЙ СОВОКУПНОСТИ УЧЕТНЫЕ ПРИЗНАКИ МОЖНО ПОДРАЗДЕЛИТЬ НА

1) достоверные и невозможные

2) первичные и вторичные

3) качественные и вероятные

4) факторные и результативные

7. СБОР ДАННЫХ ПРИ ПЕРЕПИСЯХ НАСЕЛЕНИЯ ОТНОСИТСЯ К НАБЛЮДЕНИЮ

1) текущему

2) единовременному

3) случайному

4) математическому

8. ИССЛЕДОВАНИЕ, ПРЕДПОЛАГАЮЩЕЕ РЕГИСТРАЦИЮ ВСЕХ СЛУЧАЕВ, СОСТАВЛЯЮЩИХ ГЕНЕРАЛЬНУЮ СОВОКУПНОСТЬ, НАЗЫВАЕТСЯ

1) первичным

2) случайным

3) выборочным

4) сплошным

9. СОВОКУПНОСТЬ, СОСТОЯЩАЯ ИЗ ОТНОСИТЕЛЬНО ОДНОРОДНЫХ ЭЛЕМЕНТОВ, ОБЪЕДИНЕННЫХ НАСТУПЛЕНИЕМ ОПРЕДЕЛЕННОГО ПРИЗНАКА, НАЗЫВАЕТСЯ

1) группой

2) когортой

3) классом

4) выборкой

10. ОШИБКИ, СВЯЗАННЫЕ С НЕПРАВИЛЬНЫМ ВЫБОРОМ ОБЪЕКТА ИССЛЕДОВАНИЯ, ИСПОЛЬЗОВАНИЕМ НЕПРАВИЛЬНЫХ ГРУППИРОВОК, НАЗЫВАЮТСЯ

1) методические

2) логические

3) математические

4) статистические

11. ОШИБКИ, ЗАКЛЮЧАЮЩИЕСЯ В НЕОБОСНОВАННОМ ИСПОЛЬЗОВАНИИ РАЗЛИЧНЫХ СТАТИСТИЧЕСКИХ КРИТЕРИЕВ И ПРИВОДЯЩИЕ К ИСКАЖЕНИЮ СУЩНОСТИ РЕЗУЛЬТАТОВ ИССЛЕДОВАНИЯ, НАЗЫВАЮТСЯ

1) логические

2) статистические

3) математические

4) методические

12. ЧЕТВЕРТЫЙ ЭТАП СТАТИСТИЧЕСКОГО ИССЛЕДОВАНИЯ ВКЛЮЧАЕТ В СЕБЯ

1) анализ полученных результатов, выводы

2) определение целей и задач

3) вычисление первичных итогов

4) углубленная математико-статистическая обработка данных

13. ВЫБОР ОБЪЕКТА И ЕДИНИЦЫ НАБЛЮДЕНИЯ, А ТАКЖЕ УЧЕТНЫХ ПРИЗНАКОВ, ПОДЛЕЖАЩИХ РЕГИСТРАЦИИ В ХОДЕ ИССЛЕДОВАНИЯ, ВКЛЮЧАЕТ В СЕБЯ

1) план исследования

2) схему исследования