Основные способы организации выборки
Достоверность статистических выводов и содержательная интерпретация результатов зависит от репрезентативности выборки, т.е. полноты и адекватности представления свойств генеральной совокупности, по отношению к которой эту выборку можно считать представительной.
Изучение статистических свойств совокупности можно организовать двумя способами: с помощью сплошного и выборочного наблюдения. Сплошное исследование предусматривает обследование всех единиц изучаемой совокупности, а выборочное исследование — только его части.
Существуют шесть основных способов организации выборочного исследования:
1. Простой случайный отбор, при котором объектов случайно извлекаются из генеральной совокупности объектов. Такой отбор осуществляется с помощью таблиц случайных чисел или аналогичных им компьютерных программ. Этот способ обеспечивает случайный бесповторный отбор, при котором единица наблюдения выбирается из генеральной совокупности только один раз. Такие выборки называются собственно-случайными и в настоящее время считаются «золотым стандартом рандомизации».
2. Простой механический отбор, при котором единицы наблюдения располагают по порядку исходя из какого-либо случайного признака: номер истории болезни, номер амбулаторно карты больного, первая буква фамилии и т.п. Затем определяется интервал, через который из списка генеральной совокупности механически будут выбраны единицы наблюдения (например, каждая четвертая). Для определения интервала численность генеральной совокупности следует разделить на численность необходимой выборки. Полученные таким способом выборки называются механическими.
3. Стратифицированный отбор заключается в том, что генеральная совокупность подразделяется на подсовокупности или слои (страты). Деление на страты проводится по какому-либо типичному признаку. Чаще всего используют различные индивидуальные признаки людей, такие как возраст, профессия, социальная занятость, воздействие предполагаемых факторов риска и т.п. В этом случае выборки называются стратифицированными (иначе, расслоенными, типическими, районированными).
4. Серийный (гнездовой) отбор используется для формирования серийных или гнездовых выборок. Этот способ отбора похож на стратифицированный. Различия в том, что при серийном отборе из генеральной совокупности случайным способом выбираются не отдельные единицы наблюдения, а целые их группы, которые называются сериями (гнездами). Сериями могут быть отдельные учреждения, отделения, палаты, цеха, участки и т.п. Затем в каждой серии проводится сплошное изучение всех единиц наблюдения. Этот метод отбора удобен, если необходимо обследовать сразу "блок" или серию объектов. Отбор серий можно осуществить собственно-случайным или механическим способом.
5. Метод направленногоотбора предполагает еще на этапе определения генеральной совокупности исключать из аналитического изучения некоторые факторы, влияние которых хорошо известно. Это позволяет выявить другие дополнительные факторы риска заболевания.
6. Комбинированный (ступенчатый) отбор может сочетать в себе сразу несколько способов отбора (например, стратифицированный и случайный или случайный и механический). Такая выборка называется комбинированной.
Виды отбора
ü Индивидуальный
ü Групповой
ü Комбинированный отбор
При индивидуальном отборе в выборочную совокупность отбираются отдельные единицы генеральной совокупности, при групповом отборе — качественно однородные группы (серии) единиц, а комбинированный отбор предполагает сочетание первого и второго видов.
Методы отбора
ü Повторная выборка
ü Бесповторную выборку
Бесповторным называется отбор, при котором попавшая в выборку единица не возвращается в исходную совокупность и в дальнейшем выборе не участвует, при этом численность единиц генеральной совокупности N сокращается в процессе отбора.
При повторном отборе попавшая в выборку единица после регистрации возвращается в генеральную совокупность и таким образом сохраняет равную возможность наряду с другими единицами быть использованной в дальнейшей процедуре отбора, при этом численность единиц генеральной совокупности N остается неизменной.
Методы сбора информации
Для выявления причин возникновения и распространения болезней необходима не только информация о заболеваемости, но обязательно и информация, позволяющая всесторонне оценить состояние здоровья человека, социальных, биологических и природно-климатических факторов среды. Как уже указывалось, к началу исследования, значительная часть необходимой информации уже находится в различных документах. Следовательно, участникам исследования (персоналу) необходимо, прежде всего, извлечь из соответствующих источников требуемые данные.
При необходимости, участники исследования получают (собирают) информацию самостоятельно. Это, в частности, относится к данным, регистрация которых не предусмотрена обычной работой других специалистов. Кроме того, к самостоятельному сбору информации, прибегают для уточнения сомнительных данных официальной регистрации.
Независимо от того, кто получает данные (участники исследования или другие специалисты) можно выделить (по признаку времени) два метода сбора информации:
ü метод постоянного (текущего, динамического, оперативного) сбора (наблюдения);
ü метод одномоментного (единовременного, одновременного) сбора (наблюдения).
Постоянный сбор данных означает регистрацию событий по мере их возникновения в течение необходимого промежутка времени. Например, работа врача, лаборанта, любого другого специалиста ежедневно сопровождается получением различных данных и фиксацией их в соответствующих документах.
Одномоментный сбор данных приурочен к какому-то определенному моменту времени и поэтому отражает состояние изучаемого явления только на определенный момент времени. Примером единовременного сбора данных являются медицинские осмотры населения, взятие каких-то проб, обследование объектов, перепись населения и др.
Постоянный и одномоментный сбор информации может осуществляться различными способами:
ü выкопировкой;
ü опросом;
ü анкетированием;
ü непосредственным сбором (наблюдением).
Способ выкопировки – самый распространенный способ получения информации, особенно на начальных этапах эпидемиологического исследования. Он предусматривает извлечение необходимых данных из различной медицинской и не медицинской документации.
Опрос больного или здорового человека предусматривает очную беседу врача для получения ответов на интересующие его вопросы.
Анкетный способ – это заочный опрос больных или здоровых людей, При этом каждое лицо, подлежащее обследованию, заполняет, самостоятельно, или с помощью персонала, специальный бланк с вопросами – анкету. Вопросы должны подразумевать четкие и однозначные ответы. Как при опросе, так и при анкетировании качество информации, во многом, зависит от доверия опрашиваемых лиц.
Способ непосредственного сбора (наблюдения) означает регистрацию сведений при непосредственном обследовании больного или здорового человека, изучение элементов окружающей среды, различных объектов и др.
Базы данных
Базы данных — один из основных компонентов современных информационных систем. Информационная система — взаимосвязанная совокупность средств, методов и персонала, используемых для хранения, обработки и выдачи информации. Цель любой информационной системы — обработка информации конкретной предметной области.
Базы данных можно определить как организованную совокупность взаимосвязанных хранимых вместе данных, представленных на электронных носителях, предназначенных и пригодных для решения специальных задач с использованием средств вычислительной техники.
Особенности такой совокупности данных:
ü большие объемы информации;
ü максимально возможная компактность хранения данных;
ü возможность извлечения из БД разнообразной информации в определенной предметной области;
ü удобные для пользователя вид и форма извлекаемой информации;
ü высокая скорость доступа к данным;
ü надежность хранения информации и возможность предоставления санкционированного доступа к данным для отдельных пользователей;
ü удобство и простота конструирования пользователем запросов, форм и отчетов для выборки данных.