Выборка в социологическом исследовании
Если социологическое исследование охватывает весь изучаемый массив, оно называется сплошным, т.е. в таком исследовании каждый элемент генеральной совокупности служит единицей сбора информации. В тех случаях, когда объект исследования насчитывает более 500 человек, единственно правильным признается применение выборочного метода.
Совокупность всех возможных социальных объектов, которые подлежат изучению в пределах программы исследования, называется генеральной совокупностью, а часть объектов генеральной совокупности, отобранная с помощью специальных приемов для получения информации о всей совокупности, — выборочной совокупностью (выборкой).
Свойство выборочной совокупности воспроизводить параметры и значимые элементы структуры генеральной совокупности называется репрезентативностью.
Преимущества выборочного исследования по сравнению со сплошным состоят в том, что оно:
• позволяет сократить затраты на сбор и обработку социологической информации;
• позволяет добиться большей оперативности;
• имеет более широкую область применения;
• в ряде случаев позволяет получить более достоверные сведения.
Процесс выборки основан на двух моментах: во-первых, на взаимосвязи и взаимообусловленности качественных характеристик и признаков социальных объектов; во-вторых, на правомерности выводов, о целом на основании изучения его части при условии, что по своей структуре эта часть является микромоделью целого.
Единица отбора — это элемент или набор элементов, предназначенный для отбора на определенной ступени выборки.
Единица анализа — элемент выборочной совокупности (респондент), подлежащий изучению.
Переменной называется множество отдельных значений характеристик элементов совокупности; параметром - суммарное описание переменной в данной генеральной совокупности; статистикой - суммарное описание переменной в выборочной совокупности.
Основная цель выборочного метода — выбор элементов из совокупности таким образом, чтобы распределение этих элементов в выборке повторяло их распределение в совокупности. Достижению этой цели служит наиболее распространенная вероятностная (случайная) выборка. Ее модель связана с понятием статистической вероятности изучаемой во многих отраслях социальных наук (вероятность некоторого ожидаемого события есть отношение числа ожидаемых событий к числу всех возможных).
Самый легкий путь получения случайной выборки — присвоить каждому элементу свой номер, а затем с помощью компьютера рас считать случайные числа, из которых и берется выборка (например, каждый десятый номер в каждой случайной цепи).
Можно выбирать из генеральной совокупности по какому-то принципу (каждая тысячная фамилия из списка абонентов телефонной сети, каждый третий дом на определенной улице; студенты, лившиеся в сентябре, и т.д.)
Преимущества случайной выборки:
• объективность и точность отбора респондентов;
• не требуется детальное знание изучаемой совокупности;
• использование методов математической вероятности.
Недостатки:
• сложность процедуры отбора;
• затратность ресурсов.
На практике часто применяется метод гнездовой выборки. Он предполагает отбор в качестве единиц анализа не отдельных людей, а группы (семьи, студенческие группы, бригады и т.д.) с последующим сплошным их опросом. Гнездовая выборка будет репрезентативна (представительна) в том случае, если состав групп в максимальной степени близок по основным демографическим признакам респондентов.
В некоторых случаях невозможно использование вероятностных схем отбора, описанных выше. Тогда берется целенаправленная выборка, к которой неприменимы правила теории вероятностей. Она осуществляется с помощью методов стихийной выборки, квот и основного массива.
В случае стихийной выборки невозможно предопределить структуру массива респондентов и, соответственно, трудно определить репрезентативность. Существует несколько разновидностей этого метода:
•так называемый отбор «первого встречного». Применим в практике обследований, проводимых средствами массовой информации. Исследователь проводит опрос лиц, которые встретились ему в месте опроса (например, на улице);
•отбор «себе подобных». Исследователь подбирает для опроса или наблюдения респондентов из своего окружения (знакомые, коллеги);
•отбор «желающих участвовать». Примером может служить почтовый опрос читателей газеты или журнала. При таких опросах решение о включении в выборку принимает сам респондент.
Метод квот является распространенным способом отбора респондентов при массовых опросах общественного мнения. Его используют при наличии до начала исследования статистических данных о контрольных признаках элементов генеральной совокупности. Все данные о том или ином контрольном признаке выступают в качестве квоты. Респонденты отбираются целенаправленно, с соблюдением параметров квот. Число характеристик, данные о которых выбираются в качестве квот, как правило, не превышает четырех. Главная задача для интервьюера заключается в том, чтобы создать условия, близкие к случайному отбору, с равными шансами для каждого элемента генеральной совокупности попасть в выборку.
Метод квот позволяет существенно сократить время и средства, затрачиваемые на опросы. К преимуществам квотной выборки относятся также оперативность и малая трудоемкость.
Недостатки квотной выборки:
•требуется детальное знание изучаемой совокупности;
•субъективизм интервьюера при отборе респондентов;
•ограниченное время посещения респондентов; уклонение респондентов от опроса;
•не позволяет использовать методы математической вероятности.
Метод основного массива применяется в разведывательных исследованиях для уточнения какого-нибудь контрольного вопроса. В таких случаях опрашивается 50—60% потенциальных респондентов.
Все рассмотренные методы представляют собой примеры одноступенчатой выборки. Многоступенчатая выборка осуществляется в не сколько ступеней: на первой обычно реализуется гнездовая выборка потом проводится случайный отбор респондентов в гнездах. Многоступенчатая выборка применяется в крупномасштабных исследованиях, когда в генеральной совокупности насчитываются тысячи миллионы единиц, размещенных на значительной территории. При построении многоступенчатой выборки используются несколько способов отбора элементов выборочной совокупности. Например, районированный (типический) отбор производится на основе распределения заданного числа отбираемых единиц измерения, т.е. объема выборки, между так называемыми «районами» — группами элёментов генеральной совокупности, выделяемыми в соответствии значениями изучаемого в исследовании заданного «базового признака». Выделяемые таким образом слои будут внутренне однородными, но отличными друг от друга, а взятые вместе — исчерпывать всю совокупность.
В крупномасштабных многоступенчатых выборках требования: точности оценок смещаются на второй план, уступая место вопросам снижения стоимости исследования за счет выбора минимально допустимого числа единиц опроса.
Объем выборки определяется аналитическими задачами исследования, ее репрезентативность — целевой установкой программы. Обьем выборки влияет на ошибки репрезентации: чем больше величина выборки, тем меньше возможная ошибка. Для увеличения точности два раза необходимо увеличить выборку в четыре раза.
Ошибка репрезентации — это различие между характеристиками генеральной и выборочной совокупности. Количество респондентов включенных в выборочную совокупность, должно составлять генеральной совокупности, но не превышать 2000—2500 человек (если величина генеральной совокупности 5000 человек и более).
Для пробных опросов достаточна выборочная совокупность объемом 100—250 человек. При массовых опросах, если величина генеральной совокупности составляет менее 5000 человек, достаточный объем выборочной совокупности, гарантирующий достоверные результаты исследования, составляет 500 человек.
Оценка надежности результатов выборочного обследования: при ошибке выборки до 3% — повышенная надежность; 3—10% — обыкновенная; 10—20% — приближенная; 20—40% — ориентировочная; более 40% — прикидочная.
В аналитических и экспериментальных исследованиях проблема репрезентативности выборки является второстепенной в сравнении с необходимостью обеспечить качественное представительство изучаемых объектов.
Качество выборки зависит:
•от меры однородности социальных объектов по наиболее существенным характеристикам (чем более они однородны, тем меньшая численность может обеспечить статистически достоверные выводы);
•от степени дробности группировок анализа, планируемых по задачам исследования;
•от целесообразного уровня надежности выводов из предпринимаемого исследования.
Традиционно выделяют следующие виды ошибок:
•случайные (случайные отклонения выборочных значений параметров);
•систематические (ошибки смещения);
•погрешности вычислений.
Погрешности вычислений возникают при математико-статистической обработке результатов измерений. О них необходимо помнить при оценке точности и надежности выборочных данных и при интерпретации результатов исследования.
Случайные ошибки бывают следствием большого числа разнообразных факторов, учесть действие каждого из которых невозможно. Ошибка выборки считается случайной, а выборочная совокупность репрезентативной, если отклонение не превышает в среднем 5%. Наиболее опасный вид ошибок — систематические, или ошибки смещения. Такие ошибки являются результатом действий в одном направлении определенной группы причин, которую необходимо выявить.
Источниками систематических ошибок могут быть: неверные статистические данные о параметрах контрольных признаков генеральной совокупности; ошибочная модель выборки; неправильное формирование выборочной совокупности; несовершенство инструментария и ошибки в организации сбора данных; неправильная интерпретация Результатов первичных измерений и, соответственно, неправильные Последующая обработка и анализ информации.
На правильность результатов исследования в наибольшей степени влияют ошибки смещения, вызванные неправильной реализацией модели выборки, несовершенством инструментария и организация сбора данных. Систематические ошибки могут появиться на любом этапе исследования. Необходимо стремиться к тому, чтобы по возможности исключить ситуации, способствующие их возникновении критически анализировать полученные результаты, природу расхождений выборочных и генеральных совокупностей.
При конструировании модели выборки целесообразно консультироваться со специалистами по математической статистике.
Этап 3. Технологии проведения online-исследований.
1. Социологические исследования с помощью электронной почты. Электронная почта является одним из самых распространенных сервисов Интернета и есть практически у всех пользователей Сети. Этот метод является наиболее простым и универсальным, особенно для пользователя. Эта техника исследования мало чем отличается от традиционной техники опросов, проводимых с помощью карандаша и бумаги. Анкеты в виде текстов рассылаются респондентам в электронных письмах. Длина вопросника должна быть ограниченной, примерно 20-25 вопросов. Для рассылки писем с текстами анкет (опросников), используются списки электронных адресов, которые формируются различными методами. Современные e-mail-опросы позволяют с помощью специальных программ переводить обработку результатов на полуавтомат при получении заполненных анкет. Для повышения уровня собираемости анкет, которые начинают поступать минимум в день рассылки, максимум - через 3 дня, возможна повторная рассылка писем-напоминаний. Подобно традиционному почтовому опросу для контроля осуществляется несколько интерактивных проверок. В e-mail опросе нет возможности избежать вовлечения в исследование ненадежных (недобросовестных) респондентов. Во время заполнения анкеты, респонденты могут менять свои ответы в любом пункте опросника, иногда изменяют формулировку вопроса. Наиболее важное достоинство таких опросов - предельная простота, дешевизна и высокая скорость сбора данных. С помощью электронной почты можно опросить огромное количество респондентов - каждый пользователь имеет свой адрес, а значит потенциально может участвовать в email-опросах. Исследователь, не обладающий специальной компьютерной подготовкой может создать и разослать вопросник и проанализировать полученные данные. Тем не мене, поскольку анкета в таком опросе ограничивается плоским текстовым форматом, исследователь не может отслеживать логику пропусков, случайность в ответах и осуществлять тщательную проверку ошибок. Списки для рассылки электронных анкет формируются из баз электронных адресов, которые собираются исследовательскими и провайдерскими компаниями. Адреса можно собрать с Web-сайтов, где посетители, как правило, оставляют их при регистрации, в списках newgroups, в дискуссионных листах. Более ранние e-mail-опросы проводились с использованием базы данных электронных адресов специализированных журналов. Используются также автономные методы привлечения респондентов - обычная почта и телефон. Но, все же, еmail-опросы идеально подходят для локальных online-исследований: исследования в пределах конкретного учреждения с закрытым кругом участников; исследования в странах, которые имеют не полную инфраструктуру Интрнета.
2. Размещение текстовых анкет в Группах новостей (newgroups).Newgroups создаются для обсуждения определенных тем и привлекают большие аудитории пользователей. Каждая newgroup имеет свой список участников, который можно использовать для составления выборочного списка. Анкета отсылается в виде текстового сообщения на сайт. Опрос респондентов может происходить интерактивно или автономно. Имея текстовую копию вопросника, респонденты могут принять участие в исследовании, сделав необходимые отметки или набрав текст ответа с помощью клавиатуры. Данные от респондентов поступают в виде текстов и требуют самостоятельной обработки. Для того чтобы повысить результативность опроса привлечением новых посетителей newgroups необходимо регулярно переотсылать анкету заново (примерно 1 раз в неделю). Новые посетители чаще всего просматривают только первые 50 рассылок и поэтому могут не увидеть "ушедшую" в самый конец анкету. Прежде чем разослать тексты анкет основного опроса, проводится предварительный опрос отобранных участников newgroups для выяснения их основных характеристик. Эти данные, которые исследователь получает предварительно, могут служить базой, для формирования выборки респондентов. Любой респондент может отказаться от участия в опросе, если он заметил какие-либо средства контроля или слежки за его виртуальным поведением. Существуют различные технические способы, помогающие защитить респондентов о потенциального преследования. Путем защиты респондентов и демонстрирования им этого, исследователь может привлечь к опросу гораздо большее их количество. Опросы в newgroups редко бывают безупречными, однако они очень удобны для исследования целевых групп, трудно достижимых для опроса вне Интернета например: анонимные алкоголики, торговцы наркотиками, сексуальные меньшинства и т. п. Именно такие социальные группы могут быть гораздо легче обнаружены через Интернет. Для более полного обнаружения определенных целевых групп в Интрнете исследователь должен выявить все newgroups данной ориентации. Большое значение в таких опросах имеет анонимность респондентов, которая может поддерживаться на субъективном уровне благодаря Интрнету. Для более индивидуального опроса участников newgroups. Возможна рассылка электронных писем для тех конкретных людей, которые пишут в группу новостей. В зависимости от природы исследования и в связи субъективной анонимностью, многие из таких респондентов проявляют готовность пойти навстречу исследователю. Существенный недостаток online-исследований в newsgroups - отсутствует возможность отслеживать индивидуумов, которые читали вопросник, но не заполнили его.
3. Проведение опросов в Интрнет-форумах или телеконференциях. Данная технология исследования относительно проста и не требует много временных затрат. Информация собирается на протяжении определенного промежутка времени. Для этого необходимо найти телеконференции с интересующей исследователя аудиторией. Некоторое время целесообразно следить за дискуссиями отобранных телеконференций, затем принять активное участие в них. После этого, поместить в телеконференции вопросы, на которые исследователь ожидает получить ответы. Желательно не размещать весь опросник, а только его ключевые вопросы. На полную анкету, которая расположена на Web-сайте, размещается ссылка. Респонденты, как правило, охотнее принимают участие в таких опросах, но могут и создать определенные проблемы: искажение информации, неадекватное реагирование, незаполнение полного текста анкеты. Эта технология хороша в случае, когда для опроса привлекается группа экспертов. Чаще используются открытые вопросы, требующие самостоятельного ввода ответов. Респонденты охотно дают свои ответы и комментарии в телеконференциях.
4. Сетевые страницы (Web-страницы). Это обычная текстовая анкета, но в HTML-формате, которая размещается в Интернете. Все вопросы такой анкеты размещаются поочередно - как и на традиционной бумажной анкете и принимают форму единой длинной страницы. Для ее просмотра и заполнения респондент постоянно "прокручивает" экран монитора, концентрируя при этом внимание и находясь в определенном напряжении. "Плоская" Web-страница может содержать неограниченное число вопросов, на которые респондент отвечает с помощью мыши (отмечая выбранные ответы в закрытых вопросах) и клавиатуры (для набора текста ответов на открытые вопросы). Для построения таких анкет используется специальный язык, который считывает данные в базу и позволяет их автоматически обрабатывать. Ответы участников могут непосредственно быть записаны в базу данных, или пересланы на определенный адрес электронной почты в реальном времени, возможна и комбинация обеих процедур. Преимущества Web-страниц могут превратится в недостатки исследователя, т. к. их создание требует определенных технических навыков. Опрос, при помощи Web-страницы интерактивно не контролируется, поэтому сложно ограничивать время заполнения анкеты и отслеживать количество исправлений в ответах. Для быстрых и простых исследований (где не нужна комплексная обработка данных), Web-страница оказывается очень эффективной. Примерно 80% всех опросных данных собранных через Интернет, появляются благодаря применению технологии Web-страниц. Эта методика подходит для регистрации пользователей и поверхностных исследований (рейтинговых опросов, изучения эмоциональных предпочтений и т. д.) Web-страницы активно используются для маркетинговых опросов на сайтах компаний-производителей определенных потребительских товаров. Такие сайты, как правило, имеют свою постоянную целевую аудиторию, а суть вопросов анкеты не вызывает у посетителя сайта никаких предубеждений для подачи ответов.
5. Стандартный Web-опросник. Это программа, содержащая вопросник в HTML-формате, которая размещается в Интернете. Она базируется на гипертексте и визуализации информации, с использованием элементов мульти-носителя как например, картинки, графики, звуки, и т.п. Стандартный Web-опросник может содержать различные изображения, графику, озвучивание в отличие от более ранних сред для online-опросов: электронной почты и newsgroup. Web-опросники, размещенные в WWW имеют некоторые уникальные преимущества. Они могут быть сделаны с максимально привлекательными шрифтами и графикой. Характеристики гипертекста WWW обычно предоставляют возможности для адекватной реакции, давая максимум пояснений для респондентов. Стандартный Web-опросник представляет собой программу, содержащую несколько web-страниц, которые загружаются поочередно или в случайном порядке. В любом случае, при запуске программы, сначала появляется страница с аннотацией исследования и инструкцией к анкете. Затем, листая страницы Web-опросника, респондент отвечает на вопросы, которые по одному высвечиваются на экране монитора. Во время ответа, респондент видит только один вопрос, он может спокойно его прочесть и подумать над ответом, не отвлекаясь на предыдущие или последующие вопросы. Чаще всего, кроме вопроса и вариантов ответов, на отдельной странице Web-опросника размещены счетчики времени, заполненных и незаполненных вопросов. Время ответа на один вопрос можно ограничить, а так же заблокировать "пролистывание" вперед и назад всего опросника. На отдельной странице респондент заполняет свои личные данные, а затем загружает весь массив своих ответов в базу для обработки. В случае избегания ввода информации о личности респондента, возможна задержка или частичная потеря ранее введенных ответов. В таком случае респондент рискует потерять шанс на вознаграждение за участие в опросе. С помощью высокотехнологичных и адаптационных программ, которые создают Web-опросники, исследователь может заранее устанавать стандарты более гибкого управления изучения онлайновой среды. Большим преимуществом технологии Web-опросника является возможность создания более сложных анкет. Но с другой стороны, работа по этой технологии требует больше времени, чтобы запустить опрос, а так же достаточно сложна для исследователя с точки зрения техничеких навыков. Далеко не каждый социолог умеет самостоятельно программировать и модифицировать программы. Стоимость исследования, проводимого с применением технологии Web-опросника значительно увеличивается, по сравнению с e-mail и newgroups. Тем не менее, затраты окупают себя. Ссылки на Web-опросники размещаются на тематических Web-сайтах. Особо важно их размещение на сайтах специализированных исследовательских компаний. Для onlane-исследования через Web-опросник респонденты могут приглашаться по электронной почте, в тексте приглашения указывается www-адрес, где расположен сам опросник. Респондент подключается к программе опросника, заполняет все необходимые поля и вводит свои данные, которые сразу же попадают в базу для автоматизированной обработки.
6. Самозагружающийся опросник. Самый современный метод online-обследования, который появился сравнительно недавно - опросчики, которые загружаются из WWW и запускаются на прежде установленное программное обеспечение, поддерживаемое исследователем. Это перемещает процедуру обработки данных с Web-сервера на компьютер респондента. Происходит экономия денег на использование Интернет-ресурсов для респондента, таким образом, он тратит меньше денег на участие в опросе. Далее, процедура заполнения анкеты осуществляется аналогичным образом, как в предыдущей технологии диалоговых исследований. Однажды заполненный опросник на компьютере респондента, создает файл данных, который может быть загружен в Интрнет, в случае очередного доступа в Сеть. Существует другой вариант этой методологии - заказ полной программы исследования, которая может быть загружена для одноразового использования. Такая программа необходима для того, чтобы создавать ровную диалоговую среду исследования. Одноразовые опросные программы "умеют" отсеивать ненужных респондентов, производить перемещение вопросов в произвольном порядке, переходы к разным группам вопросов в сложно структурированных анкетах, отслеживать пропуски ответов и заставлять респондента заполнять все необходимые поля. Конструирование анкеты для данной программы ограничивается только творческой силой исследователя. Самозагружающийся опросник может оперировать большим количеством окон управления, придавая более "жизненный" эффект длинному вопроснику. Все исследования, с технологией самозагружающихся опросников являются более дорогим и требующими дополнительных временных затрат по сравнению с другими методиками online-исследований. В некоторых случаях, они могут потребовать больше навыков от респондента для того, чтобы устанавливать программное обеспечение и правильно оперировать процессом загрузки данных. На загрузку программного обеспечения опроса иногда требуется значительное время (от 20 минут, до 2-х часов). Позволяя респонденту завершать опрос автономно (а не собирая данные непосредственно) и затем возвращать данные обратной загрузкой в WWW, сам исследователь вынужден терять больше времени, т. к. происходит задержка получения результатов опроса, а иногда - потеря.
7. Online-фокус-группы - последняя технология online-исследования, которая необходима для сбора качественной информации. Это оnline-интервью в реальном времени с несколькими респондентами одновременно. В оnline-фокус-группах, как и в традиционных, логические и управляющие механизмы осуществляются очень квалифицированным модератором. Люди, через доступ в Интернет входят в сеанс дискуссии, обнаруживают на экранах мониторов предлагаемые модератором вопросы и затем печатают свои ответы на клавиатуре. Результаты традиционных фокус-групп определяются умением модератора вести дискуссию, в online-сеансах этого требуется вдвойне. Трудность заключается в том, что в дискуссии могут участвовать пользователи, у которых очень слабые навыки компьютерного набора. Еще один недостаток - при индивидуальном подключении ни модератор, ни участники не могут ощутить качество группового обсуждения. Фактически, исследователь получает несколько одновременно проходящих глубинных интервью.