Тема 11. АНАЛИЗ СОЦИОЛОГИЧЕСКОЙ ИНФОРМАЦИИ
Способы анализа и интерпретации данных
Заключительный этап эмпирического социологического исследования предполагает обработку, анализ и интерпретацию данных, получение эмпирически обоснованных обобщений, выводов и рекомендаций. Обработка данных включает в себя следующие компоненты:
1. Редактирование и кодирование информации. Основное назначение этого шага состоит в унификации и формализации той информации, которая была получена в ходе исследования.
2. Создание переменных. Собранная на основании анкет информация в ряде случаев прямо отвечает на те вопросы, которые необходимо решить в исследовании, поскольку вопросы получили форму индикаторов в процессе операционализации. Сейчас же необходимо провести обратную процедуру, то есть перевести данные в форму, которая бы отвечала на вопросы исследования.
3. Статистический анализ. Этот шаг является ключевым в процессе анализа социологических данных. В ходе статистического анализа выявляются некоторые статистические закономерности и зависимости, которые позволяют социологу сделать определенные обобщения и выводы. Для проведения статистического анализа социологи используют большое число различных математических методов, позволяющих полно и всесторонне анализировать собранную информацию. В современной социологии для этой цели активно применяются ЭВМ, дополненные программами математико-статистической обработки.
В зависимости от методов получения первичной информации возможно применение различных методов обработки и анализа данных.
Описательные однофакторные методы: распределение частот (представление в таблице или на графике); графическое представление распределения переменной (гистограммы и т.д.); статистические показатели – арифметическое среднее, медиана, мода, вариация, дисперсия.
Индуктивные однофакторные методы предназначены для проверки соответствия характеристик выборки характеристикам генеральной совокупности (ГС) и делятся на параметрические тесты, предназначенные для проверки гипотез о неизвестных характеристиках ГС, и непараметрические, предназначенные для проверки гипотез о распределении ГС. Применение метода состоит из: формулирования гипотез; выбора подходящего теста; установления уровня сигнификантности; определение критического уровня проверяемой характеристики по таблице; расчета реальной величины теста; сравнения и интерпретации.
Двух- и многофакторные методы анализа зависимостей – типичная постановка вопроса, на который можно ответить с помощью этих методов, может звучать так: “Какая связь имеется между расходами на рекламу и ценой?” – или: “Имеется ли связь между возрастом человека, выбором определенной марки?”
Регрессионный анализ – статистический метод анализа данных для определения зависимости одной переменной от одной (простая регрессия) или нескольких (многофакторная регрессия) независимых переменных.
Вариационный анализ предназначен для проверки того, существенно ли влияет изменение независимых переменных на зависимые.
С помощью дискриминантного анализа можно разделить заранее заданные группы объектов через комбинацию многих независимых переменных и таким образом объяснить различия между группами. Кроме того, метод дает возможность отнести новый объект к какой-либо группе на основе его характеристик.
Факторный анализ предназначен для исследования взаимосвязей между переменными с целью уменьшения числа влияющих факторов до наиболее существенных.
Кластер-анализ-метод, с помощью которого можно разделить совокупность объектов на отдельные, более или менее однородные группы.
Многомерное шкалирование позволяет получить пространственное отображение отношений, существующих между объектами.
Возможность применения того или иного вида анализа зависит от уровня шкалирования независимых и зависимых переменных.
Общая характеристика шкал
Каждый вопрос в анкете или бланке интервью представляет собой в определенной степени шкалу измерений. Единицами измерений выступают соответствующие альтернативы (позиции), варианты ответов. По этим позициям (вариантам ответов) проводится группировка респондентов. Кроме того, определенную шкалу измерений представляют объективные характеристики опрашиваемых, их субъективные оценки, предпочтения и пр.
Измерение производится с помощью различных шкал, которым соответствуют различные правила математического анализа данных. В социологических исследованиях применяются, как правило, шкалы трех основных-типов: номинальная, ранговая (порядковая) и интервальная.
Простейшая шкала - номинальная. Чаще всего она фиксирует (отражает) дихотомичный ответ: «да» или «нет», «тепло» или «холодно». Применяя ранговую шкалу, можно зафиксировать более определенное состояние, отражающее ранжированное распределение типа «холодно» - «тепло» - «горячо». Но цифровые величины пока отсутствуют. Если же мы точку замерзания, скажем, воды примем за нуль, а точку кипения (пар) - за 100 и расстояние между этими точками разделим на 10 равных интервалов, то получим интервальную шкалу.
Номинальной шкале в анкете обычно соответствуют вопросы, способствующие выявлению мнений, установок, объективных характеристик респондента (пол, возраст, национальность и т. д.). Ранговой шкале (порядковой) соответствует основное число вопросов анкеты или бланка интервью. Варианты ответов в вопросе распределены в строгом порядке убывания или возрастания интенсивности признака. Интервальная шкала более детальна, глубока. Она допускает обстоятельную математическую обработку информации. В социологическом исследовании с ее помощью измеряются те характеристики, которые можно выразить числами: возраст, образование, стаж работы, учебы и др. По этой шкале возможно вычисление различных величин.