Обработка и анализ данных социологических опросов
Обработка данных социологических опросов включает ряд этапов:
- Подготовка данных к вводу в ПВМ
- Ввод данных в ПВМ
- Математическая обработка
- Создание электронных и физических архивов
1. Подготовка данных к вводу включает проверку и кодировку массива заполненных анкет. Для этого массив заполненных анкет просматривается, при этом из массива исключаются:
- анкеты заполненные менее чем на 2\3 (по количеству ответов на закрытые вопросы)
- претенциозно заполненные анкеты (имеющие «минусы» в ответах на вопросы «ловушки»)
- анкеты не прошедшие тест по совокупности контрольных вопросов
- анкеты у которых не заполнен социально-демографический блок
Каждая годная анкета номеруется. Из нее выписываются ответы на открытые вопросы. Если необходимо, то соответствующие позиции открытых вопросов кодируются.
2. Ввод данных в ПВМ производится в соответствии с инструкциями по вводу данных конкретного пакета программ, при этом желательно, чтобы номер анкеты в физическом массиве и номер анкеты в электронном виде совпадали. Во время ввода рекомендуется копировать массив введенных в память данных на дискету и защищать его от постороннего вмешательства. По окончании ввода данных делаются 2 копии введенного массива, при этом одна копия считается рабочей, а дольная копия описывается рабочей, а другая контрольной, которая хранится в архиве вместе с архивированной копией программы, с помощью которой производился ввод и обработка данных.
3. Математическая обработка данных включает:
- Расчет и анализ одномерных распределений ответов по каждому вопросу
- Расчет и анализ группировочных таблиц сопряжения по всем основным социально-демографическим признакам, включенным в анкету
- Анализ влияния факторов на изучаемые процессы в соответствии с гипотезами исследования
- Построение математической факторной модели изучаемого процесса
Математическая обработка результатов производится с использованием стандартных пакетов обработки информации наиболее известными из которых являются система «САНИ» и «АСТРА».
4. Расчет и анализ одномерных распределений ответов производится в отношении доли отметивших каждую альтернативу. При этом расчитываются следующие показатели:
- Доля отметивших каждую альтернативу в % к числу ответивших на данный вопрос (Этот показатель используется наиболее часто)
- Доля отметивших каждую альтернативу в % к числу опрошенных (Этот показатель часто используется, когда анализируются ответы на вопросы касающиеся только части респондентов)
- Доля отметивших каждую альтернативу в % к сумме ответов на все альтернативы данного вопроса (Этот показатель иногда используют, если по содержанию вопроса можно было отметить несколько альтернатив)
Данные о линейных распределениях ответов удобно занести на бланк анкеты. По результатам анализа делается заключение о модальности ответов и их вариабельности. Из дальнейшего анализа, как правило, исключают ответы на вопросы, у которых респондентами использовано менее половины позиций шкалы, а также вопросы на которые более трети респондентов отказались отвечать (нет ответа или отмечена позиция «Не знаю», «Не могу сказать» и т.д.)
5. Расчет и анализ группировочных таблиц сопряжения позволяет сделать заключение о различии модальности в группах опрошенных по основным социально-демографическим признакам: полу, возрасту, уровню образования и т.д. Как правило, такой анализ производится по основным показателям изучаемого процесса. Перед построением таблиц сопряжения полезно проанализировать коэффициенты связи (по Пирсону) включенных в анализ показателей состояния изучаемого процесса с социально — демографическими показателями. Как правило различия в распределении модальности наблюдаются, если соотвтетсвующий коэффициент связи существенен с Р > 0, 95. Группировочные таблицы строятся с указанием доли ответивших на вопрос из числа респондентов соответствующей группы.
Пример:
Как по Вашему, нужна ли социология экономистам?
Девушки | Юноши | |
Определенно нужна | ||
Скорее нужна | ||
Скорее не нужна | ||
Совершенно не нужна | ||
Не знаю |
Коэфф. Пирсона — 0,62
Как видим, налицо различие в отношении к социологии по полу опрошенных. Этот факт необходимо учитывать в дальнейшем анализе.
6. Анализ влияния факторов на изучаемые процессы производится с использованием статистических мер вязи, к которым относятся коэффициенты сопряженности Пирсона, Крамера, Чупрова, информационные меры связи. Коэффициенты рассчитываются с использованием стандартных программ и показывают меру взаимообусловленности в распределении частот появления соответствующих признаков. Один из признаков условно считается зависимым, другой — детерминирующим, однако заключение о наличии связи может дать только качественный анализ всей сосвкупности связей.
Анализ коэффициентов связи позволяет:
- выделить факторы статистический уровень влияния которых позволяет исключить их из дальнейшего анализа (гипотеза о наличии связи отрицается)
- проранжировать оставшиеся связи по уровню взаимной сопряженности с изучаемым процессом, при этом следует иметь ввиду, что уровень взаимной сопряженности может определяться как влиянием данного фактора на процесс, так и взаимным изменением данного фактора и процесса под влиянием третьего фактора. Вывод о связи может быть сделан только на основании анализа всей совокупности связей в системе «изучаемый процесс» — «факторные признаки», поэтому рассчитывают не отдельные коэффициенты, а таблицу коэффициентов
Пример:
Пусть S0 — показатель, отражающий уровень интереса студентов к социологии, а F1, F2,F3 — факторы учебного процесса, отражающие содержание программы, уровень квалификации преподавателей и объем программы в часах.
Матрица коэффициентов связи может выглядеть так:
S0 | F1 | F2 | F3 | |
S0 | 0,89 | 0,68 | 0,75 | |
F1 | 0,89 | 0,56 | 0,95 | |
F2 | 0,68 | 0,56 | 0,11 | |
F3 | 0,75 | 0,95 | 0,11 |
Чисто внешне значимы все три фактора, однако при анализе внутренних связей можно заметить, что оценка содержания программы оказалась зависимой от ее объема в часах, поэтому не смотря на то, что уровень связи изучаемого процесса с показателем «содержание…» выше, детерминирующим следует считать фактор «объем программы в часах», так как именно он определяет меру содержательности программы. Кроме того, на содержание программы оказывает значимое влияние и фактор «квалификация».
7. Построение математической факторной модели включает оценку количественного влияния факторов на изучаемый процесс. Модель разрабатывается после качественного анализа влияния факторов и требует включения только тех факторов, влияние которых на изучаемый процесс доказано на предыдущем этапе. Модель, как правило, представляется в виде регрессионной функции вида:
Y = F (f2,f3, … ,fn)
вид функции выбирается исходя из качественного анализа процесса или подбирается путем перебора. Для моделирования часто используют стандартные пакеты типа Statgraf или Statistica для Windows.
Анализ завершается подготовкой отчета по результатам проведенного исследования. Отчет включает описание всех основных этапов исследования:
В введении дается развернутая характеристика проблемной ситуации, описывается объект, предмет, цели и задачи исследования. Теоретический раздел отчета включает анализ публикаций по данной проблеме, теоретический анализ основных понятий исследования, теоретическую и рабочую модель с необходимыми обоснованиями и выкладками.
Процедурно-методический раздел включает обоснование выбора метода исследования, макеты инструментов, расчет и обоснование выборки, а также краткое описание процедур отбора единиц наблюдения.
Аналитический раздел — содержит результаты анализа полученных данных.
В заключительном разделе подводятся итоги исследования и даются рекомендации или технологии управления изучаемым процессом в соответствии с целью исследования.
В отчет также включают список использованных литературных источников и приложения.
Практика
· Программа социологического исследования о факторах, влияющих на выбор формы обучения абитуриентами
· Программа исследования №2
· Социометрия
· Радиореклама