Процедура кодирования информационных носителей

SPSS - это статический пакет, с помощью которого осуществляется анализ социологических данных.

Для того чтобы полученные данные можно было обработать, прежде всего следует создать кодировочную таблицу. Кодировочная таблица устанавливает соответствие между отдельными вопросам анкеты и переменными. используемыми при компьютерной обработке данных. Например, пункту анкеты "Пол" может быть поставлена в соответствие переменная sex.

Переменные — это ячейки памяти, в которые можно записывать значения, введенные с клавиатуры. Мы выбрали для переменной имя sex, так как имена переменных в SPSS для Windows могут содержать до восьми символов. Другое, более подробное имя было бы слишком длинным. Имена переменных могут состоять из букв латинского алфавита, цифр и специальных символов; причем первым символом имени должна быть буква.

Переменные могут принимать различные значения. Переменная sex может иметь два возможных значения: "женский" и "мужской". Кодировочная таблица определяет кодовые числа, соответствующие отдельным значениям переменных; например, значению "женский" может соответствовать цифра "1", а значению "мужской" — "2".

Подытожим задачи, которые решаются при составлении кодировочной таблицы:

• Кодировочная таблица устанавливает соответствие между отдельным вопросам анкеты и переменными.

• " Кодировочная таблица устанавливает соответствие между возможным значениями переменных и кодовыми числами.

INDSCAL (INdividual Differences SCALing)

В программе INDSCAL реализована модель индивидуального многомерного шкалирования Дж. Д. Керроллом и Дж. Дж. Чангом. Данная модель является генерализацией модели классического многомерного шкалирования. Она позволяет получить не только общие факторы восприятия, но и выявить индвивидуальные различия.

ДА-система - это мощный пакет для обработки и анализа данных опросов общественного мнения, социологических, маркетинговых, политологических и других исследований.

PREFMAP (PREFerance MAPping)

Программа PREFMAP разработана Дж. Д. Керроллом и Дж. Дж. Чангом в компании Bell Labs. Программа позволяет проводить внешний анализ данных о предпочтениях. Данные могут быть как метрические, так и неметрические. В качестве исходных данных PREFMAP использует координаты объектов и данные о предпочтениях.

Дополнительные коды составляются на основе частотки в виде шкал ответов на открытые и полузакрытые вопросы.

Чтобы с помощью дополнительных кодов можно было закодировать как можно большее количество ответов, в эти коды следует включать, прежде всего, варианты ответов с максимальной частотой повторения. Далее необходимо предусмотреть позицию «другие ответы», куда заносятся редко встречающиеся варианты. Можно также ввести служебную позицию «общие ответы» или «ответы не по существу вопроса», чтобы снизить долю других ответов, которая обычно не должна превышать 5-10% от общего числа ответов. Завершает дополнительные коды позиция «затрудняются ответить» или «нет ответа».

Пример дополнительных кодов для ответов на открытый вопрос «В чем Вы

видите недостатки общения в Интернете?» из исследования М. Печалиной на

тему «Соотношение реального и виртуального общения в студенческой среде».

1. Это - неживое общение

2. Виртуальный образ не соответствует реальности

3. Неправильная интерпретация сообщений

4. Отнимает слишком много времени

5. Другие ответы

6. Затрудняются ответить

Пример основных и дополнительных кодов для ответов на полузакрытый вопрос, «Какими из перечисленных Интернет-ресурсов Вы пользуетесь для общения со своими друзьями, одноклассниками, сокурсниками и т.д.?» из того же исследования.

Основные коды:

01. Форумы

02. Чаты

03. Сайты знакомств

04. Гостевые книги

05. ICQ, QIP, Miranda

06. Интерактивные ресурсы для общения: «Odnoklassniki.ru» или «vkontakte.ru»

07. Электронная почта

Дополнительные коды:

08. Блоги, ЖЖ-сообщества

09. Skype

10. Другие ответы

11. Нет ответа

Что такое двойное и тройное кодирование

Одна из ключевых проблем дополнительного кодирования – эмпирическая

наполняемость кодовых позиций. Поскольку дополнительные коды обычно

разрабатываются на основе частотного анализа не всех, а только части полевых документов, есть вероятность, что отдельные кодовые позиции могут после окончательной обработки оказаться недостаточно наполненными и, следовательно, не вполне пригодными для статистического анализа. Для решения этой проблемы используется двойное и тройное кодирование. В этом случае дополнительные коды состоят из двух или даже трех уровней. Если кодовые позиции на более низком уровне не «срабатывают» (в смысле эмпирического наполнения), они, тем не менее, не пропадают для статистического анализа, а учитываются на более высоком уровне.

Примеры двойного и тройного кодирования ответов на открытый вопрос: «Каким источникам массовой информации Вы доверяете больше всего?».

КОДИФИКАТОР:

1. Печать

1.1. Центральные газеты

1.1.1. Аргументы и факты

1.1.2. Известия

1.1.3. Комсомольская правда

1.1.4. Другие газеты

1.2. Местные газеты

1.3. Журналы

1.4. Зарубежная пресса

1.5. Другие печатные издания

2. Радио

2.1. Всероссийские радиостанции

2.1.1. Радио России

2.1.2. Маяк

2.1.3. Другие радиостанции

2.2. Местные радиостанции

2.3. Зарубежные радиостанции

3. Телевидение

3.1. Всероссийские телеканалы

3.1.1. 1-й канал (ОРТ)

3.1.2. 2-й канал (РТР)

3.1.3. Другие телеканалы

3.2. Местные телеканалы

3.3. Зарубежные телеканалы

4. Другие ответы

5. Нет ответа

Пример двойного кодирования: ответ «Радио «Эхо Москвы» кодируется шифрами 2.2. (Местные радиостанции) и 2. (Радио).

Пример тройного кодирования: ответ «Независимая газета» кодируется шифрами

1.1.4. (Другие газеты), 1.1. (Центральные газеты) и 1.(Печать).

37. Технологический цикл обработки первичной информации на компьютере (первые четыре пункта просто для информации, основной ответ начинается с «в-пятых», т.к. нам нужна обработка на компе)

Полученная в ходе полевых работ информация не случайно называется первичной. Исходя из нее, невозможно установить те зависимости, которые кладутся в основу социологических выводов и рекомендаций. Поэтому она нуждается в трансформировании во вторичную информацию, представленную в виде таблиц, графиков, уравнений, коэффициентов и т.п. показателей. Суть этого трансформирования – обобщение и свертка первичной информации, ее превращение в удобную для последующего анализа.

Машинная обработка первичных данных предусматривает комплекс следующих операций и процедур.

Во-первых, выбраковку, т.е. отсеивание из общего массива собранных анкет (бланков интервью, экспертных карт и т.п.) тех, которые заполнены не полностью, небрежно, с поправками, исключающими возможность четкого определения ответа респондента, или другими нарушениями инструкций к их заполнения. Такого рода исследовательские документы признаются браком и удаляются из дальнейшего использования.

Во-вторых, ремонт выборки, необходимость которого обусловлена выбраковкой. Отсеивание ряда документов ведет к нарушению параметров ранее определенной выборки. Поэтому возникает потребность возмещения забракованных документов новыми, т.е. проведения дополнительного сбора информации. Эта операция, как и первая, делается и при ручной обработке.

В-третьих, докодирование полученной информации, ее унификация и формализация до степени, при которой она становится пригодной к вводу в ЭВМ. Это трудоемкая техническая операция начинается в период полевых работ, но может быть завершена только после получения всего массива первичных данных. Уже хотя бы потому, что пронумеровать все полученные документы, точнее, присвоить каждому из них свой код, можно только имея их все. Кроме того, все варианты мнений респондентов, подлежащие формализации, выявятся только по завершению полевого этапа.

В-четвертых, перенос информации на машинные носители – перфокарты и перфоленты, магнитные диски и ленты и т.п. Естественно, что выбор носителя зависит от типа и вида имеющихся в распоряжении социологов ЭВМ.

В-пятых, ввод данных в ЭВМ и организация введенной информации в соответствии с используемым пакетом прикладных программ машинной обработки.

В-шестых, проверка качества введенной информации и коррекция обнаруженных ошибок. Для этого используются специальные процедуры обнаружения искаженной информации и ее исправления, а также программы корректировки и преобразования данных, входящих в общий пакет программ машинной обработки.

В-седьмых, уточнение системы количественных показателей, на основе которых будет производится весь последующий анализ информации, и формулирование заданий на их машинное установление. При этом учитывается, с одной стороны, содержащаяся в исследовательской программе операционализация понятий, а с другой, планируемое использование методов математического анализа полученной информации.

В-восьмых, исполнение вышеназванных заданий, получение искомых цифр, таблиц, шкал, графиков, индексов, коэффициентов и других количественных характеристик изучаемых явлений и процессов. Особую значимость для последующего анализа информации имеют матрицы данных, без которых невозможно применение большинства математических методов. В социологии используют пять основных разновидностей матриц: а) матрица "объект-признак"; б) таблица сопряженности признаков; в) матрица коэффициентов связей между признаками; г) матрица расстояний между объектами; д) матрица близостей между объектами или признаками. Получение этих матриц – главный критерий завершения этапа машинной обработки первичной социологической информации количественного свойства.

Наши рекомендации