Кодировочная книга (codebook)
Книга, содержащая инструкции по кодированию и необходимую информацию о переменных, используемых в конкретном наборе данных.
Кодировочная книга применяется как руководство для кодировщика и помогает исследователю правильно определять и располагать переменные. Даже если анкета закодирована заранее, следует подготовить формальную кодировочную книгу. Кодировочная книга обычно включает следующую информацию: номер столбца, номер записи, номер переменной, название переменной, номер ответа, инструкции по кодированию. На рис. 14.2 изображен фрагмент из кодировочной книги, разработанной для проекта "Выбор универмага".
Кодирование анкет
На рис. 14.3 приведен пример кодирования анкеты. На нем изображена часть закодированной анкеты, которая использовалась в ходе реализации проекта "Выбор универмага".
И наконец, в этой части нашей анкеты мы просим вас дать определенную информацию о себе, которая необходима нам для выполнения классификации
ЧастьD Запись №7
1. Ответы на вопросы данной анкеты предоставлены (29)
1. __Мужчиной-главой семьи
2. __Женщиной-главой семьи
3. ___Совместно мужчиной и женщиной
2. Семейное положение (30)
1.___Замужем (женат)
2.___Никогда не была замужем (женат)
3.___Раз веден (а)/Живет отдельно/Вдов(а)
3. Укажите общее количество членов семьи, живущих (31-32)
с вами в одном доме___
4. Укажите количество детей, живущих с вами
a) Младше 6 лет ____ (33)
b) Старше 6 лет_____ (34)
5. Укажите количество детей, живущих отдельно (35)
6. Обведите кружком общее количество лет учебы (если таковой имеется, укажите эти же данные по своему супругу)
Средняя Незаконченное Законченное высшее
школа высшее образование
a) Вы 8 или меньше 9 10 13 14 15 16 17 18 19 20 21 22 или (36-37)
11 12 больше
b) Супруг (а) 8 или меньше 9 10 13141516 17 18 19 20 21 22 или (38-39)
11 12 больше
7. а) Укажите свой возраст (40-41)
b) Укажите возраст супруга (супруги) (42-43)
8. Если работаете, укажите род деятельности обоих супругов, пометив все необходимые категории
44 45
Мужчина Женщина
1. Профессионально-техническая
2. Менеджмент и управление
3. Торговый работник
4. Офисная или подобная работа
5. Рабочий/оператор
6. Работник на дому
7. Прочее (пожалуйста, назовите)
8. Данных нет
9. Принадлежит ли семье занимаемое ею жилье? (46)
1. __Принадлежит семье
2. __Арендуется
10. Сколько лет ваша семья проживает в районе Атланты? (47-48)
_____лет
11. Каков общий годовой доход вашей семьи до уплаты налогов. Пометьте нужный вариант. (49-50)
01. Меньше 10000 долл. _ 08. От 40000 до 44999____
02. От 10000 до 14999 _ 09. От 45000 до 49999____
03. От 15000 до 19999 _ 10. От 50000 до 54999____
04. От 20000 до 24999 _ 11. От 55000 до 59999____
05. От 25000 до 29999 _ 12. От 60000 до 69999____
06. От 30000 до 34999 _ 13. От 70000 до 89999____
07. От 35000 до 39999___ 14. 90000 и больше
Примечание. В столбцах 1-3 данной записи содержатся идентификационные сведения о респонденте, в столбце 4 — номер записи (7), столбцы 5 и 6 пустые. Столбцы с 7 по 27 включают информацию из части С данной анкеты, столбец 28 пустой. Таким образом, информация по части D анкеты кодируется, начиная с колонки29.
Рис. 14.3. Пример кодирования анкеты: кодирование демографических данных
Данную анкету закодировали заранее. Код респондента и номер записи указан по каждой записи. Первая запись содержит дополнительные коды: код проекта, код интервьюера, коды даты и времени и проверочный код. Полезный совет: рекомендуется разграничивать отдельные части анкеты пробелами. Иногда вместо вписывания кодов в анкету они заносятся в специальный документ, содержащий 80 столбцов и известный как "кодировочная таблица".
ПРЕОБРАЗОВАНИЕ ДАННЫХ
Преобразование данных заключается в переносе закодированных данных из анкеты или кодировочных таблиц на диски или магнитные ленты либо во введении их непосредственно в компьютер через клавиатуру. Если данные собраны с использованием автоматизированных компьютерных систем, их преобразование не обязательно, поскольку они вводятся в компьютер в процессе их сбора. Данные можно вводить не только с клавиатуры, но и в процессе считывания меток или маркеров с бланков, оптического сканирования или компьютеризированного сенсорного анализа (рис. 14.4).
Для того чтобы воспользоваться методом считывания меток с бланков, ответы должны записываться специальным карандашом в конкретные поля анкеты, закодированные для данного ответа. Зафиксированные таким образом данные могут считываться машиной. Оптическое сканирование заключается в прямом машинном считывании кодов с одновременным преобразованием данных. Известным примером оптического сканирования может служить преобразование штрих-кода при считывании его в кассах супермаркетов. Технический прогресс привел к созданию систем компьютеризированного сенсорного анализа, благодаря которым можно автоматизировать процесс сбора данных. Вопросы выводятся на специальной компьютеризированной панели, а ответы с помощью сенсорных устройств вводятся непосредственно в компьютер.
Используя метод ввода ответов с клавиатуры, полностью избежать ошибок трудно, по-этому необходимо проверять введенные массивы данных, по крайне мере частично. Для проверки правильности введенных данных применяется проверочный компьютер и второй оператор. Второй оператор повторно вводит данные из закодированных анкет, после чего преобразованные данные, введенные двумя операторами, сравниваются по записям. Любое расхождение между двумя комплектами преобразованных данных исследуется с тем, чтобы выявить и исправить ошибки в результате ввода данных с клавиатуры. Если проверяются результаты ввода всего набора данных, время и затраты на преобразование данных удваиваются. Учитывая дополнительные временные и денежные затраты, а также то, что опытные операторы по вводу данных работают довольно точно и практически без ошибок, обычно достаточно сверить 20—25% данных.
Рис. 14.4. Преобразование данных
Если используются автоматизированные системы CATI и CAPI, правильность ввода данных проверяется по мере их поступления. При вводе неприемлемого варианта ответа компьютер выдает респонденту или интервьюеру соответствующее предупреждение. Если же ответ приемлем, интервьюер или респондент могут увидеть его на экране и проверить его правильность до передачи на дальнейшую обработку.
Выбор метода преобразования данных зависит от способа проведения интервью и наличия необходимого оборудования. При использовании методов CAPI и CATI данные вводятся непосредственно в компьютер. Ввод данных с клавиатуры терминала с электронно-лучевой трубкой (CRT) чаще всего применяется при опросе по телефону, при обходе домов, при опросах в универмагах и по почте. Поскольку при опросах на дому все чаще применяются специальные клавиатуры и портативные компьютеры, в последнее время интенсивно используются системы для компьютеризированного сенсорного анализа. Оптическое сканирование широко применяется при проведении структурированных и периодически повторяющихся опросов, а метод считывания меток или маркеров с бланков — при специальных наблюдениях [6].
ОЧИЩЕНИЕ ДАННЫХ
Процедура очищения данных(data cleaning) заключается в проверке состоятельности собранных данных и работе с пропущенными ответами.