Типичные ошибки анализа документов в социологическом исследовании
1.Исследователь использует документальную информацию в качестве первичной социологической информации без предварительного ее анализа; не проверены: подлинность, достоверность, авторство документа, назначение информации.
2. Анализ документов ведется без предварительного плана, про граммы.
3. Выбранные для анализа документы имеют сходство с темой исследования лишь по названию. Информация, содержащаяся в них, не связана с гипотезами исследования.
4. Категории анализа не сопоставлены со смысловым содер жанием и языком текста документов. В терминологическом обо значении категорий анализа имеется двусмысленность; в одну и ту же категорию анализа попадают существенно различающиеся смысловые единицы текста.
5. Не подготовлены заранее и не апробированы методические документы обзора данных. Возникли трудности регистрации при знаков.
6. Не проведен инструктаж среди регистраторов и кодировщи ков, они не прошли специальную подготовку.
7. Кодировка не соответствует программе обработки данных.
8. Плохо организовано рабочее место регистратора.
9. Нет списка (каталога) документов, используемых в анализе
2.3. Методология и методика контент-анализа
Контент-анализ представляет собой перевод в количественные показатели массовой информации (текстовой, аудиовизуальной цифровой) с последующей статистической ее обработкой. Его идея очень проста и повторяет ту, что лежит в основе любого другого количественного метода в социологии, будь то анкетирование или наблюдение. Надо сосчитать наиболее часто повторяющиеся сло ва или темы, например в газетном материале, и определить, что за этим кроется. Особенность заключается именно в применении статистических процедур для анализа однотипных текстов.
Контент-анализ (англ. content analysis — анализ содержания) — количе ственный анализ текстов и текстовых массивов с целью последующей со держательной интерпретации выявленных числовых закономерностей.
А в известной у нас переводной книге Дж. Мангейма и Р. Рича сказано так: контент-анализ — это систематическая числовая об работка, оценка и интерпретация формы и содержания информа ционного источника. Этот тип неопросного исследования назы вают еще формализованным анализом документов.
Под текстами в контент-анализе понимают книги, книжные главы, эссе, интервью, дискуссии, заголовки газетных статей и сами статьи, исторические документы, дневниковые записи, речи выступлений, рекламные тексты и т.д. Когда говорят о контент-анализе текстов, то главный интерес всегда заключается не в самих характеристиках содержания, а во внеязыковой реальности, которая за ними стоит, — личных характеристиках автора текста, преследуемых им целях, характеристиках адресата текста, различных событиях общественной жизни и др.
Как любой другой социологический метод, контент-анализ используется не сам по себе, а в составе крупного исследовательского проекта, под который составлена научная программа, где четко прописаны цели и задачи, проблема и объект, теоретическая модель и предмет исследования, выдвинуты гипотезы и проведены все другие операции, которые требует научный метод. Когда становится ясным, что поставленных целей никаким иным способом, как только анализом документов, достичь нельзя, социолог прописывает все этапы его применения: устанавливает объект, выделяет единицы анализа (их нередко называют еще единицами наблюдения и т.п.), выбирает статистический метод анализа данных, идет в библиотеку за источниками или садится за Интернет (полевая стадия), а потом ищет, суммирует, считает и интерпретирует. Контент-анализ позволяет обнаружить в документе то, что ускользает от поверхностного взгляда при его традиционном изучении. Он позволяет вписать содержание документа в социальный контекст, осмыслить его одновременно и как проявление, и как оценку социальной жизни.
Принято считать, что контент-анализ состоит из трех основных этапов: 1) выделяются единицы анализа, которые затем сводятся в категории анализа и переводятся в машиночитаемый вид; 2) проводится подсчет частотных распределений, применяется математический аппарат для выявления взаимосвязей единиц анализа; 3) осуществляется интерпретация полученных результатов.
Выбор объекта и единиц анализа — чуть ли не самые сложные шаги на этом пути. Нужно найти ответы на вопросы: где мне это искать и как проявляется изучаемое мною явление, событие, процесс.
Объектом контент-анализа могут быть экземпляры книг, плакатов или листовок, номера газет, фильмы, публичные выступления, теле- и радиопередачи, общественные и личные документы, журналистские интервью, ответы на открытые вопросы анкет и др. Они составляют то, что называется выборкой, — ту часть текстов, которые достаточны для анализа всего массива публикаций, и обеспечивают репрезентативность данных.
Это довольно просто, зато с выбором единиц анализа придется помучиться, поскольку эту роль может выполнять что угодно: темы и проблемы, пропозиции, образы, идеологемы, метафоры, примеры и аналогии, каламбуры, аллитерации, мифологемы, ко чующие образы и многое другое, иногда очень экзотическое, ска Жем, надписи на стенах публичных туалетов. Единицами анализа могут служить, например, упоминания о российских политичес ких деятелях и политических партиях и движениях (фамилии, имена политиков и названия партий). В такой роли могут высту пать также фрагменты текста или его признаки, фотографии, за головки, названия профессий, события, города, страны, органи зации, оценки, суждения на определенную тему и т.п.
А теперь внимание. Хотя в природе контент-анализа не зало жено никаких ограничений, а потому ничто не препятствует eго применению к отдельному тексту, тем не менее существует ряд причин, по которым его используют только в информационных массивах, состоящих из большого количества текстов. Во-первых, статистические закономерности проявляются тем более отчетли во, чем больше объем выборки. Во-вторых, в большинстве случа ев контент-анализ используется в компаративных, т.е. историко сравнительных, целях. Он силен, когда раскрывает не oднoмoмент ные срезы, а динамику изменений.
Таким образом, идея контент-анализа предполагает анализ боль ших информационных массивов; с другой стороны, его относитель ная дешевизна и технологичность делают такой анализ принципи ально возможным. Поэтому не приходится удивляться тому, что в истории контент-анализа имеются такие проекты, как анализ 427 школьных учебников, 481 частной беседы, 4022 рекламных сло ганов, 8039 (в 1938) и 19 533 (в 1952) редакционных статей или 15 000 персонажей в 1000 часов телевизионного эфирного времени.
Выбор единиц анализа зависит от исследовательской програм мы, объекта, предмета, цели, задач и гипотез исследования. Если, скажем, нам предстоит выяснить перспективы забастовки рабочих Предприятия, то станет очевидной потребность контент-анализа, как минимум, протоколов собраний рабочих, решений соответству кзщих профсоюзных комитетов, распоряжений руководителей, за конов, регулирующих забастовочную борьбу, и т.п. Переход от за дачи к единицам анализа аналогичен процедуре теоретической и эмпирической интерпретации понятий и поиска индикаторов.
Выяснение того, что считать, т.е. установление единиц анали за, — главная, решающая, ключевая (или как угодно еще) пред посылка контент-анализа. Допущенные здесь ошибки трещинами разойдутся по всему зданию. Обязательное условие: такие едини
цы должны быть единообразными, тогда социолог получит четкие статистические показатели. Добиваются подобного единообразия благодаря стандартизации процедуры анализа текста, которая, устраняя субъективные смещения, раскрывает свои возможности только при достаточно больших массивах текстов. Единицы анализа должны легко и по возможности однозначно идентифицироваться в тексте. В идеале их лучше всего свести к самым употребляемым формальным значкам, например запятым или точкам. Тогда подсчет не представит никаких трудностей, а интерпретация результатов будет однозначной и объективной. Только кому нужен такой счет? Социологу он ничего не даст. Его задача — за внешними признаками, например отдельными словами или фразами, распознать таящееся в глубине социальное явление. А это уже качественный подход. Слова, выбранные для счета, должны обладать распознавательной силой, выступать диагностическим инструментом. Иными словами, единицы анализа должны быть интересными для последующей (политологической, культурологической, социологической и т.д.) интерпретации. Тут необходимы оригинальное видение мира, необычный подход.
Количественный подсчет встречаемости слов в тексте — самый простой вариант контент-анализа, который, однако, приводит к интересным результатам. Чаще всего подсчитывают «интересные» или «ключевые» слова и (или) словосочетания, например названия ценностных категорий типа свобода, стабильность, доверие, территориальная целостность; сценариев типа предательство или разочарование; достаточно однозначные обозначения тех или иных общественно значимых явлений, например коррупция, преступность или терроризм, и др.
С научно-познавательной точки зрения социолога интересуют все-таки не отдельные слова, а стоящие за их «спиной» понятийные категории, объединяющие множество разрозненных слов-признаков в тематическое целое. Исследователь, интересующийся тем, какое место в общественном сознании занимает, скажем, проблема преступности, обязан принимать во внимание не только присутствие в анализируемом информационном массиве слова «преступность», но и упоминания заказных и всяких прочих убийств, бандитского беспредела, «крыши», «братков», авторитетов, власти криминала и т.п.
По отношению к единицам анализа, сгруппированным по единому основанию, иначе говоря, составляющим концептуальное целое, специалисты употребляют другой термин — «категории анализа».
Категории анализа — его смысловые единицы, обозначающие эмпирические признаки текстовой информации, которые являются 572
результатом операционализации опорных теоретических понятий в концепции исследования. К категориям анализа предъявляются оп ределенные требования: они должны выражать теоретические поня тия исследования, иметь в соответствии признаки (смысловые еди ницы) в тексте, обладать возможностями однозначной регистрации признаков, составляющих эти категории. Основная задача сбора ин формации в ходе анализа — поиск индикатора, указывающего на наличие в документе выделенной проблемы, идеи, темы (например, «справедливое распределение благ»). Категории анализа вы ража ют ся определенными признаками (подкатегориями), характеризующи ми интенсивность, направленность, значимость выраженной в ка тегории идеи, проблемы. К ним могут относиться понятия из лю бой сферы жизни общества: формы собственности, приватизация, финансовая система, научно-технический прогресс, методы хозяй ствования, национализм, авторитаризм, демократия, международное сотрудничество, права человека, гуманизм, активность, деловая предприимчивость, нарушение законности, коррупция и др.
С помощью категорий выделяют концептуальные связи, модели, микропроблемы, тематические поля. В качестве примера можно привести анализ президентских посланий стране, с которыми обра тился Б. Клинтон в 1994 и 1995 гг. Эти послания содержат от 7 тыс. до 10 тыс. слов. Были сформированы категории слов, относящихся к экономике, бюджету страны, образованию, преступности, вопро сам семьи, международным делам, социальной помощи и др. В ка тегорию «экономика» входили слова: экономика, безработица, инф ляция; в категорию «семья» — ребенок, семья, родители, мать, отец. Именно учет частот встречаемости категорий, а не отдельных слов позволяет судить о внимании, уделенном в послании тем или иным вопросам. По изменению относительных частот в посланиях 1994 и 1995 гг. были сделаны выводы об изменении политики государства в различных областях. Эти темы нашли отражение в обоих послани ях, но в одном из них некоторым темам уделялось больше внимания, а в другом меньше. Скажем, в послании 1995 г. больше внимания было уделено вопросам образования, семьи, но меньше внимания — пре ступности, международным делам, социальной помощи. Отсюда пос ледовал вывод о стратегических приоритетах правительства США.
Другой пример использования контент-анализа — изучение должностных инструкций на предприятии20. Исследователь осно вывался на следующих предпосылках. Содержание инструкции как нормативного документа, координирующего взаимодействие лю
дей, должно обеспечивать четкую регламентацию ролевых позиций. Чем она полнее, тем эффективнее взаимодействие и отношения людей. Ключевым явилось понятие «регламентация». Основные стороны производственной деятельности, подлежащие регламентации, составили ее предметное содержание. Они названы «категориями регламентации»: 1) место должности в структуре организации; 2) основные цели деятельности лиц, занимающих данную должность; 3) квалификационные требования; 4) обязанности работников; 5) подчиненность и права; 6) ответственность.
Благодаря этому появилась возможность расчленить текст на смысловые блоки по названным шести категориям, по каждой из них сделать стандартизованное заключение о наличии или отсутствии в тексте данной категории. Единицей счета выступил фрагмент текста, содержащий упоминание категории и характеристику ее содержания (независимо от полноты и точности этой характеристики). Далее на этом весьма обобщенном уровне анализа текста можно отличить более полную и четкую инструкцию от поверхностной и фрагментарной. Заключение о качестве инструкции здесь не интуитивное (как в случае экспертной оценки), а аргументированное.
Углубление контент-анализа идет за счет конкретизации понятия «категория регламентации», т.е. поиска детальных индикаторов. Таковыми оказались «элементы регламентации», например «ответственность», «подчиненность» и т.д. Категории «подчиненность» и «права лиц, занимающих данную должность» раскрывались через суждения — индикаторы типа «как увольняются и назначаются лица, занимающие данную должность», «кому они подчиняются». Дробное членение содержания служебной деятельности и выявило в тексте такие единицы учета (суждения, сочетания слов, предложения), которые давали возможность построить числовые показатели, характеризующие отдельные качества должностных инструкций: подробность, четкость и т.д.
Категории анализа, по мнению СИ. Григорьева и Ю.Е. Рас-това, должны быть: а) уместными, т.е. соответствовать решению исследовательских задач; б) исчерпывающими, т.е. достаточно полно отражать смысл основных понятий исследования; в) взаимоисключающими (одно и то же содержание не должно входить в различные категории в одинаковом объеме); г) надежными, т.е. такими, которые не вызывали бы разногласий между исследователями по поводу того, что следует относить к той или иной категории в процессе анализа документа.
Однако указанные требования соблюдаются далеко не всегда. Сведение единиц анализа в категории всегда выступает способом их классификации, критерии которой не только чрезвычайно расплыв чаты и туманны, но разнятся от одного исследователя к другому. Они опираются на экспертные оценки социолога, зависят от общего уров ня его подготовки и знания социальных реалий. Количество caмих категорий будет зависеть от степени допускаемого обобщения социального материала. В результате может нарушаться один из принци пов научного исследования — возможность воспроизведения резуль татов опыта разными исследователями, хотя известно: каким бы об разом ни были введены категории, воспроизведение проделанных частотных процедур контент-анализа вполне осуществимо. Однако слабым звеном остается выбор единиц анализа и единиц счета.. Для того чтобы избежать априорной категоризации, в качестве единиц анализа зарубежные социологи проводят категоризацию с помощью тематических словарей или каталогов. Для подобных целей еще в конце 1960-х гг. предлагалось применять компьютерные программы, в основе которых лежал факторный анализ.
В любом случае в контент-анализе категории выполняют фун кцию, аналогичную абстрактным объектам, которые в теоретичес кой модели предмета исследования (см. разд. I гл. 3) приходится операционализировать, разбивая их на совокупность конкретных терминов и признаков. Роль последних в контент-анализе выпол няют «низшие чины» — слова.
Хотя о единицах анализа мы рассказали раньше, чем о его кате гориях, при построении программы контент-анализа социологи часто идут в обратном порядке — от общего к частному, от катего рий к единицам. Подобная логика совпадает с методологией раз работки программы фундаментального исследования в социологии.
В таком случае методолого-методическая часть программы раз бивается на три этапа. Первым шагом будет определение систе мы категорий анализа, вторым — соответствующая им единица анализа текста, а третьим — установление единиц счета, т.е. ко личественной меры единиц анализа (их еще называют индикато рами контент-анализа), позволяющей регистрировать частоту (ре гулярность) появления признака категории анализа в тексте.
Единица счета — количественная характеристика единицы анализа, она фиксирует регулярность, с которой встречается в тексте та или иная смыс ловая единица.
За единицу счета могут быть приняты: 1) частота появления признака категории анализа; 2) объем внимания, уделяемого категории анализа в содержании текста. Для установления объема внимания могут быть учтены количество печатных знаков, абзацы, площадь текста, выраженная в физических пространственных единицах. Для газетных и других стандартных текстов — ширина колонки и высота высказывания. Для текстов, передаваемых устно, в качестве единицы счета могут использоваться единицы времени.
Единицами счета могут быть число определенных слов или их сочетаний, частота упоминаний слов, количество строк, печатных знаков, страниц, абзацев, авторских листов, площадь текста, выраженная в физических величинах, эфирное время и многое другое. Единицы счета «могут и совпадать и не совпадать с единицами анализа. В первом случае квантификация сводится к определению частот упоминания выделенной смысловой единицы по отношению к другим категориям (как в случае построения индекса самостоятельности инженеров). Во втором случае единицей счета избирают физическую протяженность или площадь текстов, заполненную смысловыми единицами: число строк, абзацев, квадратных миллиметров, знаков, колонок — в печатных текстах; длительность трансляции по радио или телевидению, метраж пленки при магнитофонных записях»23.
Процедура контент-анализа включает в себя применение стандартных правил выделения в изучаемом тексте однотипных единиц анализа (счета, наблюдения) и подсчет частоты встречаемости этих единиц в выборке (количество документов, подвергаемых непосредственному счету) как в абсолютных (число раз), так и в относительных (проценты) величинах. Обязательный момент в такой процедуре — использование математико-статистических методов счета. Ведь основу контент-анализа составляет подсчет встречаемости некоторых компонентов в анализируемом информационном массиве, дополняемый выявлением статистических взаимосвязей и анализом структурных связей между ними, а также снабжением их теми или иными количественными или качественными характеристиками.
Связь между категориями устанавливают методом совместной встречаемости (сооссигепсе) слов различных категорий: для каждого предложения текста выясняют, слова каких категорий в нем встречаются. После этого легко подсчитать обычный коэффициент корреляции, который выражает силу связи между категориями и знак этой связи.
Контент-анализ текстов с использованием категорий иногда называют концептуальным анализом. Сфера его применения до вольно широка. С его помощью решают два основных типа задач:
1. Есть два или более текстов, которые необходимо сравнить в отношении нагрузки на определенные категории. Например, за дача выяснить, какое внимание уделяют две разные газеты опре деленным темам. Если эти газеты рассчитаны на одну аудиторию, то существенное различие в частотах позволит судить о различи ях в политике, проводимой людьми, стоящими за ними.
2. Задача отслеживания динамики изменения нагрузки на опре деленные категории. Например, выяснить частоту упоминания темы внешнего долга России в фиксированном наборе центральных газет на протяжении какого-то времени и соотнести ее с колебаниями курса доллара путем простого корреляционного анализа.
Из истории разведки известно, как по изменению в специаль ной литературе частоты упоминания определенных научных тем и фамилий ученых делались достоверные выводы об успехах, до стигнутых в конкретных областях исследований.
Относительные частоты употребления тех или иных единиц анализа позволяют сравнивать два и более текстов, делать важные| теоретические обобщения. Например, в тексте выступления депу тата Думы можно оценить уровень агрессивности, для чего кон струируется категория агрессивно окрашенной лексики. После этого сравнивают текст выступления данного депутата с другими выступлениями и выявляют, кто агрессивнее. Можно сравнивать данный текст не с другими текстами, а с некой нормой, своеоб разной нулевой отметкой агрессивности. Мы получим ее, если выясним относительную частоту употребления агрессивно окра шенных слов средним носителем русского языка. Помощь в этом могут оказать частотные словари. Сравнивая относительную час тоту употребления агрессивно окрашенной лексики в выступле нии депутата с частотой ее употребления средним носителем рус ского языка, можно сделать вывод о степени агрессивности. Но и это еще не все. Небольшие отклонения частот в большую или меньшую сторону могут быть следствием случайных колебаний. На вопрос о значимости отклонения частот позволяет ответить статистическая оценка, известная под названием z-score и вычис ляемая по формуле (N- .^/(стандартное отклонение), где N— ко личество слов данной категории, реально встретившихся в тексте, а Е— ожидаемое число вхождений слов данной категории в текст.
Величина Е вычисляется путем умножения нормальной частоты категории на число слов в анализируемом тексте25.
Квантификация данных в контент-анализе проводится самыми разными способами. Помимо анализа частотного распределения к ним относятся анализ различного рода корреляций между переменными, ассоциаций, анализ сопряженности, кластерный анализ, их оценка по тем или иным градуированным качественным шкалам.
После квантификации, т.е. перевода данных в числовую форму, их математическая и, в частности, статистическая обработка может осуществляться многими разными программными средствами, в том числе стандартными статистическими пакетами типа SPSS. При анализе текста и последующем сохранении результатов этого анализа в базах данных могут использоваться специальные программы, предназначенные для целей лингвистических исследований.
Аналитические исследования СМИ предполагают проведение статистического и качественного анализа информации за конкретный период. В частности, составляется полный статистический отчет упоминаний в СМИ интересующей клиента темы с отражением характера упоминаний (положительные, нейтральные или негативные отзывы). На основе этих данных выявляются тенденции, разрабатываются рекомендации по ответной реакции в СМИ и улучшению имиджевой ситуации.
В настоящее время различается четыре методологии контент-анализа: грамматический (лингвистический) — по размеру абзацев, длине фраз, порядку слов в предложении, метрическому составу и другим формальным признакам языка; семантический (социологический) — по экспертным оценкам содержания; документа-листический (кибернетический) — по параметрам языка, текста и документа как сообщения (дескрипторы и их нагрузка, компактность, информационная плотность, аспектность, проточность, физический и информационный объемы, информационная емкость и информативность); цитационный — анализ библиографических ссылок в научной литературе26.
Проведение контент-анализа требует предварительной разработки ряда исследовательских инструментов. Разные специалисты и источники называют неодинаковое число таких документов. По
мнению СИ. Григорьева и Ю.Е. Растова, их должно быть пять: 1) классификатор контент-анализа; 2) протокол итогов анализа (он еще называется — бланк контент-анализа); 3) регистрационная кар-точка (кодировальная матрица); 4) инструкция исследователю, не посредственно занимающемуся регистрацией и кодировкой единиц счета; 5) каталог (список) проанализированных документов. Классификатором контент-анализа авторы называют общую таблицу , в которую сведены все категории (и подкатегории) анализа и единицу,в цы анализа. Ее основное предназначение — предельно четко зафик-сировать то, в каких единицах выражается каждая категория, ис пользуемая в исследовании. Классификатор уподобляется социоло гической анкете, где категории анализа играют роль вопросов,а единицы анализа — ответов, и считается основным методическим документом контент-анализа, предопределяющим содержание дру гих документов. Протокол (бланк) контент-анализа содержит: во первых, сведения о документе (его авторе, времени издания, объе ме и т.п.); во-вторых, итоги его анализа (количество случаев упот ребления в нем определенных единиц анализа и следующие отсюда выводы относительно категорий анализа). Протоколы заполняют ся, как правило, в закодированном виде, но не ради сохранения тайны контент-анализа, а исходя из желания на одном листе бума ги уместить всю информацию о документе (так удобнее сопостав лять друг с другом итоги анализа разных документов). Регистра ционная карточка представляет собой кодировальную матрицу, В которой отмечается количество единиц счета, характеризующих единицы анализа. Протокол контент-анализа каждого конкретно го документа заполняется на основе подсчета данных всех pегист рационных карточек, относящихся к этому документу.
По другим источникам, главными среди методических доку ментов контент-анализа являются кодировочная карточка (коди фикатор, код, бланк кодировки) и инструкция кодировщику.
Первый нормативный документ принимает разные формы, может быть менее и более подробным, но в любом своем виде он представляет собой таблицу.
В более подробном варианте в кодировочной карточке, т.е. специальной таблице, перечислены единицы наблюдения с необ ходимой степенью дробности, указаны правила их регистрации и оставлено место для записей результатов наблюдений (подсчета
числа упоминаний и других показателей). В ней указываются также общие характеристики анализируемого текста (название источника, дата и номер анализируемого экземпляра, название анализируемой публикации, автор, жанр). В сокращенном варианте, иногда называемом бланком кодировки, количество сообщаемых сведений меньше. Бланк кодировки составляется в соответствии со схемой операциональных понятий, содержит единицы анализа и все элементы описания проблемной ситуации, устанавливает однозначное соответствие между лексикой текста и кодами, над которыми производятся вычислительные операции.
В качестве примера приведем фрагмент бланка, с помощью которого можно осуществить кодирование29 (рис. 2.1).
Кодирование данных при контент-анализе обычно осуществляется с помощью достаточно простых анкет или компьютерных программ, в которых фиксируется каждое появление в анализируемом тексте искомой единицы. Операции кодирования проводит кодировщик — сотрудник, который работает с текстом, фиксирует частоту употребления единиц счета.
Инструкция кодировщику. Ее содержанием выступает описание правил соотнесения единиц текста с перечнем категорий анализа, а также правил регистрации в Кодировочной карточке. Примером может служить список категорий и элементов регламентации, который называют кодификатором (кодом). Карточка содержит не только список наблюдаемых индикаторов, но и данные в документе, который подвергся кодированию (например, номер или название подразделения, в котором используется данная инструкция, ее объем в страницах, число разделов и т.п.).
Инструкция кодировщику содержит обычно не только правила поиска и регистрации единиц текста, соответствующих делениям кодификатора, но и примеры таких единиц, слова, высказывания, суждения и т.п.
После разработки инструкция проверяется на однозначность ее понимания различными кодировщиками. Цель — выяснить, помогает ли инструкция кодировщикам получать единообразные, стандартные результаты, не зависящие от субъективных особенностей восприятия кодировщиков. Делается это следующим образом: один и тот же текст дается группе кодировщиков, которые работают с едиными кодификаторами (кодировочными карточками) и инструкциями. Затем проверяется совпадение результатов. Случаи расхождения результатов выясняются, обсуждаются их причины. Те указания инструкции, которые не обеспечивают од-580
нозначного восприятия кодировщиками, уточняются, после чего проводится новая проверка инструкции до получения необходимого уровня совпадения результатов.
№ | Признак, градация признака | Коды | |
1. | Тип автора | ||
— один человек | |||
—два и более человека | |||
— ситуация не ясна | |||
2. | Группа, к которой принадлежит автор | ||
— неформальная группа (семья, друзья и т.д.) | |||
— формальная группа (производственная группа, учебный | |||
коллектив и т.д.) | |||
— ситуация не ясна | |||
3. | Пол автора | ||
— автор (авторы)—мужчина (мужчины) | |||
— автор (авторы)—женщина (женщины) | |||
— смешанная группа | |||
— ситуация не ясна | |||
4. | Возраставтора | ||
— молодежь (до 30 лет) | |||
—лица среднего возраста (30—49 лет) | |||
—лица старшего возраста (свыше 50 лет) | |||
— смешанная группа | |||
— ситуация не ясна | |||
5. | Количество проблем, рассматриваемых в письме | ||
—одна | |||
-две | |||
— более двух | |||
6. | Локальность проблем, поднятых в письме | Проблема№1 | Проблема Ns2 |
— мир | |||
— страна | |||
— город | |||
—предприятие, учреждение | |||
— частная жизнь | |||
7. | Сфера общественной жизни (страна, область, город) | ||
—промышленность | |||
—сельское хозяйство | |||
—транспорт | |||
—строительство | |||
— вопросы распределения жилья | |||
— вопросы социального обеспечения | |||
8. | Типы суждений | ||
—суждение оценочное | |||
—суждение конструктивное | |||
—суждение аналитическое | |||
—другие типы суждения |
Рис. 2.1. Фрагмент бланка
В контент-анализе изучение любого текста проливает свет на его автора и те социальные условия, в которых создавался текст. В результате обнаруживаются авторство анонимной работы и плагиат, определяются жанр и авторский стиль, степень новизны и достоверности и даже характер интеллекта автора. Отсюда принадлежащее А.Г. Здравомыслову полушутливое определение контент-анализа как «научно обоснованного метода чтения между строк».
Контент-анализ позволяет социологу изучать более глубокий слой социальных явлений, чем это доступно другим методам. Чтобы обнаружить явление, стоящее за суждениями, в социологии ищут связанные с ним слова. А для понимания их важности сравнивают с другими основополагающими понятиями. События в Косове и вторая чеченская война изменили политический и культурный климат России. Они отразились в публикациях СМИ и электронной базе Интернета. Анализ частоты употребления слов «Косово», «беженцы», «албанцы», «Югославия», «НАТО» и подобных им демонстрирует, насколько было взбудоражено общественное сознание россиян этими событиями. Контент-анализ электронных изданий, проведенный А. Костинским, выявил удивительную вещь: в период косовского кризиса слово «НАТО» встречалось 132 раза на 100 тыс. слов, США — более 80. Для сравнения: даже сумма частот употребления слов «Чечня», «чечен», «чеченцы», «чеченская» ни в первую, ни во вторую чеченскую войну не превышала 16 слов на 100 тыс. Создается впечатление, будто НАТО и США — главная забота россиян. Размытый прежде враждебный образ Запада сосредоточился для нас в этих двух понятиях30.
Если контент-анализ применяется впервые, то допускаются многочисленные ошибки. Среди них специалисты31 отмечают наиболее типичные просчеты:
Анализ документов опережает разработку исследовательской программы.
Анализируются документы, не связанные с гипотезами исследования (имеющие сходство с темой исследования лишь по названию).
Не проверена подлинность документа.
Не уточнено его авторство.
Неполно учтено его предназначение.
Категории анализа не определены до такой степени, которая позволяет четко различать смысловые единицы текста документа. 582
Категории анализа не субординарны и не приведены в соответствие с теми дефинициями и операционализирующими их терминами, которые зафиксированы в программе исследования.
Категории анализа несопоставимы со смыслом и языком текста анализируемого документа.
Единицы анализа характеризуют категории анализа лишь внешне, а не по существу, поэтому единицы анализа не позволяют идентифицировать содержание документа в полном соответствии с категориями анализа.
Анализ документа ведется без предварительной подготовки всего комплекса методических инструментов.
Классификатор имеет недочеты, составлен с нарушением правил логики.
Регистраторы (кодировщики) не получили должной методической подготовки.
Инструкция по регистрации и кодировке недостаточно полная, составлена исследователем, который сам предварительно не апробировал инструментарий.
Кодировка не соответствует программе математической обработки данных исследования.
Результаты контент-анализа не перепроверены информацией, собранной иными методами.
Контент-анализ прессы требует сравнительно больших затрат времени и средств, поэтому может использоваться и метод экспресс-анализа. В его основе лежит количественный подсчет содержательных элементов текста (факт, конфликт, аргумент, тема, обобщение), а также учет качественных характеристик публикаций (соответствие цели, информативность, актуальность, доказательность, конструктивность). Как и при контент-анализе, эти характеристики текста кодируются, обозначаются определенной цифрой, и затем при чтении текста исследователь их фиксирует32.