Методология и методика контент-анализа
Контент-анализ представляет собой перевод в количественные показатели массовой информации (текстовой, аудиовизуальной, цифровой) с последующей статистической ее обработкой. Его идея очень проста и повторяет ту, что лежит в основе любого другого количественного метода в социологии, будь то анкетирование или наблюдение. Надо сосчитать наиболее часто повторяющиеся слова или темы, например в газетном материале, и определить,
Подробнее см.: Манекин Р.В. Контент-анализ как метод исторического исследования // http://
manekin.narod.ru/contentM.htm
Григорьев СИ., Растов Ю.Е. Основы современной социологии: Учеб. пособие // http://irbis.asu.ru/
mmc/grig/4.1.ru.shtml
что за этим кроется. Особенность заключается именно в применении статистических процедур для анализа однотипных текстов.
А в известной у нас переводной книге Дж. Мангейма и Р. Рича сказано так: контент-анализ — это систематическая числовая обработка, оценка и интерпретация формы и содержания информационного источника. Этот тип неопросного исследования называют еще формализованным анализом документов.
Под текстами в контент-анализе понимают книги, книжные главы, эссе, интервью, дискуссии, заголовки газетных статей и сами статьи, исторические документы, дневниковые записи, речи выступлений, рекламные тексты
и т.д. Когда говорят о контент-анализе текстов, то главный интерес всегда заключается не в самих характеристиках содержания, а во внеязыковой реальности, которая за ними стоит, — личных характеристиках автора текста, преследуемых им целях, характеристиках адресата текста, различных событиях общественной жизни и др.
Как любой другой социологический метод, контент-анализ используется не сам по себе, а в составе крупного исследовательского проекта, под который составлена научная программа, где четко прописаны цели и задачи, проблема и объект, теоретическая модель и предмет исследования, выдвинуты гипотезы и проведены все другие операции, которые требует научный метод. Когда становится ясным, что поставленных целей никаким иным способом, как только анализом документов, достичь нельзя, социолог прописывает все этапы его применения: устанавливает объект, выделяет единицы анализа (их нередко называют еще единицами наблюдения и т.п.), выбирает статистический метод анализа данных, идет в библиотеку за источниками или садится за Интернет (полевая стадия), а потом ищет, суммирует, считает и интерпретирует. Контент-анализ позволяет обнаружить в документе то, что ускользает от поверхностного взгляда при его традиционном изучении. Он позволяет вписать содержание документа в социальный контекст, осмыслить его одновременно и как проявление, и как оценку социальной жизни.
Принято считать, что контент-анализ состоит из трех основных этапов: 1) выделяются единицы анализа, которые затем сводятся в категории анализа и переводятся в машиночитаемый вид; 2) проводится подсчет частотных распределений, применяется математический аппарат для выявления взаимосвязей единиц анализа; 3) осуществляется интерпретация полученных результатов.
Выбор объекта и единиц анализа — чуть ли не самые сложные шаги на этом пути. Нужно найти ответы на вопросы: где мне это искать и как проявляется изучаемое мною явление, событие, процесс.
Объектом контент-анализа могут быть экземпляры книг, плакатов или листовок, номера газет, фильмы, публичные выступления, теле- и радиопередачи, общественные и личные документы, журналистские интервью, ответы на открытые вопросы анкет и др. Они составляют то, что называется выборкой, — ту часть текстов, которые достаточны для анализа всего массива публикаций, и обеспечивают репрезентативность данных.
Это довольно просто, зато с выбором единиц анализа придется помучиться, поскольку эту роль может выполнять что угодно: темы и проблемы, пропозиции, образы, идеологемы, метафоры, примеры и аналогии, каламбуры, аллитерации, мифологемы, кочующие образы и многое другое, иногда очень экзотическое, скажем, надписи на стенах публичных туалетов. Единицами анализа могут служить, например, упоминания о российских политических деятелях и политических партиях и движениях (фамилии, имена политиков и названия партий). В такой роли могут выступать также фрагменты текста или его признаки, фотографии, заголовки, названия профессий, события, города, страны, организации, оценки, суждения на определенную тему и т.п.
А теперь внимание. Хотя в природе контент-анализа не заложено никаких ограничений, а потому ничто не препятствует его применению к отдельному тексту, тем не менее существует ряд причин, по которым его используют только в информационных массивах, состоящих из большого количества текстов. Во-первых, статистические закономерности проявляются тем более отчетливо, чем больше объем выборки. Во-вторых, в большинстве случаев контент-анализ используется в компаративных, т.е. историко- сравнительных, целях. Он силен, когда раскрывает не одномоментные срезы, а динамику изменений.
Таким образом, идея контент-анализа предполагает анализ больших информационных массивов; с другой стороны, его относительная дешевизна и технологичность делают такой анализ принципиально возможным. Поэтому не приходится удивляться тому, что в истории контент-анализа имеются такие проекты, как анализ 427 школьных учебников, 481 частной беседы, 4022 рекламных слоганов, 8039 (в 1938) и 19 533 (в 1952) редакционных статей или 15 000 персонажей в 1000 часов телевизионного эфирного времени.
Выбор единиц анализа зависит от исследовательской программы, объекта, предмета, цели, задач и гипотез исследования. Если, скажем, нам предстоит выяснить перспективы забастовки рабочих предприятия, то станет очевидной потребность контент-анализа, как минимум, протоколов собраний рабочих, решений соответствующих профсоюзных комитетов, распоряжений руководителей, законов, регулирующих забастовочную борьбу, и т.п. Переход от задачи к единицам анализа аналогичен процедуре теоретической и эмпирической интерпретации понятий и поиска индикаторов.
Выяснение того, что считать, т.е. установление единиц анализа, — главная, решающая, ключевая (или как угодно еще) предпосылка контент-анализа. Допущенные здесь ошибки трещинами разойдутся по всему зданию. Обязательное условие: такие единицы должны быть единообразными, тогда социолог получит четкие статистические показатели. Добиваются подобного единообразия благодаря стандартизации процедуры анализа текста, которая, устраняя субъективные смещения, раскрывает свои возможности только при достаточно больших массивах текстов. Единицы анализа должны легко и по возможности однозначно идентифицироваться в тексте. В идеале их лучше всего свести к самым употребляемым формальным значкам, например запятым или точкам. Тогда подсчет не представит никаких трудностей, а интерпретация результатов будет однозначной и объективной. Только кому нужен такой счет? Социологу он ничего не даст. Его задача — за внешними признаками, например отдельными словами или фразами, распознать таящееся в глубине социальное явление. А это уже качественный подход. Сло-
ва, выбранные для счета, должны обладать распознавательной силой, выступать диагностическим инструментом. Иными словами, единицы анализа должны быть интересными для последующей (политологической, культурологической, социологической и т.д.) интерпретации. Тут необходимы оригинальное видение мира, необычный подход.
Количественный подсчет встречаемости слов в тексте — самый простой вариант контент-анализа, который, однако, приводит к интересным результатам. Чаще всего подсчитывают «интересные» или «ключевые» слова и(или) словосочетания, например названия ценностных категорий типа свобода, стабильность, доверие, территориальная целостность; сценариев типа предательство или разочарование; достаточно однозначные обозначения тех или иных общественно значимых явлений, например коррупция, преступность или терроризм, и др.
С научно-познавательной точки зрения социолога интересуют все-таки не отдельные слова, а стоящие за их «спиной» понятийные категории, объединяющие множество разрозненных слов-признаков в тематическое целое. Исследователь, интересующийся тем, какое место в общественном сознании занимает, скажем, проблема преступности, обязан принимать во внимание не только присутствие в анализируемом информационном массиве слова «преступность», но и упоминания заказных^ всяких прочих убийств, бандитского беспредела, «крыши», «братков», авторитетов, власти криминала и т.п. По отношению к единицам анализа, сгруппированным по единому основанию, иначе говоря, составляющим концептуальное целое, специалисты употребляют другой термин — «категории анализа».
Категории анализа — его смысловые единицы, обозначающие эмпирические признаки текстовой информации, которые являются результатом опера-ционализации опорных теоретических понятий в концепции исследования К категориям анализа предъявляются определенные требования: они должны выражать теоретические понятия исследования, иметь в соответствии признаки (смысловые единицы) в тексте, обладать возможностями однозначной регистрации признаков, составляющих эти категории. Основная задача сборе информации в ходе анализа — поиск индикатора, указывающего на наличие f документе выделенной проблемы, идеи, темы (например, «справедливое распределение благ»). Категории анализа выражаются определенными признаками (подкатегориями), характеризующими интенсивность, направленность значимость выраженной в категории идеи, проблемы. К ним могут относиться понятия из любой сферы жизни общества: формы собственности, приватизация, финансовая система, научно-технический прогресс, методы хозяйствования, национализм, авторитаризм, демократия, международное сотруд ничество, права человека, гуманизм, активность, деловая предприимчивость нарушение законности, коррупция и др.
С помощью категорий выделяют концептуальные связи, модели, микропроблемы, тематические поля. В качестве примера можно привести анали: президентских посланий стране, с которыми обратился Б. Клинтон в 1994 \ 1995 гг. Эти послания содержат от 7000 до 10 000 слов. Были сформировав-категории слов, относящихся к экономике, бюджету страны, образованию
преступности, вопросам семьи, международным делам, социальной помощи и др. В категорию «экономика» входили слова: экономика, безработица, инфляция; в категорию «семья» — ребенок, семья, родители, мать, отец. Именно учет частот встречаемости категорий, а не отдельных слов позволяет судить о внимании, уделенном в послании тем или иным вопросам. По изменению относительных частот в посланиях 1994 и 1995 гг. были сделаны выводы об изменении политики государства в различных областях. Эти темы нашли отражение в обоих посланиях, но в одном из них некоторым темам уделялось больше внимания, а в другом меньше. Скажем, в послании 1995 г. больше внимания было уделено вопросам образования, семьи, но меньше внимания — преступности, международным делам, социальной помощи. Отсюда последовал вывод о стратегических приоритетах правительства США.
Другой пример использования контент-анализа — изучение должностных инструкций на предприятии19. Исследователь основывался на следующих предпосылках. Содержание инструкции как нормативного документа, координирующего взаимодействие людей, должно обеспечивать четкую регламентацию ролевых позиций. Чем она полнее, тем эффективнее взаимодействие и отношения людей. Ключевым явилось понятие «регламентация». Основные стороны производственной деятельности, подлежащие регламентации, составили ее предметное содержание. Они названы «категориями регламентации»: 1) место должности в структуре организации; 2) основные цели деятельности лиц, занимающих данную должность; 3) квалификационные требования; 4) обязанности работников; 5) подчиненность и права; 6) ответственность.
Благодаря этому появилась возможность расчленить текст на смысловые блоки по названным шести категориям, по каждой из них сделать стандартизованное заключение о наличии или отсутствии в тексте данной категории. Единицей счета выступил фрагмент текста, содержащий упоминание категории и характеристику ее содержания (независимо от полноты и точности этой характеристики). Далее на этом весьма обобщенном уровне анализа текста можно отличить более полную и четкую инструкцию от поверхностной и фрагментарной. Заключение о качестве инструкции здесь не интуитивное (как в случае экспертной оценки), а аргументированное.
Углубление контент-анализа идет за счет конкретизации понятия «категория регламентации», т.е. поиска детальных индикаторов. Таковыми оказались «элементы регламентации», например «ответственность», «подчиненность» и т.д. Категории «подчиненность» и «права лиц, занимающих данную должность» раскрывались через суждения — индикаторы типа «какувольняются и назначаются лица, занимающие данную должность», «кому они подчиняются». Дробное членение содержания служебной деятельности и выявило в тексте такие единицы учета (суждения, сочетания слов, предложения), которые давали возможность построить числовые показатели, характеризующие отдельные качества должностных инструкций: подробность, четкость и т.д.
Категории анализа, по мнению СИ. Григорьева и Ю.Е. Растова, должны быть: а) уместными, т.е. соответствовать решению исследовательских задач; б) исчерпывающими, т.е. достаточно полно отражать смысл основных понятий исследования; в) взаимоисключающими (одно и то же содержание не должно вхо-
Герчиков В.И. Социальное планирование и социологическая служба в промышленности: Методология с позиции практики. Новосибирск: Наука, 1984. С. 114-15).
дить в различные категории в одинаковом объеме); г) надежными, т.е. такими, которые не вызывали бы разногласий между исследователями по поводу того, что следует относить ктой или иной категории в процессе анализа документа20. Однако указанные требования соблюдаются далеко не всегда. Сведение единиц анализа в категории всегда выступает способом их классификации, критерии которой не только чрезвычайно расплывчаты и туманны, но разнятся от одного исследователя к другому. Они опираются на экспертные оценки социолога, зависят от общего уровня его подготовки и знания социальных реалий. Количество самих категорий будет зависеть от степени допускаемого обобщения социального материала. В результате может нарушаться один из
принципов научного исследования — возможность воспроизведения результатов опыта разными исследователями, хотя известно: каким бы образом ни были введены категории, воспроизведение проделанных частотных процедур контент-анализа вполне осуществимо. Однако слабым звеном остается выбор единиц анализа и единиц счета. Для того чтобы избежать априорной категоризации, в качестве единиц анализа зарубежные социологи проводят категоризацию с помощью тематических словарей или каталогов. Для подобных целей еще в конце 1960-х гг. предлагалось применять компьютерные программы, в основе которых лежал факторный анализ21. В любом случае в контент-анализе категории выполняют функцию, аналогичную абстрактным объектам, которые в теоретической модели предмета исследования (см. разд. I) приходится операционализировать, разбивая их на совокупность конкретных терминов и признаков. Роль последних в контент-анализе выполняют «низшие чины» — слова.
Хотя о единицах анализа мы рассказали раньше, чем о его категориях, при построении программы контент-анализа социологи часто идут в обратном порядке — от общего к частному, от категорий к единицам. Подобная логика совпадает с методологией разработки программы фундаментального исследования в социологии.
В таком случае методолого-методическая часть программы разбивается на три этапа. Первым шагом будет определение системы категорий анализа, вторым — соответствующая им единица анализа текста, а третьим — установление единиц счета, т.е. количественной меры единиц анализа (их еще называют индикаторами контент-анализа), позволяющей регистрировать частоту (регулярность) появления признака категории анализа в тексте.
За единицу счета могут быть приняты: 1) частота появления признака категории анализа; 2) объем внимания, уделяемого категории анализа в содержании текста. Для установления объема внимания могут быть учтены количество печатных знаков, абзацы, площадь текста, выраженная в физических пространственных единицах. Для газетных и других стандартных текстов — ширина колонки и высота высказывания. Для текстов, передаваемых устно, в качестве единицы счета могут использоваться единицы времени.
Григорьев СИ., Растов Ю.Е. Основы современной социологии: Учеб. пособие // http://irbis.asu.ru/ 2| mmc/grig/4.1.ru.shtml
// Ч'Р-' Harway N.I. A Computer Systems Approach Toward the Recognition and Analysis of Content //G. Gerberet al. The Analysis of Communication Content. N.Y., 1969.
Единицами счета могут быть число определенных слов или их сочетаний, частота упоминаний слов, количество строк, печатных знаков, страниц, абзацев, авторских листов, площадь текста, выраженная в физических величинах, эфирное время и многое другое. Единицы счета «могут и совпадать и не совпадать с единицами анализа. В первом случае квантификация сводится к определению частот упоминания выделенной смысловой единицы по отношению к другим категориям (как в случае построения индекса самостоятельности инженеров). Во втором случае единицей счета избирают физическую протяженность или площадь текстов, заполненную смысловыми единицами: число строк, абзацев, квадратных миллиметров, знаков, колонок — в печатных текстах; длительность трансляции по радио или телевидению, метраж пленки при магнитофонных записях»22.
Процедура контент-анализа включает в себя применение стандартных правил выделения в изучаемом тексте однотипных единиц анализа (счета, наблюдения) и подсчет частоты встречаемости этих единиц в выборке (количество документов, подвергаемых непосредственному счету) как в абсолютных (число раз), так и в относительных (проценты) величинах. Обязательный момент в такой процедуре — использование математико-статистических методов счета. Ведь основу контент-анализа составляет подсчет встречаемости некоторых компонентов в анализируемом информационном массиве, дополняемый выявлением статистических взаимосвязей и анализом структурных связей между ними, а также снабжением их теми или иными количественными или качественными характеристиками.
Связь между категориями устанавливают методом совместной встречаемости (сооссигепсе) слов различных категорий: для каждого предложения текста выясняют, слова каких категорий в нем встречаются. После этого легко подсчитать обычный коэффициент корреляции, который выражает силу связи между категориями и знак этой связи.
Контент-анализ текстов с использованием категорий иногда называют концептуальным анализом. Сфера его применения довольно широка. С его помощью решают два основных типа задач:
1. Есть два или более текстов, которые необходимо сравнить в отношении нагрузки на определенные категории. Например, задача выяснить, какое внимание уделяют две разные газеты определенным темам. Если эти газеты рассчитаны на одну аудиторию, то существенное различие в частотах позволит судить о различиях в политике, проводимой людьми, стоящими за ними.
2. Задача отслеживания динамики изменения нагрузки на определенные категории. Например, выяснить частоту упоминания темы внешнего долга России в фиксированном наборе центральных газет на протяжении какого-то времени и соотнести ее с колебаниями курса доллара путем простого корреляционного анализа23.
Из истории разведки известно, как по изменению в специальной литературе частоты упоминания определенных научных тем и фамилий ученых делались достоверные выводы об успехах, достигнутых в конкретных областях исследований.
22 Ядов В.А. Социологическое исследование: методология, программа, методы. Самара, 1995. С. 138. Шалак В.И. Контент-анализ (история метода) // http://vaal2000.newmail.ru/contmethod.htm
Относительные частоты употребления тех или иных единиц анализа позволяют сравнивать два и более текстов, делать важные теоретические обобщения. Например, в тексте выступления депутата Думы можно оценить уровень агрессивности, для чего конструируется категория агрессивно окрашенной лексики. После этого сравнивают текст выступления данного депутата с другими выступлениями и выявляют, кто агрессивнее. Можно сравнивать данный текст не с другими текстами, а с некой нормой, своеобразной нулевой отметкой агрессивности. Мы получим ее, если выясним относительную частоту употребления агрессивно окрашенных слов средним носителем русского языка. Помощь в этом могут оказать частотные словари. Сравнивая относительную частоту употребления агрессивно окрашенной лексики в выступлении депутата с частотой ее употребления средним носителем русского языка, можно сделать вывод о степени агрессивности. Но и это еще не все. Небольшие отклонения частот в большую или меньшую сторону могут быть следствием случайных колебаний. На вопрос о значимости отклонения частот позволяет ответить статистическая оценка, известная под названием z-score и вычисляемая по формуле (N-E)/(стандартное отклонение),где N — количество слов данной категории, реально встретившихся в тексте, а Е — ожидаемое число вхождений слов данной категории в текст. Величина Е вычисляется путем умножения нормальной частоты категории на число слов в анализируемом тексте24.
Рис. 7. Анализ текста выступления депутата может свидетельствовать об уровне его агрессивности
Квантификация данных в контент-анализе проводится самыми разными способами. Помимо анализа частотного распределения к ним относятся анализ различного рода корреляций между переменными, ассоциаций, анализ сопряженности, кластерный анализ, их оценка по тем или иным градуированным качественным шкалам.
После квантификации, т.е. перевода данных в числовую форму, их математическая и, в частности, статистическая обработка может осуществляться
Шалак В.И. Контент-анализ (история метода) // http://vaal2000.newmail.ru/contmethod.htm
многими разными программными средствами, в том числе стандартными статистическими пакетами типа SPSS. При анализе текста и последующем сохранении результатов этого анализа в базах данных могут использоваться специальные программы, предназначенные для целей лингвистических исследований.
Аналитические исследования СМИ предполагают проведение статистического и качественного анализа информации за конкретный период. В частности, составляется полный статистический отчет упоминаний в СМИ интересующей клиента темы с отражением характера упоминаний (положительные, нейтральные или негативные отзывы). На основе этих данных выявляются тенденции, разрабатываются рекомендации по ответной реакции в СМИ и улучшению имиджевой ситуации.
В настоящее время различается четыре методологии контент-анализа: грамматический (лингвистический) — по размеру абзацев, длине фраз, порядку слов в предложении, метрическому составу и другим формальным признакам языка; семантический (социологический) — по экспертным оценкам содержания; документалистический (кибернетический) — по параметрам языка, текста и документа как сообщения (дескрипторы и их нагрузка, компактность, информационная плотность, аспектность, проточность, физический и информационный объемы, информационная емкость и информативность); цитационный — анализ библиографических ссылок в научной литературе25.
Проведение контент-анализа требует предварительной разработки ряда исследовательских инструментов. Разные специалисты и источники называют неодинаковое число таких документов. По мнению СИ. Григорьева и Ю.Е. Растова их должно быть пять: 1) классификатор контент-анализа;
2) протокол итогов анализа (он еще называется — бланк контент-анализа);
3) регистрационная карточка (кодировальная матрица); 4) инструкция исследователю, непосредственно занимающемуся регистрацией и кодировкой единиц счета; 5) каталог (список) проанализированных документов. Классификатором контент-анализа авторы называют общую таблицу, в которую сведены все категории (и подкатегории) анализа и единицы анализа. Ее основное предназначение — предельно четко зафиксировать то, в каких единицах выражается каждая категория, используемая в исследовании. Классификатор уподобляется социологической анкете, где категории анализа играют роль вопросов, а единицы анализа — ответов, и считается основным методическим документом контент-анализа, предопределяющим содержание других документов. Протокол (бланк) контент-анализа содержит: во-первых, сведения о документе (его авторе, времени издания, объеме и т.п.); во-вторых, итоги его анализа (количество случаев употребления в нем определенных единиц анализа и следующие отсюда выводы относительно категорий анализа). Протоколы заполняются, как правило, в закодированном виде, но не ради сохранения тайны контент-анализа, а исходя из желания на одном листе бумаги уместить всю информацию о документе (так удобнее сопостав-
Воробьев Г.Г. Социология и кибернетика // Социологические исследования. 1993. № 11. С. 8.
лять друг с другом итоги анализа разных документов). Регистрационная карточка представляет собой кодировальную матрицу, в которой отмечается количество единиц счета, характеризующих единицы анализа. Протокол контент-анализа каждого конкретного документа заполняется на основе подсчета данных всех регистрационных карточек, относящихся к этому документу26.
По другим источникам главными среди методических документов контент-анализа являются кодировочная карточка (кодификатор, код, бланк кодировки) и инструкция кодировщику27.
Первый нормативный документ принимает разные формы, может быть менее и более подробным, но в любом своем виде он представляет собой таблицу.
В более подробном варианте в кодировочной карточке, т.е. специальной таблице, перечислены единицы наблюдения с необходимой степенью дробности, указаны правила их регистрации и оставлено место для записей результатов наблюдений (подсчета числа упоминаний и других показателей). В ней указываются также общие характеристики анализируемого текста (название источника, дата и номер анализируемого экземпляра, название анализируемой публикации, автор, жанр). В сокращенном варианте, иногда называемом бланком кодировки, количество сообщаемых сведений меньше. Бланк кодировки составляется в соответствии со схемой операциональных понятий, содержит единицы анализа и все элементы описания проблемной ситуации, устанавливает однозначное соответствие между лексикой текста и кодами, над которыми производятся вычислительные операции.
В качестве примера приведем фрагмент бланка, с помощью которого можно осуществить кодирование28 (см. рис. 8).
Кодирование данных при контент-анализе обычно осуществляется с помощью достаточно простых анкет или компьютерных программ, в которых фиксируется каждое появление в анализируемом тексте искомой единицы. Операции кодирования проводит кодировщик — сотрудник, который работает с текстом, фиксирует частоту употребления единиц счета.
Инструкция кодировщику. Ее содержанием выступает описание правил соотнесения единиц текста с перечнем категорий анализа, а также правил регистрации в Кодировочной карточке. Примером может служить список категорий и элементов регламентации, который называют кодификатором (кодом). Карточка содержит не только список наблюдаемых индикаторов, но и данные в документе, который подвергся кодированию (например, номер или название подразделения, в котором используется данная инструкция, ее объем в страницах, число разделов и т.п.).
Инструкция кодировщику содержит обычно не только правила поиска и регистрации единиц текста, соответствующих делениям кодификатора, но и примеры таких единиц, слова, высказывания, суждения и т.п.
Григорьев СИ., Растов Ю.Е. Основы современной социологии: Учеб. пособие // http://irbis.asu.ru/ mmc/grig/4.1 .ru.shtml
Методическое пособие социолога-практика: Словарь-справочник / Под ред. Д.А. Шевченко, А.И. Кравченко. М., 1990. Основы прикладной социологии: Учеб. для вузов. М., 1995. С. 146—149.
Рис. 8. Фрагмент бланка
После разработки инструкция проверяется на однозначность ее понимания различными кодировщиками. Цель — выяснить, помогает ли инструкция кодировщикам получать единообразные, стандартные результаты, не за-
висящие от субъективных особенностей восприятия кодировщиков. Делается это следующим образом: один и тот же текст дается группе кодировщиков, которые работают с едиными кодификаторами (кодировочными карточками) и инструкциями. Затем проверяется совпадение результатов. Случаи расхождения результатов выясняются, обсуждаются их причины. Те указания инструкции, которые не обеспечивают однозначного восприятия кодировщиками, уточняются, после чего проводится новая проверка инструкции до получения необходимого уровня совпадения результатов.
В контент-анализе изучение любого текста проливает свет на его автора и те социальные условия, в которых создавался текст. В результате обнаруживаются авторство анонимной работы и плагиат, определяются жанр и авторский стиль, степень новизны и достоверности и даже характер интеллекта автора. Отсюда принадлежащее А.Г. Здравомыслову полушутливое определение контент-анализа как «научно обоснованного метода чтения между строк».
Контент-анализ позволяет социологу изучать более глубокий слой социальных явлений, чем это доступно другим методам. Чтобы обнаружить явление, стоящее за суждениями, в социологии ищут связанные с ним слова. А для понимания их важности сравнивают с другими основополагающими понятиями. События в Косове и вторая чеченская война изменили политический и культурный климат России. Они отразились в публикациях СМИ и электронной базе Интернета. Анализ частоты употребления слов «Косово», «беженцы», «албанцы», «Югославия», «НАТО» и подобных им демонстрирует, насколько было взбудоражено общественное сознание россиян этими событиями. Контент-анализ электронных изданий, проведенный А. Костин-ским, выявил удивительную вещь: в период косовского кризиса слово «НАТО» встречалось 132 раза на 100 000 слов, США —.более 80. Для сравнения: даже сумма частот употребления слов «Чечня», «чечен», «чеченцы», «чеченская» ни в первую, ни во вторую чеченскую войну не превышала 16 слов на 100 000. Создается впечатление, будто НАТО и США — главная забота россиян. Размытый прежде враждебный образ Запада сосредоточился для нас в этих двух понятиях29.
Если контент-анализ применяется впервые, то допускаются многочисленные ошибки. Среди них специалисты30 отмечают наиболее типичные просчеты:
Анализ документов опережает разработку исследовательской программы.
Анализируются документы, не связанные с гипотезами исследования (имеющие сходство с темой исследования лишь по названию).
Не проверена подлинность документа.
Не уточнено его авторство.
Неполно учтено его предназначение.
Категории анализа не определены до такой степени, которая позволяет четко различать смысловые единицы текста документа.
Категории анализа не субординарны и не приведены в соответствие с теми дефинициями и операционализирующими их терминами, которые зафиксированы в программе исследования.
Костянский А. Частотный словарь российских СМИ // http://www.svoboda.org
Григорьев СИ., Растов Ю.Е. Основы современной социологии: Учеб. пособие // http://irbis.asu.ru/
mmc/grig/4.1.ru.shtml
Категории анализа несопоставимы со смыслом и языком текста анализируемого документа.
Единицы анализа характеризуют категории анализа лишь внешне, а не по существу, поэтому единицы анализа не позволяют идентифицировать содержание документа в полном соответствии с категориями анализа.
Анализ документа ведется без предварительной подготовки всего комплекса методических инструментов.
Классификатор имеет недочеты, составлен с нарушением правил логики.
Регистраторы (кодировщики) не получили должной методической подготовки.
Инструкция по регистрации и кодировке недостаточно полная, составлена исследователем, который сам предварительно не апробировал инструментарий.
Кодировка не соответствует программе математической обработки данных исследования.
Результаты контент-анализа не перепроверены информацией, собранной иными методами.
Контент-анализ прессы требует сравнительно больших затрат времени и средств, поэтому может использоваться и метод экспресс-анализа. В его основе лежит количественный подсчет содержательных элементов текста (факт, конфликт, аргумент, тема, обобщение), а также учет качественных характеристик публикаций (соответствие цели, информативность, актуальность, доказательность, конструктивность). Как и при контент-анализе, эти характеристики текста кодируются, обозначаются определенной цифрой, и затем при чтении текста исследователь их фиксирует31.