Подготовка к контент-анализу
Контент-анализ может быть использован для ответа на исследовательские вопросы всегда, если имеется какой-то материальный носитель информации, так или иначе относящейся к интересующим нас политическим субъектам, и когда у исследователя есть доступ к этому информационному источнику. Примеры таких носителей – книги, памфлеты, журналы, газеты, фонограммы, аудио– и видеозаписи, фотографии, протоколы собраний или заседаний, правительственные документы, внутриведомственные циркуляры, фильмы, дипломатические коммюнике и инструкции, политические плакаты, карикатуры и лозунги, тексты речей и даже письма и дневники. Некоторые из этих носителей могут быть предельно подробными и точными (как, например, стенографический отчет о заседании конгресса) в отличие от других (например, от повестки дня того же самого заседания). Многие из них никак не зависят от исследовательского процесса (как, например, газетные публикации об изучаемом нами лице или организации), но есть и такие, которые исследователь должен воспроизвести сам (например, видеозаписи информационных телепрограмм). Однако все источники данных для контент-анализа имеют одну существенную черту: наличие материального носителя информации. Во всех случаях, когда он существует или может быть воссоздан, допустимо использование контент-анализа.
Первый шаг в подготовке к контент-анализу состоит в определении той совокупности сообщений, которую мы [c.270] будем изучать. Здесь перед нами открывается ряд возможностей. То, какая из них оптимальна, будет зависеть от конкретного исследовательского вопроса. Например, если объектом нашего исследования являются политические сюжеты в американской романистике XX в., то мы вправе определить искомую совокупность как все романы (тип сообщений), вышедшие из-под пера американских авторов (продуцент сообщений) и опубликованные в США (место распространения сообщений) в период между 1 января 1900 г. и сегодняшним днем (время появления сообщений). Если же нас интересует то, как освещалась в газетах определенная предвыборная кампания, искомая совокупность будет включать в себя все предвыборные газетные публикации (тип сообщений) размером в два и более газетных столбца (объем сообщений), опубликованные в ежедневных газетах (частота появления сообщений), которые были доставлены подписчикам (способ распространения сообщений) 6-го, 7-го и 8-го избирательных округов штата Огайо (место распространения сообщений) в период с 1 сентября по 5 ноября соответствующего года выборов (время появления сообщений).
Точно так же если мы хотим исследовать динамику развития напряженности в отношениях между США и Угандой в 70-е годы, то искомая совокупность может быть определена как все дипломатические послания (тип сообщений), которыми обменялись правительства США и Уганды (стороны, участвующие в процессе коммуникации) в течение определенного периода времени.
В каждом из этих примеров совокупность сообщений, подлежащих изучению, определяется с помощью набора заданных критериев, которым должно отвечать каждое сообщение. К этим критериям относятся: тип сообщений (романы, газетные публикации, дипломатические ноты), тип продуцента сообщений, стороны, участвующие в процессе коммуникации (отправитель, или получатель, или они оба), а также место распространения, частота появления, минимальный объем или длина, способ распространения и время появления сообщений. При необходимости могут быть использованы и другие критерии, однако те, которые перечислены нами выше, встречаются в большинстве исследований, где применяется контент-анализ. Первоочередная задача при подготовке к контент-анализу [c.271] состоит в том, чтобы выбрать среди этих критериев те, которые имеют наиболее непосредственное отношение к конкретному исследовательскому вопросу.
После того как мы определили совокупность сообщений, перед нами встает задача решить, какие из сообщений мы будем изучать наиболее детально. Поскольку подлежащие анализу случаи (сообщения) зачастую ограничены по числу и относительно хорошо доступны и поскольку контент-анализ в целом менее дорогостоящ (в расчете на каждое сообщение), чем другие методы (в особенности опрос), иногда удается подробно исследовать каждый случай (сообщение) из данной совокупности, т.е., по сути, произвести опись всех случаев. Именно возможность изучения большого количества случаев является одной из главных привлекательных черт контент-анализа как исследовательского метода. Чаще, однако, случается, что даже контент-анализ вынужден опираться на ограниченную выборку, взятую из более крупной совокупности.
Ввиду того что для документов, газетных статей и пр. обыкновенно существуют указатели или перечни, публикуемые в центральных изданиях и потому доступные для исследования, в контент-анализе из выборочных методов чаще всего применяются простой случайный отбор и систематический случайный отбор. Но даже тогда, когда необходимо выборочное обследование, размеры выборок для контент-анализа – благодаря доступности и относительной дешевизне исходных данных – обычно значительно превосходят те, которыми вынуждены довольствоваться другие виды исследования. Результатом этого, конечно же, является уменьшение ошибки выборки и повышение уровня надежности наших обобщений.
И наконец, готовясь к проведению контент-анализа, мы должны принять решение о единице измерения, или – если использовать более общеупотребительный термин – оединице анализа. В контент-аналитическом исследовании единица анализа – это просто отдельный элемент или признак того сообщения, которое мы собираемся изучать, обсчитывать или оценивать. Простейшим элементом сообщения являетсяслово, и оно может быть использовано в контент-анализе наиболее непосредственным образом. [c.272]
Например, желая ответить на вопрос “Насколько интересовали проблемы мира во всем мире Р. Рейгана, Дж. Картера, Дж. Форда и Р. Никсона?”, мы могли бы взять выборки из выступлений каждого президента и подсчитать, сколько раз в тексте появится слово “мир” (и, возможно, некоторые другие, связанные с этим слова). Отвечая на вопрос “Какая страна – Израиль, Египет, Сирия или Саудовская Аравия – занимает наиболее миротворческую позицию по вопросам ближневосточного конфликта, если судить по выступлениям ее представителей в ООН в период с 1975 по 1990 г.?”, мы снова могли бы, взяв записи всех таких выступлений, подсчитать частоту появления слов типа “мир”, “братство”, “компромисс” и т.п. Таким образом, метод состоит в том, что устанавливаются определенные ключевые слова и подсчитывается частота их употребления в сообщениях.
Однако даже в столь простой процедуре надо следить за тем, чтобы избежать по меньшей мере двух характерных ошибок. Во-первых, следует помнить, что оперирование нестандартизированными мерами может приводить к смещениям в результатах. Если за рассматриваемый период времени представители Израиля в своих выступлениях произнесли 100 тыс. слов, причем интересующие нас ключевые слова были упомянуты ими 50 раз, а представители Египта произнесли 200 тыс. слов, включая 100 упоминаний соответствующих ключевых слов, то, исходя из этого, можно прийти к двум разным заключениям в зависимости от того, стандартизированы или нет наши показатели. Если мы просто подсчитаем общее число упоминаний ключевых слов, то у нас получится, что египтяне выказали вдвое большую заинтересованность в мирном урегулировании конфликта, чем израильтяне. Если же, однако, мы стандартизируем нашу меру так, чтобы с ее помощью можно было определять долю всех ключевых упоминаний (допустим, в расчете на каждую тысячу слов), то в итоге мы сможем заключить, что обе стороны одинаково заинтересованы в улаживании конфликта. Какой из этих подходов правильнее? Это основной вопрос при операционализации переменных, и ответ на него достигается успешнее всего, если более внимательно присмотреться к тому, как была изначально концептуализована исследовательская проблема. Дело в том, что использование даже [c.273] такого на вид конкретного показателя, как число произнесенных ключевых слов, может быть чревато определенной двусмысленностью. Исследователь должен видеть эту двусмысленность и уметь с нею справляться, поскольку принятые (или, наоборот, упущенные) в связи с этим решения могут оказать существенное влияние на окончательные выводы.
Вторая возможная ошибка, связанная с грубо прямолинейным подсчетом слов, состоит в том, что одно и то же слово может употребляться в самых разных контекстах, изменяющих его значение. “Мы стремимся к миру, но...”, “Арабское братство никогда не допустит...”, “О компромиссене может быть и речи...” – при отсутствии каких-либо средств контроля такие упоминания слов “мир”, “братство”, “компромисс” будут сочтены упоминаниями в позитивном смысле, а это – самое меньшее – приведет к завышению оценки степени заинтересованности соответствующей стороны в достижении мирной договоренности. Если подобного рода употребления достаточно часты, они могут в конечном итоге совершенно нас дезориентировать. Поэтому когда мы беремся считать слова, то это следует делать с учетом контекста.
Тут у нас имеется по меньшей мере две возможности. С одной стороны, мы можем использовать мнения арбитров, или кодировщиков, т.е. членов исследовательской группы, в задачу которых входит прочтение и оценка контекстов ключевых слов с точки зрения их позитивности, негативности или нейтральности. Обычно, прежде чем будет достигнуто окончательное решение, каждое упоминание должно быть прочитано не менее чем двумя кодировщиками, оценки которых должны быть согласованы. (Позже мы еще вернемся к этому вопросу.) Подобные оценки контекста позволяют впоследствии подсчитать числовое соотношение позитивных и негативных упоминаний.
Другой возможный путь интерпретации отдельных слов в контексте (хотя это дает всего лишь частичное решение проблемы) состоит в том, чтобы добавить к рассмотрению вторую единицу анализа – тему. Тема – это некоторое вполне определенное сочетание слов или понятий, воплощенное во фразе, в предложении или даже в абзаце. Фактически, подсчитывая темы, мы занимаемся поиском упоминаний в тексте объектов обсуждения, например [c.274] в виде фраз “холодная война”, “проблема беженцев”, “государственное социальное страхование”, “христианское поведение”. Данная процедура является вариантом подсчета слов – но вариантом улучшенным в том отношении, что в состав тем входят пояснительный текст и слова-модификаторы (наречия, прилагательные), сопровождающие употребление конкретного слова и помогающие установить его значение.
Однако и в этой процедуре есть своя трудность. Дело в том, что хотя такой анализ действительно проясняет контекст употребления отдельных слов, но происходит это за счет значительного усложнения всей процедуры. Ведь одна и та же тема может упоминаться по-разному и с помощью самых разных словосочетаний. Иногда это – тонкий намек, почти или совсем лишенный тех эксплицитных признаков, по которым мы опознаём данную тему. Упоминание о “холодной войне”, например, вполне может быть завуалировано миротворческими словами о разрядке, а упоминание о христианском доброчестии может быть замаскировано националистической риторикой. Можно ли подобные слова и риторику считать ключевыми? Содержат ли они в себе данную тему или нет? На эти вопросы непросто ответить. Попытки сделать это заставляют приходить к четким, но ограниченным определениям, к формулировке целого ряда строго формализованных правил принятия решения (разрешающих, например, производить подсчет только по эксплицитным, заданным некоторым списком упоминаниям темы), которые делают наши результаты, возможно, более надежными, но одновременно и менее содержательными.
Третий элемент, часто используемый в исследованиях с применением контент-анализа, – это собственно предмет как таковой, рассматриваемый в целом. Каков процент книг, пропагандирующих социализм, опубликованных в США в 1935 году? Какому кандидату в президенты в 1992 г. симпатизировало наибольшее количество редакций газет? Как письма, написанные Ричардом Никсоном после того, как он ушел со своего поста, отличаются от писем, написанных ранее? В каком из этих случаев мы обрабатываем несущий информацию блок как некую целую единицу и изучаем его общие, всеохватывающие характеристики. Какой конкретный вопрос рассматривается в [c.275] этом случае? Отражаются ли определенные ценностные установки или пристрастия? При рассмотрении таких вопросов притупляется острота взгляда, необходимого при анализе более мелких структур. Неизбежным становится присвоение обобщающих определений, но именно в силу этих причин их анализ обычно легче выполнить, чем анализ слов или тем, в том смысле, что исследователю приходится делать меньше запросов. И это действительно так, поскольку можно оперировать переменными достаточно нейтрального уровня, – уровня, на котором события (то есть происшествия заметные, яркие) часто более очевидны и на котором оценки более достоверны.
Предметное изучение употребления слов и тем в последнее время стало легче проводить благодаря развитию компьютерных баз данных, таких, как LEXIS/NEXIX. Предположим, к примеру, что мы хотим узнать, как часто Дж. Буш сравнивал Саддама Хусейна с Гитлером в течение месяца, предшествующего войне 1991 г. в Персидском заливе. Используя NEXIS, мы можем сделать запрос на полнотекстовое исследование всех статей в “Нью-Йорк Тайме” (и любых других газетных статей и текстов передач широкого вещания), в которых слова “Дж. Буш”, “Саддам Хусейн” и “Гитлер” встречаются в хронологический период, выбранный для изучения. Тогда в соответствующем файле, с учетом особенностей пакета и языка, можно будет написать команду примерно следующего вида:
((George Bush)OR (President Bush) AND ((Saddam Hussein) w/10 Hitler)) AND (Date = September 1990)
Это длинное выражение задает команду, по которой в любой статье, опубликованной в сентябре 1990 г., будет опознан, во-первых, поименованный мистер Буш, а во-вторых, мистер Хусейн, если его имя отстоит в тексте от слова “Гитлер” не более чем на 10 слов в любую сторону. Такой запрос позволяет нам, кроме всего прочего, проверить (1), упоминалось ли имя мистера Буша вместе с его титулом чаще, чем без титула в то время, как становилось все яснее, что кризис будет разрешен военным путем (поскольку было бы возможно предположить ситуацию, что средства массовой информации неуловимо будут повышать весомость статуса президента, по мере того как [c.276] нация приближается к войне); (2) по сравнению с другими политиками мистер Буш лидировали или отставал по числу использования имени “Гитлер” в различных аналогиях, или (3) бесконечное число других гипотез, относящихся к формулированию восприятия конфликта обществом.
Результаты обобщенного анализа во многих отношениях не менее содержательны, чем результаты компонентного. Какой факт важнее: то, что египтянами в ходе одного из выступлений в ООН семь раз было упомянуто слово “мир”, или же то, чтоими была произнесена в целом миротворческая речь? Более важно, посылали ли США в Ирак ноту с четырьмя открытыми упоминаниями об интервенции, тремя скрытыми намеками на неспособность разоружиться и двумя острокритическими намеками на военную экспансию, или что США послали ноту, которая может быть охарактеризована как вздорная по тону? В контент-анализе иногда – и всегда по недостатку средств – мы рискуем не увидеть леса за деревьями или , по аналогии, значение информации вообще за частями, ее составляющими. По этой причине мы должны быть очень и очень осторожными в выборе измеряемой единицы анализа и избрать наиболее перспективную и благоприятную для проведения исследования в целом.[c.277]