Типичные ошибки анализа документов в социологическом исследовании

1.Исследователь использует документальную информацию в качестве первичной социологической информации без пред­варительного ее анализа; не проверены: подлинность, достовер­ность, авторство документа, назначение информации.

2. Анализ документов ведется без предварительного плана, про граммы.

3. Выбранные для анализа документы имеют сходство с темой исследования лишь по названию. Информация, содержащаяся в них, не связана с гипотезами исследования.

4. Категории анализа не сопоставлены со смысловым содер жанием и языком текста документов. В терминологическом обо значении категорий анализа имеется двусмысленность; в одну и ту же категорию анализа попадают существенно различающиеся смысловые единицы текста.

5. Не подготовлены заранее и не апробированы методические документы обзора данных. Возникли трудности регистрации при знаков.

6. Не проведен инструктаж среди регистраторов и кодировщи ков, они не прошли специальную подготовку.

7. Кодировка не соответствует программе обработки данных.

8. Плохо организовано рабочее место регистратора.

9. Нет списка (каталога) документов, используемых в анализе

2.3. Методология и методика контент-анализа

Контент-анализ представляет собой перевод в количественные показатели массовой информации (текстовой, аудиовизуальной цифровой) с последующей статистической ее обработкой. Его идея очень проста и повторяет ту, что лежит в основе любого другого количественного метода в социологии, будь то анкетирование или наблюдение. Надо сосчитать наиболее часто повторяющиеся сло ва или темы, например в газетном материале, и определить, что за этим кроется. Особенность заключается именно в применении статистических процедур для анализа однотипных текстов.

Контент-анализ (англ. content analysis — анализ содержания) — количе ственный анализ текстов и текстовых массивов с целью последующей со держательной интерпретации выявленных числовых закономерностей.

А в известной у нас переводной книге Дж. Мангейма и Р. Рича сказано так: контент-анализ — это систематическая числовая об работка, оценка и интерпретация формы и содержания информа ционного источника. Этот тип неопросного исследования назы вают еще формализованным анализом документов.

Под текстами в контент-анализе понимают книги, книжные главы, эссе, интервью, дискуссии, заголовки газетных статей и сами статьи, исторические документы, дневниковые записи, речи выступлений, рекламные тексты и т.д. Когда говорят о контент-анализе текстов, то главный интерес всегда заключается не в са­мих характеристиках содержания, а во внеязыковой реальности, которая за ними стоит, — личных характеристиках автора текста, преследуемых им целях, характеристиках адресата текста, различ­ных событиях общественной жизни и др.

Как любой другой социологический метод, контент-анализ используется не сам по себе, а в составе крупного исследователь­ского проекта, под который составлена научная программа, где четко прописаны цели и задачи, проблема и объект, теоретичес­кая модель и предмет исследования, выдвинуты гипотезы и про­ведены все другие операции, которые требует научный метод. Когда становится ясным, что поставленных целей никаким иным способом, как только анализом документов, достичь нельзя, со­циолог прописывает все этапы его применения: устанавливает объект, выделяет единицы анализа (их нередко называют еще еди­ницами наблюдения и т.п.), выбирает статистический метод ана­лиза данных, идет в библиотеку за источниками или садится за Интернет (полевая стадия), а потом ищет, суммирует, считает и интерпретирует. Контент-анализ позволяет обнаружить в доку­менте то, что ускользает от поверхностного взгляда при его тра­диционном изучении. Он позволяет вписать содержание докумен­та в социальный контекст, осмыслить его одновременно и как проявление, и как оценку социальной жизни.

Принято считать, что контент-анализ состоит из трех основ­ных этапов: 1) выделяются единицы анализа, которые затем сво­дятся в категории анализа и переводятся в машиночитаемый вид; 2) проводится подсчет частотных распределений, применяется математический аппарат для выявления взаимосвязей единиц ана­лиза; 3) осуществляется интерпретация полученных результатов.

Выбор объекта и единиц анализа — чуть ли не самые сложные шаги на этом пути. Нужно найти ответы на вопросы: где мне это искать и как проявляется изучаемое мною явление, событие, процесс.

Объектом контент-анализа могут быть экземпляры книг, пла­катов или листовок, номера газет, фильмы, публичные выступле­ния, теле- и радиопередачи, общественные и личные документы, журналистские интервью, ответы на открытые вопросы анкет и др. Они составляют то, что называется выборкой, — ту часть текстов, которые достаточны для анализа всего массива публикаций, и обеспечивают репрезентативность данных.

Это довольно просто, зато с выбором единиц анализа придется помучиться, поскольку эту роль может выполнять что угодно: темы и проблемы, пропозиции, образы, идеологемы, метафоры, примеры и аналогии, каламбуры, аллитерации, мифологемы, ко чующие образы и многое другое, иногда очень экзотическое, ска Жем, надписи на стенах публичных туалетов. Единицами анализа могут служить, например, упоминания о российских политичес ких деятелях и политических партиях и движениях (фамилии, имена политиков и названия партий). В такой роли могут высту пать также фрагменты текста или его признаки, фотографии, за головки, названия профессий, события, города, страны, органи зации, оценки, суждения на определенную тему и т.п.

А теперь внимание. Хотя в природе контент-анализа не зало жено никаких ограничений, а потому ничто не препятствует eго применению к отдельному тексту, тем не менее существует ряд причин, по которым его используют только в информационных массивах, состоящих из большого количества текстов. Во-первых, статистические закономерности проявляются тем более отчетли во, чем больше объем выборки. Во-вторых, в большинстве случа ев контент-анализ используется в компаративных, т.е. историко сравнительных, целях. Он силен, когда раскрывает не oднoмoмент ные срезы, а динамику изменений.

Таким образом, идея контент-анализа предполагает анализ боль ших информационных массивов; с другой стороны, его относитель ная дешевизна и технологичность делают такой анализ принципи ально возможным. Поэтому не приходится удивляться тому, что в истории контент-анализа имеются такие проекты, как анализ 427 школьных учебников, 481 частной беседы, 4022 рекламных сло ганов, 8039 (в 1938) и 19 533 (в 1952) редакционных статей или 15 000 персонажей в 1000 часов телевизионного эфирного времени.

Выбор единиц анализа зависит от исследовательской програм мы, объекта, предмета, цели, задач и гипотез исследования. Если, скажем, нам предстоит выяснить перспективы забастовки рабочих Предприятия, то станет очевидной потребность контент-анализа, как минимум, протоколов собраний рабочих, решений соответству кзщих профсоюзных комитетов, распоряжений руководителей, за конов, регулирующих забастовочную борьбу, и т.п. Переход от за дачи к единицам анализа аналогичен процедуре теоретической и эмпирической интерпретации понятий и поиска индикаторов.

Выяснение того, что считать, т.е. установление единиц анали за, — главная, решающая, ключевая (или как угодно еще) пред посылка контент-анализа. Допущенные здесь ошибки трещинами разойдутся по всему зданию. Обязательное условие: такие едини

цы должны быть единообразными, тогда социолог получит чет­кие статистические показатели. Добиваются подобного единооб­разия благодаря стандартизации процедуры анализа текста, кото­рая, устраняя субъективные смещения, раскрывает свои возмож­ности только при достаточно больших массивах текстов. Единицы анализа должны легко и по возможности однозначно идентифи­цироваться в тексте. В идеале их лучше всего свести к самым упот­ребляемым формальным значкам, например запятым или точкам. Тогда подсчет не представит никаких трудностей, а интерпрета­ция результатов будет однозначной и объективной. Только кому нужен такой счет? Социологу он ничего не даст. Его задача — за внешними признаками, например отдельными словами или фра­зами, распознать таящееся в глубине социальное явление. А это уже качественный подход. Слова, выбранные для счета, должны обладать распознавательной силой, выступать диагностическим инструментом. Иными словами, единицы анализа должны быть интересными для последующей (политологической, культуроло­гической, социологической и т.д.) интерпретации. Тут необходи­мы оригинальное видение мира, необычный подход.

Количественный подсчет встречаемости слов в тексте — самый простой вариант контент-анализа, который, однако, приводит к интересным результатам. Чаще всего подсчитывают «интересные» или «ключевые» слова и (или) словосочетания, например назва­ния ценностных категорий типа свобода, стабильность, доверие, территориальная целостность; сценариев типа предательство или разочарование; достаточно однозначные обозначения тех или иных общественно значимых явлений, например коррупция, преступ­ность или терроризм, и др.

С научно-познавательной точки зрения социолога интересуют все-таки не отдельные слова, а стоящие за их «спиной» понятий­ные категории, объединяющие множество разрозненных слов-признаков в тематическое целое. Исследователь, интересующий­ся тем, какое место в общественном сознании занимает, скажем, проблема преступности, обязан принимать во внимание не толь­ко присутствие в анализируемом информационном массиве сло­ва «преступность», но и упоминания заказных и всяких прочих убийств, бандитского беспредела, «крыши», «братков», авторите­тов, власти криминала и т.п.

По отношению к единицам анализа, сгруппированным по едино­му основанию, иначе говоря, составляющим концептуальное целое, специалисты употребляют другой термин — «категории анализа».

Категории анализа — его смысловые единицы, обозначающие эмпирические признаки текстовой информации, которые являются 572

результатом операционализации опорных теоретических понятий в концепции исследования. К категориям анализа предъявляются оп ределенные требования: они должны выражать теоретические поня тия исследования, иметь в соответствии признаки (смысловые еди ницы) в тексте, обладать возможностями однозначной регистрации признаков, составляющих эти категории. Основная задача сбора ин формации в ходе анализа — поиск индикатора, указывающего на наличие в документе выделенной проблемы, идеи, темы (например, «справедливое распределение благ»). Категории анализа вы ража ют ся определенными признаками (подкатегориями), характеризующи ми интенсивность, направленность, значимость выраженной в ка тегории идеи, проблемы. К ним могут относиться понятия из лю бой сферы жизни общества: формы собственности, приватизация, финансовая система, научно-технический прогресс, методы хозяй ствования, национализм, авторитаризм, демократия, международное сотрудничество, права человека, гуманизм, активность, деловая предприимчивость, нарушение законности, коррупция и др.

С помощью категорий выделяют концептуальные связи, модели, микропроблемы, тематические поля. В качестве примера можно привести анализ президентских посланий стране, с которыми обра тился Б. Клинтон в 1994 и 1995 гг. Эти послания содержат от 7 тыс. до 10 тыс. слов. Были сформированы категории слов, относящихся к экономике, бюджету страны, образованию, преступности, вопро сам семьи, международным делам, социальной помощи и др. В ка тегорию «экономика» входили слова: экономика, безработица, инф ляция; в категорию «семья» — ребенок, семья, родители, мать, отец. Именно учет частот встречаемости категорий, а не отдельных слов позволяет судить о внимании, уделенном в послании тем или иным вопросам. По изменению относительных частот в посланиях 1994 и 1995 гг. были сделаны выводы об изменении политики государства в различных областях. Эти темы нашли отражение в обоих послани ях, но в одном из них некоторым темам уделялось больше внимания, а в другом меньше. Скажем, в послании 1995 г. больше внимания было уделено вопросам образования, семьи, но меньше внимания — пре ступности, международным делам, социальной помощи. Отсюда пос ледовал вывод о стратегических приоритетах правительства США.

Другой пример использования контент-анализа — изучение должностных инструкций на предприятии20. Исследователь осно вывался на следующих предпосылках. Содержание инструкции как нормативного документа, координирующего взаимодействие лю

дей, должно обеспечивать четкую регламентацию ролевых пози­ций. Чем она полнее, тем эффективнее взаимодействие и отно­шения людей. Ключевым явилось понятие «регламентация». Ос­новные стороны производственной деятельности, подлежащие регламентации, составили ее предметное содержание. Они назва­ны «категориями регламентации»: 1) место должности в структу­ре организации; 2) основные цели деятельности лиц, занимающих данную должность; 3) квалификационные требования; 4) обязан­ности работников; 5) подчиненность и права; 6) ответственность.

Благодаря этому появилась возможность расчленить текст на смысловые блоки по названным шести категориям, по каждой из них сделать стандартизованное заключение о наличии или отсутствии в тексте данной категории. Единицей счета выступил фрагмент тек­ста, содержащий упоминание категории и характеристику ее содер­жания (независимо от полноты и точности этой характеристики). Далее на этом весьма обобщенном уровне анализа текста можно от­личить более полную и четкую инструкцию от поверхностной и фраг­ментарной. Заключение о качестве инструкции здесь не интуитив­ное (как в случае экспертной оценки), а аргументированное.

Углубление контент-анализа идет за счет конкретизации поня­тия «категория регламентации», т.е. поиска детальных индикаторов. Таковыми оказались «элементы регламентации», например «ответ­ственность», «подчиненность» и т.д. Категории «подчиненность» и «права лиц, занимающих данную должность» раскрывались через суждения — индикаторы типа «как увольняются и назначаются лица, занимающие данную должность», «кому они подчиняются». Дробное членение содержания служебной деятельности и выявило в тексте такие единицы учета (суждения, сочетания слов, предло­жения), которые давали возможность построить числовые показа­тели, характеризующие отдельные качества должностных инструк­ций: подробность, четкость и т.д.

Категории анализа, по мнению СИ. Григорьева и Ю.Е. Рас-това, должны быть: а) уместными, т.е. соответствовать решению исследовательских задач; б) исчерпывающими, т.е. достаточно пол­но отражать смысл основных понятий исследования; в) взаимо­исключающими (одно и то же содержание не должно входить в различные категории в одинаковом объеме); г) надежными, т.е. такими, которые не вызывали бы разногласий между исследова­телями по поводу того, что следует относить к той или иной ка­тегории в процессе анализа документа.

Однако указанные требования соблюдаются далеко не всегда. Сведение единиц анализа в категории всегда выступает способом их классификации, критерии которой не только чрезвычайно расплыв чаты и туманны, но разнятся от одного исследователя к другому. Они опираются на экспертные оценки социолога, зависят от общего уров ня его подготовки и знания социальных реалий. Количество caмих категорий будет зависеть от степени допускаемого обобщения соци­ального материала. В результате может нарушаться один из принци пов научного исследования — возможность воспроизведения резуль татов опыта разными исследователями, хотя известно: каким бы об разом ни были введены категории, воспроизведение проделанных частотных процедур контент-анализа вполне осуществимо. Однако слабым звеном остается выбор единиц анализа и единиц счета.. Для того чтобы избежать априорной категоризации, в качестве единиц анализа зарубежные социологи проводят категоризацию с помощью тематических словарей или каталогов. Для подобных целей еще в конце 1960-х гг. предлагалось применять компьютерные программы, в основе которых лежал факторный анализ.

В любом случае в контент-анализе категории выполняют фун кцию, аналогичную абстрактным объектам, которые в теоретичес кой модели предмета исследования (см. разд. I гл. 3) приходится операционализировать, разбивая их на совокупность конкретных терминов и признаков. Роль последних в контент-анализе выпол няют «низшие чины» — слова.

Хотя о единицах анализа мы рассказали раньше, чем о его кате гориях, при построении программы контент-анализа социологи часто идут в обратном порядке — от общего к частному, от катего рий к единицам. Подобная логика совпадает с методологией раз работки программы фундаментального исследования в социологии.

В таком случае методолого-методическая часть программы раз бивается на три этапа. Первым шагом будет определение систе мы категорий анализа, вторым — соответствующая им единица анализа текста, а третьим — установление единиц счета, т.е. ко личественной меры единиц анализа (их еще называют индикато рами контент-анализа), позволяющей регистрировать частоту (ре гулярность) появления признака категории анализа в тексте.

Единица счета — количественная характеристика единицы анализа, она фиксирует регулярность, с которой встречается в тексте та или иная смыс ловая единица.

За единицу счета могут быть приняты: 1) частота появления признака категории анализа; 2) объем внимания, уделяемого кате­гории анализа в содержании текста. Для установления объема вни­мания могут быть учтены количество печатных знаков, абзацы, площадь текста, выраженная в физических пространственных еди­ницах. Для газетных и других стандартных текстов — ширина ко­лонки и высота высказывания. Для текстов, передаваемых устно, в качестве единицы счета могут использоваться единицы времени.

Единицами счета могут быть число определенных слов или их сочетаний, частота упоминаний слов, количество строк, печатных знаков, страниц, абзацев, авторских листов, площадь текста, вы­раженная в физических величинах, эфирное время и многое дру­гое. Единицы счета «могут и совпадать и не совпадать с единица­ми анализа. В первом случае квантификация сводится к опреде­лению частот упоминания выделенной смысловой единицы по отношению к другим категориям (как в случае построения индекса самостоятельности инженеров). Во втором случае единицей сче­та избирают физическую протяженность или площадь текстов, заполненную смысловыми единицами: число строк, абзацев, квад­ратных миллиметров, знаков, колонок — в печатных текстах; дли­тельность трансляции по радио или телевидению, метраж пленки при магнитофонных записях»23.

Процедура контент-анализа включает в себя применение стандар­тных правил выделения в изучаемом тексте однотипных единиц ана­лиза (счета, наблюдения) и подсчет частоты встречаемости этих еди­ниц в выборке (количество документов, подвергаемых непосредствен­ному счету) как в абсолютных (число раз), так и в относительных (проценты) величинах. Обязательный момент в такой процедуре — использование математико-статистических методов счета. Ведь основу контент-анализа составляет подсчет встречаемости некоторых компо­нентов в анализируемом информационном массиве, дополняемый выявлением статистических взаимосвязей и анализом структурных связей между ними, а также снабжением их теми или иными количе­ственными или качественными характеристиками.

Связь между категориями устанавливают методом совместной встречаемости (сооссигепсе) слов различных категорий: для каж­дого предложения текста выясняют, слова каких категорий в нем встречаются. После этого легко подсчитать обычный коэффици­ент корреляции, который выражает силу связи между категория­ми и знак этой связи.

Контент-анализ текстов с использованием категорий иногда называют концептуальным анализом. Сфера его применения до вольно широка. С его помощью решают два основных типа задач:

1. Есть два или более текстов, которые необходимо сравнить в отношении нагрузки на определенные категории. Например, за дача выяснить, какое внимание уделяют две разные газеты опре деленным темам. Если эти газеты рассчитаны на одну аудиторию, то существенное различие в частотах позволит судить о различи ях в политике, проводимой людьми, стоящими за ними.

2. Задача отслеживания динамики изменения нагрузки на опре деленные категории. Например, выяснить частоту упоминания темы внешнего долга России в фиксированном наборе центральных газет на протяжении какого-то времени и соотнести ее с колебаниями курса доллара путем простого корреляционного анализа.

Из истории разведки известно, как по изменению в специаль ной литературе частоты упоминания определенных научных тем и фамилий ученых делались достоверные выводы об успехах, до стигнутых в конкретных областях исследований.

Относительные частоты употребления тех или иных единиц анализа позволяют сравнивать два и более текстов, делать важные| теоретические обобщения. Например, в тексте выступления депу тата Думы можно оценить уровень агрессивности, для чего кон струируется категория агрессивно окрашенной лексики. После этого сравнивают текст выступления данного депутата с другими выступлениями и выявляют, кто агрессивнее. Можно сравнивать данный текст не с другими текстами, а с некой нормой, своеоб разной нулевой отметкой агрессивности. Мы получим ее, если выясним относительную частоту употребления агрессивно окра шенных слов средним носителем русского языка. Помощь в этом могут оказать частотные словари. Сравнивая относительную час тоту употребления агрессивно окрашенной лексики в выступле нии депутата с частотой ее употребления средним носителем рус ского языка, можно сделать вывод о степени агрессивности. Но и это еще не все. Небольшие отклонения частот в большую или меньшую сторону могут быть следствием случайных колебаний. На вопрос о значимости отклонения частот позволяет ответить статистическая оценка, известная под названием z-score и вычис ляемая по формуле (N- .^/(стандартное отклонение), где N— ко личество слов данной категории, реально встретившихся в тексте, а Е— ожидаемое число вхождений слов данной категории в текст.

Величина Е вычисляется путем умножения нормальной частоты категории на число слов в анализируемом тексте25.

Квантификация данных в контент-анализе проводится самы­ми разными способами. Помимо анализа частотного распределе­ния к ним относятся анализ различного рода корреляций между переменными, ассоциаций, анализ сопряженности, кластерный анализ, их оценка по тем или иным градуированным качествен­ным шкалам.

После квантификации, т.е. перевода данных в числовую фор­му, их математическая и, в частности, статистическая обработка может осуществляться многими разными программными сред­ствами, в том числе стандартными статистическими пакетами типа SPSS. При анализе текста и последующем сохранении результа­тов этого анализа в базах данных могут использоваться специаль­ные программы, предназначенные для целей лингвистических исследований.

Аналитические исследования СМИ предполагают проведение статистического и качественного анализа информации за конкрет­ный период. В частности, составляется полный статистический отчет упоминаний в СМИ интересующей клиента темы с отраже­нием характера упоминаний (положительные, нейтральные или негативные отзывы). На основе этих данных выявляются тенден­ции, разрабатываются рекомендации по ответной реакции в СМИ и улучшению имиджевой ситуации.

В настоящее время различается четыре методологии контент-анализа: грамматический (лингвистический) — по размеру абзацев, длине фраз, порядку слов в предложении, метрическому составу и другим формальным признакам языка; семантический (социо­логический) — по экспертным оценкам содержания; документа-листический (кибернетический) — по параметрам языка, текста и документа как сообщения (дескрипторы и их нагрузка, компакт­ность, информационная плотность, аспектность, проточность, физический и информационный объемы, информационная ем­кость и информативность); цитационный — анализ библиографи­ческих ссылок в научной литературе26.

Проведение контент-анализа требует предварительной разработ­ки ряда исследовательских инструментов. Разные специалисты и источники называют неодинаковое число таких документов. По

мнению СИ. Григорьева и Ю.Е. Растова, их должно быть пять: 1) классификатор контент-анализа; 2) протокол итогов анализа (он еще называется — бланк контент-анализа); 3) регистрационная кар-точка (кодировальная матрица); 4) инструкция исследователю, не посредственно занимающемуся регистрацией и кодировкой единиц счета; 5) каталог (список) проанализированных документов. Клас­сификатором контент-анализа авторы называют общую таблицу , в которую сведены все категории (и подкатегории) анализа и единицу,в цы анализа. Ее основное предназначение — предельно четко зафик-сировать то, в каких единицах выражается каждая категория, ис пользуемая в исследовании. Классификатор уподобляется социоло гической анкете, где категории анализа играют роль вопросов,а единицы анализа — ответов, и считается основным методическим документом контент-анализа, предопределяющим содержание дру гих документов. Протокол (бланк) контент-анализа содержит: во первых, сведения о документе (его авторе, времени издания, объе ме и т.п.); во-вторых, итоги его анализа (количество случаев упот ребления в нем определенных единиц анализа и следующие отсюда выводы относительно категорий анализа). Протоколы заполняют ся, как правило, в закодированном виде, но не ради сохранения тайны контент-анализа, а исходя из желания на одном листе бума ги уместить всю информацию о документе (так удобнее сопостав лять друг с другом итоги анализа разных документов). Регистра ционная карточка представляет собой кодировальную матрицу, В которой отмечается количество единиц счета, характеризующих единицы анализа. Протокол контент-анализа каждого конкретно го документа заполняется на основе подсчета данных всех pегист рационных карточек, относящихся к этому документу.

По другим источникам, главными среди методических доку ментов контент-анализа являются кодировочная карточка (коди фикатор, код, бланк кодировки) и инструкция кодировщику.

Первый нормативный документ принимает разные формы, может быть менее и более подробным, но в любом своем виде он представляет собой таблицу.

В более подробном варианте в кодировочной карточке, т.е. специальной таблице, перечислены единицы наблюдения с необ ходимой степенью дробности, указаны правила их регистрации и оставлено место для записей результатов наблюдений (подсчета

числа упоминаний и других показателей). В ней указываются так­же общие характеристики анализируемого текста (название источ­ника, дата и номер анализируемого экземпляра, название анали­зируемой публикации, автор, жанр). В сокращенном варианте, иногда называемом бланком кодировки, количество сообщаемых сведений меньше. Бланк кодировки составляется в соответствии со схемой операциональных понятий, содержит единицы анали­за и все элементы описания проблемной ситуации, устанавливает однозначное соответствие между лексикой текста и кодами, над которыми производятся вычислительные операции.

В качестве примера приведем фрагмент бланка, с помощью которого можно осуществить кодирование29 (рис. 2.1).

Кодирование данных при контент-анализе обычно осуществ­ляется с помощью достаточно простых анкет или компьютерных программ, в которых фиксируется каждое появление в анализи­руемом тексте искомой единицы. Операции кодирования прово­дит кодировщик — сотрудник, который работает с текстом, фик­сирует частоту употребления единиц счета.

Инструкция кодировщику. Ее содержанием выступает описание правил соотнесения единиц текста с перечнем категорий анали­за, а также правил регистрации в Кодировочной карточке. При­мером может служить список категорий и элементов регламента­ции, который называют кодификатором (кодом). Карточка содер­жит не только список наблюдаемых индикаторов, но и данные в документе, который подвергся кодированию (например, номер или название подразделения, в котором используется данная ин­струкция, ее объем в страницах, число разделов и т.п.).

Инструкция кодировщику содержит обычно не только прави­ла поиска и регистрации единиц текста, соответствующих деле­ниям кодификатора, но и примеры таких единиц, слова, выска­зывания, суждения и т.п.

После разработки инструкция проверяется на однозначность ее понимания различными кодировщиками. Цель — выяснить, по­могает ли инструкция кодировщикам получать единообразные, стандартные результаты, не зависящие от субъективных особен­ностей восприятия кодировщиков. Делается это следующим об­разом: один и тот же текст дается группе кодировщиков, которые работают с едиными кодификаторами (кодировочными карточка­ми) и инструкциями. Затем проверяется совпадение результатов. Случаи расхождения результатов выясняются, обсуждаются их причины. Те указания инструкции, которые не обеспечивают од-580

нозначного восприятия кодировщиками, уточняются, после чего проводится новая проверка инструкции до получения необходи­мого уровня совпадения результатов.

Признак, градация признака Коды  
1. Тип автора    
  — один человек  
  —два и более человека  
  — ситуация не ясна  
2. Группа, к которой принадлежит автор    
  — неформальная группа (семья, друзья и т.д.)  
  — формальная группа (производственная группа, учебный  
  коллектив и т.д.)    
  — ситуация не ясна  
3. Пол автора    
  — автор (авторы)—мужчина (мужчины)  
  — автор (авторы)—женщина (женщины)  
  — смешанная группа  
  — ситуация не ясна  
4. Возраставтора    
  — молодежь (до 30 лет)  
  —лица среднего возраста (30—49 лет)  
  —лица старшего возраста (свыше 50 лет)  
  — смешанная группа  
  — ситуация не ясна  
5. Количество проблем, рассматриваемых в письме    
  —одна  
  -две  
  — более двух  
6. Локальность проблем, поднятых в письме Проблема№1 Проблема Ns2
  — мир
  — страна
  — город
  —предприятие, учреждение
  — частная жизнь
7. Сфера общественной жизни (страна, область, город)    
  —промышленность
  —сельское хозяйство
  —транспорт
  —строительство
  — вопросы распределения жилья
  — вопросы социального обеспечения
8. Типы суждений    
  —суждение оценочное
  —суждение конструктивное
  —суждение аналитическое
  —другие типы суждения

Рис. 2.1. Фрагмент бланка

В контент-анализе изучение любого текста проливает свет на его автора и те социальные условия, в которых создавался текст. В результате обнаруживаются авторство анонимной работы и пла­гиат, определяются жанр и авторский стиль, степень новизны и достоверности и даже характер интеллекта автора. Отсюда принад­лежащее А.Г. Здравомыслову полушутливое определение контент-анализа как «научно обоснованного метода чтения между строк».

Контент-анализ позволяет социологу изучать более глубокий слой социальных явлений, чем это доступно другим методам. Чтобы обнаружить явление, стоящее за суждениями, в социоло­гии ищут связанные с ним слова. А для понимания их важности сравнивают с другими основополагающими понятиями. События в Косове и вторая чеченская война изменили политический и культурный климат России. Они отразились в публикациях СМИ и электронной базе Интернета. Анализ частоты употребления слов «Косово», «беженцы», «албанцы», «Югославия», «НАТО» и подоб­ных им демонстрирует, насколько было взбудоражено обществен­ное сознание россиян этими событиями. Контент-анализ элект­ронных изданий, проведенный А. Костинским, выявил удивитель­ную вещь: в период косовского кризиса слово «НАТО» встречалось 132 раза на 100 тыс. слов, США — более 80. Для сравнения: даже сумма частот употребления слов «Чечня», «чечен», «чеченцы», «че­ченская» ни в первую, ни во вторую чеченскую войну не превы­шала 16 слов на 100 тыс. Создается впечатление, будто НАТО и США — главная забота россиян. Размытый прежде враждебный образ Запада сосредоточился для нас в этих двух понятиях30.

Если контент-анализ применяется впервые, то допускаются многочисленные ошибки. Среди них специалисты31 отмечают наиболее типичные просчеты:

Анализ документов опережает разработку исследовательской программы.

Анализируются документы, не связанные с гипотезами иссле­дования (имеющие сходство с темой исследования лишь по назва­нию).

Не проверена подлинность документа.

Не уточнено его авторство.

Неполно учтено его предназначение.

Категории анализа не определены до такой степени, которая позволяет четко различать смысловые единицы текста документа. 582

Категории анализа не субординарны и не приведены в соот­ветствие с теми дефинициями и операционализирующими их тер­минами, которые зафиксированы в программе исследования.

Категории анализа несопоставимы со смыслом и языком тек­ста анализируемого документа.

Единицы анализа характеризуют категории анализа лишь внеш­не, а не по существу, поэтому единицы анализа не позволяют идентифицировать содержание документа в полном соответствии с категориями анализа.

Анализ документа ведется без предварительной подготовки всего комплекса методических инструментов.

Классификатор имеет недочеты, составлен с нарушением пра­вил логики.

Регистраторы (кодировщики) не получили должной методичес­кой подготовки.

Инструкция по регистрации и кодировке недостаточно полная, составлена исследователем, который сам предварительно не апро­бировал инструментарий.

Кодировка не соответствует программе математической обра­ботки данных исследования.

Результаты контент-анализа не перепроверены информацией, собранной иными методами.

Наши рекомендации