Вопрос 34. Контент-анализ как метод социологического исследования
Сущность контент-анализа и его общая характеристика. Основные направления использования. Сущность метода, его сильные и слабые стороны. Специфика применения метода контент-анаяиэа при изучении документов, их систематизация. Анализ публикаций в прессе, писем и других источников. Инструментарий метода контент-анализа, его основные параметры. Техническая сторона контент-анализа. Соотношение метода контент-анализа с другими приемами социологического анализа документов и методами социологического исследования. Анализ статистических документов. Виды статистики и основные формы статистической отчетности {переписи, сводки, бюллетени, сборники и т.д.).
Контент-анализ представляет собой перевод в количественные показатели массовой информации (текстовой, аудиовизуальной, цифровой) с последующей статистической ее обработкой. Его идея очень проста и повторяет ту, что лежит в основе любого другого количественного метода в социологии, будь то анкетирование или наблюдение. Надососчитать наиболее часто повторяющиеся слова или темы, например в газетном материале, и определить, что за этим кроется. Особенность заключается именно в применении статистических процедур для анализа однотипных текстов.
Кантент-анализ (анализ содержания) — количественный анализ текстов и текстовых массивов с целью последующей содержательной интерпретации выявленных числовых закономерностей.
А в известной у нас переводной книге Дж. Мангейма и Р. Рима сказано так: контент-анализ — это систематическая числовая обработка, оценка и интерпретация формы и содержания информационного источника. Этот тип неопросного исследования называют формализованным анализом документов.
Под текстами в контент-анализе понимают книги, книжные главы, эссе, интервью, дискуссии, заголовки газетных статей и сами статьи, исторические документы, дневниковые записи, речи выступлений, рекламные тексты и т.д. Когда говорят о контент-анализе текстов, то главный интерес всегда заключается не в самих характеристиках содержания, а во внеязыковой реальности, которая за ними стоит, — личных характеристиках автора текста, преследуемых им целях, характеристиках адресата текста, различных событиях общественной жизни и др.
Как любой другой социологический метод, контент-анализ используется не сам по себе, а в составе крупного исследовательского проекта, под который составлена научная программа, где четко прописаны цели и задачи, проблема и объект, теоретическая модель и предмет исследования,1 выдвинуты гипотезы и проведены все другие операции, которые требует научный метод. Когда становится ясным, что поставленных целей никаким иным способом, как только анализом документов, достичь нельзя, социолог прописывает все этапы его применения: устанавливает объект, выделяет единицы анализа (их нередко называют еще единицами наблюдения и т.п.), выбирает статистический метод анализа данных, идет в библиотеку за источниками или садится за Интернет (полевая стадия), а потом ищет, суммирует, считает и интерпретирует, Контент-анализ позволяет обнаружить в документе то, что ускользает от поверхностного взгляда при его традиционном изучении. Он позволяет вписать содержание документа в социальный контекст, осмыслить его одновременно и как проявление, и как оценку социальной жизни.
Принято считать, что контент-анализ состоит из трех основных этапов: 1) выделяются единицы анализа, которые затем сводятся в категории анализа и переводятся в машиночитаемый вид; 2) проводится подсчет частотных распределений, применяется математический аппарат для выявления взаимосвязей единиц анализа; 3) осуществляется интерпретация полученных результатов. Выбор объекта и единиц анализа—чуть ли не самые сложные шаги на этом пути. Нужно найти ответы на вопросы: где мне это искать и как проявляется изучаемое мною явление, событие, процесс.
Объектом контент-анализа могут быть экземпляры книг, плакатов или листовок, номера газет, фильмы, публичные выступления, теле- и радиопередачи, общественные и личные документы, журналистские интервью, ответы на открытые вопросы анкет и др. Они составляют то, что называется выборкой, — ту часть текстов, которые достаточны для анализа всего массива публикаций, и обеспечивают репрезентативность данных.
Это довольно просто, зато с выбором единиц анализа придется помучиться, поскольку эту роль может выполнять что угодно: темы и проблемы, пропозиции, образы, идеологемы, метафоры, примеры и аналогии, каламбуры, аллитерации, мифологемы, кочующие образы и многое другое, иногда очень экзотическое, скажем, надписи на стенах публичных туалетов. Единицами анализа могут служить, например, упоминания о российских политических деятелях и политических партиях и движениях (фамилии, имена политиков и названия партий). В такой роли могут выступать также фрагменты текста или его признаки, фотографии, заголовки, названия профессий, события, города, страны, организации, оценки, суждения на определенную тему и т.п.
А теперь внимание. Хотя в природе контент-анализа не заложено никаких ограничений, а потому ничто не препятствует его применению к отдельному тексту, тем не менее существует ряд причин, по которым его используют только в информационных массивах, состоящих из большого количества текстов. Во-первых, статистические закономерности проявляются тем более отчетливо, чем больше объем выборки. Во-вторых, в большинстве случаев контент-анализ используется в компаративных, т.е. историко-сравнительных, целях. Он силен, когда раскрывает не одномоментные срезы, а динамику изменений.
Таким образом, идея контент-анализа предполагает анализ больших информационных массивов; с другой стороны, его относительная дешевизна и технологичность делают такой анализ принципиально возможным. Поэтому не приходится удивляться тому, что в истории контент-анализа имеются такие проекты, как анализ 427 школьных учебников, 481 частной беседы, 4022 рекламных сло-ганов, 8039 (в 1938) и 19 533 (в 1952) редакционных статей или 15 000 персонажей в 1000 часов телевизионного эфирного времени.
Выбор единиц анализа зависит от исследовательской программы, объекта, предмета, цели, задач и гипотез исследования. Если, скажем, нам предстоит выяснить перспективы забастовки рабочих предприятия, то станет очевидной потребность контент-анализа, как минимум, протоколов собраний рабочих, решений соответствующих профсоюзных комитетов, распоряжений руководителей, законов, регулирующих забастовочную борьбу, и т.п. Переход от задачи к единицам анализа аналогичен процедуре теоретической и эмпирической интерпретации понятий и поиска индикаторов.
Выяснение того, что считать, т.е. установление единиц анализа, — главная, решающая, ключевая (или как угодно еще) предпосылка контент-анализа. Допущенные здесь ошибки трещинами разойдутся по всему зданию. Обязательное условие: такие едини-
цы должны быть единообразными, тогда социолог получит четкие статистические показатели. Добиваются подобного единообразия благодаря стандартизации процедуры анализа текста, которая, устраняя субъективные смещения, раскрывает свои возможности только при достаточно больших массивах текстов. Единицы анализа должны легко и по возможности однозначно идентифицироваться в тексте. В идеале их лучше всего свести к самым употребляемым формальным значкам, например запятым или точкам. Тогда подсчет не представит никаких трудностей, а интерпретация результатов будет однозначной и объективной. Только кому нужен такой счет? Социологу он ничего не даст. Его задача — за внешними признаками, например отдельными словами или фразами, распознать таящееся в глубине социальное явление. А это уже качественный подход. Слова, выбранные для счета, должны обладать распознавательной силой, выступать диагностическим инструментом. Иными словами, единицы анализа должны быть интересными для последующей (политологической, культурологической, социологической и т.д.) интерпретации. Тут необходимы оригинальное видение мира, необычный подход.
Количественный подсчет встречаемости слов в тексте — самый простой вариант контент-анализа, который, однако, приводит к интересным результатам. Чаще всего подсчитывают «интересные» или «ключевые» слова и (или) словосочетания, например названия ценностных категорий типа свобода, стабильность, доверие, территориальная целостность; сценариев типа предательство или разочарование; достаточно однозначные обозначения тех или иных общественно значимых явлений, например коррупция, преступность или терроризм, и др.
С научно-познавательной точки зрения социолога интересуют все-таки не отдельные слова, а стоящие за их «спиной» понятийные категории, объединяющие множество разрозненных слов-признаков в тематическое целое. Исследователь, интересующийся тем, какое место в общественном сознании занимает, скажем, проблема преступности, обязан принимать во внимание не только присутствие в анализируемом информационном массиве слова «преступность», но и упоминания заказных и всяких прочих убийств, бандитского беспредела, «крыши», «братков», авторитетов, власти криминала и т.п.
По отношению к единицам анализа, сгруппированным по единому основанию, иначе говоря, составляющим концептуальное целое, специалисты употребляют другой термин — «категории анализа».
Категории анализа — его смысловые единицы, обозначающие эмпирические признаки текстовой информации, которые являются
результатом операционализации опорных теоретических понятии в концепции исследования. К категориям анализа предъявляются определенные требования: они должны выражать теоретические понятия исследования, иметь в соответствии признаки (смысловые единицы) в тексте, обладать возможностями однозначной регистрации признаков, составляющих эти категории. Основная задача сбора информации в ходе анализа — поиск индикатора, указывающего на наличие в документе выделенной проблемы, идеи, темы (например, «справедливое распределение благ»). Категории анализа выражаются определенными признаками (подкатегориями), характеризующими интенсивность, направленность, значимость выраженной в категории идеи, проблемы. К ним могут относиться понятия из любой сферы жизни общества: формы собственности, приватизация, финансовая система, научно-технический прогресс, методы хозяйствования, национализм, авторитаризм, демократия, международное сотрудничество, права человека, гуманизм» активность, деловая предприимчивость, нарушение законности, коррупция и др.
С помощью категорий выделяют концептуальные связи, модели, микропроблемы, тематические поля. В качестве примера можно привести анализ президентских посланий стране, с которыми обратился Б. Клинтон в 1994 и 1995 гг. Эти послания содержат от 7 тыс, до 10 тыс. слов. Были сформированы категории слов, относящихся к экономике, бюджету страны, образованию, преступности, вопросам семьи, международным делам, социальной помощи и др. В категорию «экономика» входили слова: экономика, безработица, инфляция; в категорию «семья» — ребенок, семья, родители, мать, отец. Именно учет частот встречаемости категорий, а не отдельных слов позволяет судить о внимании, уделенном в послании тем или иным вопросам. По изменению относительных частот в посланиях 1994 и 1995 гг. были сделаны выводы об изменении политики государства в различных областях. Эти темы нашли отражение в обоих посланиях, но в одном из них некоторым темам уделялось больше внимания, а в другом меньше. Скажем, в послании 1995 г. больше внимания было уделено вопросам образования, семьи, но меньше внимания — преступности, международным делам, социальной помощи. Отсюда последовал вывод о стратегических приоритетах правительства США.
Другой пример использования контент-анализа — изучение должностных инструкций на предприятии. Исследователь основывался на следующих предпосылках. Содержание инструкции как нормативного документа, координирующего взаимодействие людей, должно обеспечивать четкую регламентацию ролевых позиций. Чем она полнее, тем эффективнее взаимодействие и отношения людей. Ключевым явилось понятие «регламентация». Основные стороны производственной деятельности, подлежащие регламентации, составили ее предметное содержание. Они названы «категориями регламентации»: 1) место должности в структуре организации; 2) основные цели деятельности яиц, занимающих данную должность; 3) квалификационные требования; 4) обязанности работников; 5) подчиненность и права; 6) ответственность.
Благодаря этому появилась возможность расчленить текст на смысловые блоки по названным шести категориям, по каждой из них сделать стандартизованное заключение о наличии или отсутствии в тексте данной категории. Единицей счета выступил фрагмент текста, содержащий упоминание категории и характеристику ее содержания (независимо от полноты и точности этой характеристики). Далее на этом весьма обобщенном уровне анализа текста можно отличить более полную и четкую инструкцию от поверхностной и фрагментарной. Заключение о качестве инструкции здесь не интуитивное (как в случае экспертной оценки), а аргументированное.
Углубление контент-анализа идет за счет конкретизации понятия «категория регламентации», т.е. поиска детальных индикаторов. Таковыми оказались «элементы регламентации», например «ответственность», «подчиненность» и тд. Категории «подчиненность» и «права лиц, занимающих данную должность» раскрывались через суждения — индикаторы типа «как увольняются и назначаются лица, занимающие данную должность», «кому они подчиняются». Дробное членение содержания служебной деятельности и выявило в тексте такие единицы учета (суждения, сочетания слов, предложения), которые давали возможность построить числовые показатели, характеризующие отдельные качества должностных инструкций: подробность, четкость и т.д.
Категории анализа, по мнению С.И. Григорьева и Ю.Е. Растова, должны быть: а) уместными, т.е. соответствовать решению исследовательских задач; б) исчерпывающими, т.е. достаточно полно отражать смысл основных понятий исследования; в) взаимоисключающими (одно и то же содержание не должно входить в различные категории в одинаковом объеме); г) надежными, т.е. такими, которые не вызывали бы разногласий между исследователями по поводу того, что следует относить к той или иной категории в процессе анализа документа.
Однако указанные требования соблюдаются далеко не всегда. Сведение единиц анализа в категории всегда выступает способом их классификации, критерии которой не только чрезвычайно расплывчаты и туманны, но разнятся от одного исследователя к другому. Они опираются на экспертные оценки социолога, зависят от общего уровня его подготовки и знания социальных реалий. Количество самих категорий будет зависеть от степени допускаемого обобщения социального материала. В результате может нарушаться один из принципов научного исследования — возможность воспроизведения результатов опыта разными исследователями, хотя известно: каким бы образом ни были введены категории, воспроизведение проделанных частотных процедур контент-анализа вполне осуществимо. Однако слабым звеном остается выбор единиц анализа и единиц счета. Для того чтобы избежать априорной категоризации, в качестве единиц анализа зарубежные социологи проводят категоризацию с помощью тематических словарей или каталогов. Для подобных целей еще в конце 1960-х гг. предлагалось применять компьютерные программы, в основе которых лежал факторный анализ.
В любом случае в контент-анализе категории выполняют функцию, аналогичную абстрактным объектам, которые в теоретической модели предмета исследования приходится опе рационализировать, разбивая их на совокупность конкретных терминов и признаков. Роль последних в контент-анализе выполняют «низшие чины» — слова.
Хотя о единицах анализа мы рассказали раньше, чем о его категориях, при построении программы контент-анализа социологи часто идут в обратном порядке — от общего к частному, от категорий к единицам. Подобная логика совпадает с методологией разработки программы фундаментального исследования в социологии,
В таком случае методолого-методическая часть программы разбивается на три этапа. Первым шагом будет определение системы категорий анализа, вторым — соответствующая им единица анализа текста, а третьим — установление единиц счета, т.е. количественной меры единиц анализа (их еще называют индикаторами контент-анализа), позволяющей регистрировать частоту (регулярность) появления признака категории анализа в тексте.
Единице счета— количественная характеристика единицы анализа, она фиксирует регулярность, с которой встречается в тексте та или иная смысловая единица.
За единицу счета могут быть приняты: 1) частота появления признака категории анализа; 2) объем внимания, уделяемого категории анализа в содержании текста. Для установления объема внимания могут быть учтены количество печатных знаков, абзацы, площадь текста, выраженная в физических пространственных единицах. Для газетных и других стандартных текстов — ширина колонки и высота высказывания. Для текстов, передаваемых устно, в качестве единицы счета могут использоваться единицы времени.
Единицами счета могут быть число определенных слов или их сочетаний, частота упоминаний слов, количество строк, печатных знаков, страниц, абзацев, авторских листов, площадь текста, выраженная в физических величинах, эфирное время и многое другое. Единицы счета «могут и совпадать и не совпадать с единицами анализа. В первом случае квантификация сводится к определению частот упоминания выделенной смысловой единицы по отношению к другим категориям (как в случае построения индекса самостоятельности инженеров). Во втором случае единицей счета избирают физическую протяженность или площадь текстов, заполненную смысловыми единицами: число строк, абзацев, квадратных миллиметров, знаков, колонок — в печатных текстах; длительность трансляции по радио или телевидению, метраж пленки при магнитофонных записях»23.
Процедура контент-анализа включает в себя применение стандартных правил выделения в изучаемом тексте однотипных единиц анализа (счета, наблюдения) и подсчет частоты встречаемости этих единиц в выборке (количество документов, подвергаемых непосредственному счету) как в абсолютных (число раз), так и в относительных (проценты) величинах. Обязательный момент в такой процедуре — использование математико-статистических методов счета. Ведь основу контент-анализа составляет подсчет встречаемости некоторых компонентов в анализируемом информационном массиве, дополняемый выявлением статистических взаимосвязей и анализом структурных связей между ними, а также снабжением их теми или иными количественными или качественными характеристиками.
Связь между категориями устанавливают методом совместной встречаемости слов различных категорий; для каждого предложения текста выясняют, слова каких категорий в нем встречаются. После этого легко подсчитать обычный коэффициент корреляции, который выражает силу связи между категориями и знак этой связи.
Контент-анализ текстов с использованием категорий иногда называют концептуальным анализом. Сфера его применения довольно широка. С его помощью решают два основных типа задач:
1. Есть два или более текстов, которые необходимо сравнить в отношении нагрузки на определенные категории. Например, задача выяснить, какое внимание уделяют две разные газеты определенным темам. Если эти газеты рассчитаны на одну аудиторию, то существенное различие в частотах позволит судить о различиях в политике, проводимой людьми, стоящими за ними.
2. Задача отслеживания динамики изменения нагрузки на определенные категории. Например, выяснить частоту упоминания темы внешнего долга России в фиксированном наборе центральных газет на протяжении какого-то времени и соотнести ее с колебаниями курса доллара путем простого корреляционного анализа.
Из истории разведки известно, как по изменению в специальной литературе частоты упоминания определенных научных тем и фамилий ученых делались достоверные выводы об успехах, достигнутых в конкретных областях исследований.
Относительные частоты употребления тех или иных единиц анализа позволяют сравнивать два и более текстов, делать важные теоретические обобщения. Например, в тексте выступления депутата Думы можно оценить уровень агрессивности, для чего конструируется категория агрессивно окрашенной лексики. После этого сравнивают текст выступления данного депутата с другими выступлениями и выявляют, кто агрессивнее. Можно сравнивать данный текст не с другими текстами, а с некой нормой, своеобразной нулевой отметкой агрессивности. Мы получим ее, если выясним относительную частоту употребления агрессивно окрашенных слов средним носителем русского языка. Помощь в этом могут оказать частотные словари. Сравнивая относительную частоту употребления агрессивно окрашенной лексики в выступлении депутата с частотой ее употребления средним носителем русского языка, можно сделать вывод о степени агрессивности. Но и это еще не все. Небольшие отклонения частот в большую или меньшую сторону могут быть следствием случайных колебаний.
Квантификаиия данных в контент-анализе проводится самыми разными способами. Помимо анализа частотного распределения к ним относятся анализ различного рода корреляций между переменными, ассоциаций, анализ сопряженности, кластерный анализ, их оценка по тем или иным градуированным качественным шкапам.
После квалификации, т.е. перевода данных в числовую форму, их математическая и, в частности, статистическая обработка может осуществляться многими разными программными средствами, в том числе стандартными статистическими пакетами типа СПСС. При анализе текста и последующем сохранении результатов этого анализа в базах данных могут использоваться специальные программы, предназначенные для целей лингвистических исследований.
Аналитические исследования СМИ предполагают проведение статистического и качественного анализа информации за конкретный период. В частности, составляется полный статистический отчет упоминаний в СМИ интересующей клиента темы с отражением характера упоминаний (положительные, нейтральные или негативные отзывы). На основе этих данных выявляются тенденции, разрабатываются рекомендации по ответной реакции в СМИ и улучшению имиджевой ситуации.
В настоящее время различается четыре методологии контент-анализа: грамматический (лингвистический) — по размеру абзацев,. длине фраз, порядку слов в предложении, метрическому составу и другим формальным признакам языка; семантический (социологический) — по экспертным оценкам содержания; документа-листический (кибернетический) — по параметрам языка, текста и документа как сообщения (дескрипторы и их нагрузка, компактность, информационная плотность, аспектность, проточность, физический и информационный объемы, информационная емкость и информативность); цитационный — анализ библиографических ссылок в научной литературе,
Проведение контент-анализа требует предварительной разработки ряда исследовательских инструментов. Разные специалисты и источники называют неодинаковое число таких документов. По мнению С.И. Григорьева и Ю.Е. Растова, их должно быть пять: 1) классификатор контент-анализа; 2) протокол итогов анализа (он еще называется — бланк контент-анализа); 3) регистрационная карточка (кодировальная матрица); 4) инструкция исследователю, непосредственно занимающемуся регистрацией и кодировкой единиц счета; 5) каталог (список) проанализированных документов. Классификатором контент-анализа авторы называют общую таблицу, в которую сведены все категории (и подкатегории) анализа и единицы анализа. Ее основное предназначение — предельно четко зафиксировать то, в каких единицах выражается каждая категория, используемая в исследовании. Классификатор уподобляется социологической анкете, где категории анализа играют роль вопросов, а единицы анализа — ответов, и считается основным методическим документом контент-анализа, предопределяющим содержание других документов. Протокол (бланк) контент-анализа содержит: во-первых, сведения о документе (его авторе, времени издания, объеме и т.п.); во-вторых, итоги его анализа (количество случаев употребления в нем определенных единиц анализа и следующие отсюда выводы относительно категорий анализа). Протоколы заполняются, как правило, в закодированном виде, но не ради сохранения тайны контент-анализа, а исходя из желания на одном листе бумаги уместить всю информацию о документе (так удобнее сопоставлять друг с другом итоги анализа разных документов). Регистрационная карточка представляет собой кодировальную матрицу, в которой отмечается количество единиц счета, характеризующих единицы анализа. Протокол контент-анализа каждого конкретного документа заполняется на основе подсчета данных всех регистрационных карточек, относящихся к этому документу.
По другим источникам, главными среди методических документов контент-анализа являются кодировочная карточка (кодификатор, код, бланк кодировки) и инструкция кодировщику28.
Первый нормативный документ принимает разные формы, может быть менее и более подробным, но в любом своем виде он представляет собой таблицу.
В более подробном варианте в кодировочной карточке, т.е. специальной таблице, перечислены единицы наблюдения с необходимой степенью дробности, указаны правила их регистрации и оставлено место для записей результатов наблюдений (подсчета
числа упоминаний и других показателей). В ней указываются также общие характеристики анализируемого текста (название источника, дата и номер анализируемого экземпляра, название анализируемой публикации, автор, жанр). В сокращенном варианте, иногда называемом бланком кодировки, количество сообщаемых сведений меньше. Бланк кодировки составляется в соответствии со схемой операциональных понятий, содержит единицы анализа и все элементы описания проблемной ситуации, устанавливает однозначное соответствие между лексикой текста и кодами, над которыми производятся вычислительные операции. - В качестве примера приведем фрагмент бланка, с помощью которого можно осуществить кодирование
Кодирование данных при контент-анализе обычно осуществляется с помощью достаточно простых анкет или компьютерных программ, в которых фиксируется каждое появление в анализируемом тексте искомой единицы. Операции кодирования проводит кодировщик — сотрудник, который работает с текстом, фиксирует частоту употребления единиц счета.
Инструкция кодировщику. Ее содержанием выступает описание правил соотнесения единиц текста с перечнем категорий анализа, а также правил регистрации в Кодировочной карточке. Примером может служить список категорий и элементов регламентации, который называют кодификатором (кодом). Карточка содержит не только список наблюдаемых индикаторов, но и данные в документе, который подвергся кодированию (например, номер или название подразделения, в котором используется данная инструкция, ее объем в страницах, число разделов и т.п.).
Инструкция кодировщику содержит обычно не только правила поиска и регистрации единиц текста, соответствующих делениям кодификатора, но и примеры таких единиц, слова, высказывания, суждения и т.п.
После разработки инструкция проверяется на однозначность ее понимания различными кодировщиками. Цель — выяснить, помогает ли инструкция кодировщикам получать единообразные, стандартные результаты, не зависящие от субъективных особенностей восприятия кодировшиков. Делается это следующим образом: один и тот же текст дается группе кодировщиков, которые работают с едиными кодификаторами (кодировочными карточками) и инструкциями. Затем проверяется совпадение результатов. Случаи расхождения результатов выясняются, обсуждаются их причины. Те указания инструкции, которые не обеспечивают однозначного восприятия кодировщиками, уточняются, после чего проводится новая проверка инструкции до получения необходимого уровня совпадения результатов.
В контент-анализе изучение любого текста проливает свет на его автора и те социальные условия, в которых создавался текст. В результате обнаруживаются авторство анонимной работы и плагиат, определяются жанр и авторский стиль, степень новизны и достоверности и даже характер интеллекта автора. Отсюда принадлежащее А.Г. Здравомыслову полушутливое определение контент-анализа как «научно обоснованного метода чтения между строк». Контент-анализ позволяет социологу изучать более глубокий слой социальных явлений, чем это доступно другим методам. Чтобы обнаружить явление, стоящее за суждениями, в социологии ищут связанные с ним слова, А для понимания их важности сравнивают с другими основополагающими понятиями. События в Косове и вторая чеченская война изменили политический и культурный климат России. Они отразились в публикациях СМИ и электронной базе Интернета. Анализ частоты употребления слов «Косово», «беженцы», «албанцы», «Югославия», «НАТО» и подобных им демонстрирует, насколько было взбудоражено общественное сознание россиян этими событиями. Контент-анализ электронных изданий, проведенный А. Костинским, выявил удивительную вешь: в период косовского кризиса слово «НАТО» встречалось 132 раза на 100 тыс. слов, США — более 80. Для сравнения: даже сумма частот употребления слов «Чечня», «чечен», «чеченцы», «чеченская» ни в первую, ни во вторую чеченскую войну не превышала 16 слов на 100 тыс. Создается впечатление, будто НАТО и США — главная забота россиян. Размытый прежде враждебный образ Запада сосредоточился для нас в этих двух понятиях30.
Если контент-анализ применяется впервые, то допускаются многочисленные ошибки. Среди них специалисты отмечают наиболее типичные просчеты:
Анализ документов опережает разработку исследовательской программы.
Анализируются документы, не связанные с гипотезами исследования (имеющие сходство с темой исследования лишь по названию).
Не проверена подлинность документа.
Не уточнено его авторство.
Неполно учтено его предназначение.
Категории анализа не определены до такой степени, которая позволяет четко различать смысловые единицы текста документа.
Категории анализа не субординарны и не приведены в соответствие с теми дефинициями и операционализирующими их терминами, которые зафиксированы в программе исследования.
Категории анализа несопоставимы со смыслом и языком текста анализируемого документа.
Единицы анализа характеризуют категории анализа лишь внешне, а не по существу, поэтому единицы анализа не позволяют идентифицировать содержание документа в полном соответствии с категориями анализа.
Анализ документа ведется без предварительной подготовки всего комплекса методических инструментов.
Классификатор имеет недочеты, составлен с нарушением правил логики.
Регистраторы (кодировщики) не получили должной методической подготовки.
Инструкция по регистрации и кодировке недостаточно полная, составлена исследователем, который сам предварительно не апробировал инструментарий.
Кодировка не соответствует программе математической обработки данных исследования.
Результаты контент-анализа не перепроверены информацией, собранной иными методами.
Контент-анализ прессы требует сравнительно больших затрат времени и средств, поэтому может использоваться и метод экспресс-анализа. В его основе лежит количественный подсчет содержательных элементов текста (факт, конфликт, аргумент, тема, обобщение), а также учет качественных характеристик публикаций (соответствие цели, информативность, актуальность, доказательность, конструктивность). Как и при контент-анализе, эти характеристики текста кодируются, обозначаются определенной цифрой, и затем при чтении текста исследователь их фиксирует".
Переписи. К отечественным всеобщим переписям современного типа принято относить Всесоюзные переписи 1926, 1937, 1939, 1959, 1979 и 1989 гг., а также Первую всеобщую перепись населения Российской империи 1897 г. Иногда в этом ряду упоминается перепись 1920 г., но она не полностью охватила территорию РСФСР в тогдашних ее границах из-за продолжавшейся гражданской войны.
Материалы переписей используются на всех этапах этносоциологи-ческого исследования: в процессе предварительного осмысления проблемы, планирования выборки, интерпретации данных.
От переписи к переписи содержание многих признаков-вопросов, включавшихся в бланки, менялось.
Текущий учет населенияК материалам текущего учета населения, содержащим личностные характеристики, относятся следующие:
1) архивы отделов ЗАГС, в которых хранятся акты о рождении и смерти, о заключении и расторжении брака;
2) картотеки паспортных столов милиции: форма, заполняемая при получении паспорта, листки прибытия и убытия, а также статистические талоны к ним, фиксирующие факт прописки и выписки;
3) домовые и нехозяйственные книги, заполняемые на проживающих в каждом жилом помещении.
Значительный интерес для изучения представляют данные похозяйственного учетав сельской местности, а также домовых книгв городах.
Основными документами нехозяйственного учета являются: форма № 1 — похозяйственная книга, форма № 2 — список лиц, временно проживающих на территории сельсовета, форма № 3 — алфавитная книга хозяйств. Похозяйственные книги с момента своего введения в 1934 г. испытывали лишь незначительные изменения в составе учитываемых признаков. В отличие от уже рассмотренных документов текущего учета населения, здесь каждая форма заполняется не на отдельного человека, а на семью — совокупность лиц, ведущих совместное хозяйство и находящихся в родственных отношениях. Помимо личных данных, в нехозяйственных книгах содержится экономическая характеристика хозяйства.
Менее надежны экономические характеристики хозяйства, так как они связаны с налогообложением и в ряде случаев могут искажаться.
Бланки домовых книг также заполняются на одну семью, при условии проживания ее в одном помещении, и ведутся паспортистками ЖЭК и ЖСК. Каждый житель характеризуется примерно по тем же параметрам, что и в нехозяйственных книгах; кроме того, фиксируются основные характеристики жилой площади. Материалы домовых книг могут стать важным источником исследования городского населения, хотя до сих пор они использовались в основном как вспомогательный источник при организации выборки. Также не разрабатывались данные картотек временного учета как в сельской, так и в городской местности.
Изменившаяся с начала 90-х годов политическая ситуация в стране значительно расширила круг источников, доступных исследователю; в ряде случаев появились новые источники.