Метод анализа продуктов деятельности
Одним из самых распространенных продуктов человеческой деятельности является текст, который, в частности, можно понимать как упорядоченную систему знаков — кем-то, для кого-то, с какой-то целью, по каким-то правилам созданную.
Варианты текстов являются документами, которые в настоящее время понимаются как любая фиксированная информация — печатная, рукописная, записанная с помощью любого технического средства. В науках, изучающих документы, обычно приняты следующие методы их анализа*:
* По сб : Лекции по методике конкретных социальных исследований/ Подред Г М. Андреевой —МГУ 1972.
Остановимся подробнее на варианте формализованного метода анализа текстов (документов как видов текстов) — ко нтент-анализе.
Исторически этот метод, как и сам термин, возник в практике американских журналистов, где он был сначала применен к исследованию специфических материалов — материалов прессы. Позднее метод был исследован американским социологом Г. Лассуэлом и применен для анализа пропаганды. Лассуэл подчеркнул формализованный характер контент-анализа, определяя его как метод «количественного анализа содержания» с использованием математических средств, применяемый для исследования содержания материалов пропаганды, повторяемости их отдельных частей и т. п.
Назначение метода: конечно, и в данном случае заключается в том, чтобы исследователь был в состоянии осмыслить текст,передаваемый в процессе коммуникации... здесь предлагаются особые технические средства, особые приемы, которые как бы расставляют для исследователя некоторую контрольную сетку, регламентирующую возможные чрезмерные отклонения на тропах интуиции.Суть метода контент-анализа заключается в выделении в тексте ключевых понятий (или иных смысловых единиц) с последующим подсчетом частоты употребления этих единиц, соотношения различных элементов текста друг с другом, а также с общим объемом информации.
Техника контент-анализа сводится к нескольким последовательным действиям: 1) выделение единиц анализа, 2) отыскание их индикаторов в тексте, 3) статистическая обработка.
1. Выделение единиц анализа: самым заманчивым и простым было бы выделение в качестве единицы контент-анализа определенного термина, слова, выражающего понятие, меру употребления которого в тексте надо установить. Но (!!!) это и будет худший вариант анализа, не столько формализованный, сколько просто формальный. При таком подходе неизбежна потеря значительной доли информации и поэтому возможно не меньшее, а большее искажение содержания документа. Выделенная единица анализа должна быть обязательно (!) смысловой единицей, т. е. необходимо установить, в каких проявлениях текста присутствует определенная смысловая нагрузка. Она не обязательно реализуется в одном слове (термине), она может проявляться в некоторых устойчивых сочетаниях слов, может вообще не присутствовать в явном терминологическом облачении и т. д.
Поэтому в принципе при поиске единицы контент-ана-лиза можно получить два возможных варианта решения проблемы: — считать за единицу анализа символ. В конечном счете символ выражается либо в отдельном слове, либо в сочетании слов; — смысловой единицей контент-анализа считать какой-либо объект, о котором имеются высказывания в тексте, или какие-то черты, свойства объекта.
При некоторых обстоятельствах этот объект может быть описан и при помощи одного слова, в других ситуациях — при помощи сочетания нескольких слов, т. е. посредством определенных суждений. Выделение единицы анализа поэтому является весьма непростым делом. Чисто технически поиск единицы контент-анализа требует осуществления следующего действия: отыскания в тексте индикатора выбранных единиц.
2. Отыскание его в тексте требует от исследователя необходимости ограничить на этом этапе свою задачу количественным описанием существующего, а не идеального текста... правильно знать границы возможного применения контент-анализа и просто не допускать его абсолютизации, не ожидать от него результатов, которые он не может дать... нужно научиться действовать конвенционально и иметь отвагу руководствоваться своим мнением. После выполнения этой операции исследователь приступает к следующему этапу.
3. Статистическая обработка. Она заключается в подсчете частоты употребления понятия (при условии учета выделенных индикаторов) или в установлении пропорций между различными группами индикаторов. Характер и направление этих подсчетов определяются целями и задачами исследования.
Одна из важных задач контент-анализа — установление идентичности содержания, вкладываемого в один и тот же термин разными авторами. Существуют специальные способы определения точности употребления понятий в тексте, а также «разложения понятий по степеням».
При анализе содержания мы учитываем в тексте признаки определенных категорий, раскрывающих тему*. Все множество признаков — чаще всего лексических единиц — характеризуется их качественно своеобразным
* См кн . Оценка содержательного разнообразия в школьных сочи-нениях/Сост Б. А. Еремеев — СПб., 1992.
составом — словарем — и устойчивостью. Чем больше состав, тем с большей дегализированностью раскрывается тема и/или подтема. И тем более конкретно выраженное в тексте представление: конкретное есть синтез многих определений (К. Маркс).
Чем больше устойчивость отдельных признаков — лексических единиц, тем более определенно раскрывается тема и/или ее составляющие. Это говорит о большей очевидности для автора соответствующих фрагментов действительности и принятых способов их обозначения в данной ситуации порождения речи. И чем больше частотность лексических единиц, тем надежнее высказывание как акт коммуникации.
Содержательное разнообразие текста тем больше, чем длиннее словарь и чем меньше его устойчивость. С точки зрения психологии, содержательное разнообразие свидетельствует о большей сложности факта сознания, воплощенного в тексте.
Для оценки разнообразия нужен показатель, который учитывал бы соотношение единиц содержания в данном их множестве. Это значит, что нужно учитывать и количество различных единиц, и их частотность, и их общую «массу». Для этого подходит оценка энтропии (Н) по К. Шеннону, в битах*:
Здесь р^ — частотность, или относительная частота данной (i) единицы счета по отношению к их сумме:
L — количество различных единиц (длина словаря). Чем больше различных единиц счета — слов и выражений, раскрывающих тему, — тем больше энтропия Н. Чем реже используется каждая единица (в пределе — одно-
* Бит — единица неопределенности, соответствующая утверждению о том, что произошло одно из двух равновероятных событии В нашем случае — при двух различных единицах счета, каждая из которых встречается столько же раз, сколько и другая
кратно), тем больше энтропия Н. И наоборот: чем меньше различных единиц счета и чем чаще они повторяются, тем меньше величина энтропии. Таким образом, оценка неопределенности по К. Шеннону действительно характеризует соотношение единиц содержания и тем самым — содержательное разнообразие текста, выражающее предметное разнообразие авторских представлений.