Информационный анализ текстов, потенциально содержащих искомые индикатумы

Современная наука располагает достаточно большим числом разновидностей анализа документальных источников: применяемый в социологии и социальной психологии контент-анализ, в архивове­дении и информатике – методы аналитической обработки перво­источников для создания массивов вторичных элементов (обзоров, рефератов, аннотаций и пр.), виды индексирования (кодирования) содержащейся в источниках фактической информации; методы це­левого преобразования текстов первоисточников, содержание кото­рых в зависимости от поисковой задачи расчленяется на блоки ин­формации, пригодной для хранения в памяти ЭВМ; банки данных, используемые в ходе вторичной обработки банка уже использован­ной информации для построения различных информационных сис­тем. Общая и наиболее существенная характеристика, объединяю­щая все эти методы – минимизация элемента субъективности при изучении текстовых материалов и выведение анализа текстов на воз­можно более объективную научную основу. Отсюда – тенденция к разработке обоснования критериев как для отбора источников, под­лежащих информационному анализу, так и для формализованного представления содержащейся в них информации – непременного условия последующей статистической обработки.

Информационный анализ разнопредметных и разнотипных текстов, описывающих самые различные подсистемы челове­ческой деятельности, позволяет:

1) систематически обрабатывать и сопоставлять имеющи­еся в литературе представления об изучаемом объекте, о соот­ветствующих этим представлениям подходах к конструированию систем социальных показателей. Этот вид информационного анали­за ориентирован на последовательное изучение уже существую­щих концепций гносеологического объекта и связанных с ними категорий. Он предполагает систематическое обследование текстов, содержащих названные концепции, в целях сопоставления и система­тизации имеющихся в них сведений;

2) сводить разнопредметные знания об этом социальном объек­те в систему под избранным углом зрения. Этот менее распростра­ненный вид, так называемый информационно-целевой анализ, ори­ентированный непосредственно на гносеологический объект, на гипотезу относительно сущности исследуемого объекта, воспроиз­ведение целостности которого на языке показателей является целью проводимого анализа. По характеру проведения он похож на экспе­римент, где в качестве объекта исследования выступает совокуп­ность текстов, причем каждый конкретный текст признается инфор­мативным для исследователя лишь в той мере, в какой в его содержа­нии обнаруживаются сведения, соответствующие целям предпри­нимаемого эксперимента.

При информационно-целевом анализе тексту приписывается некоторая мера информативности, которая поддается измерению и может быть как первичной – характеризующей потенциальную способность конкретного текста донести до читающего замысел, основное коммуникативное намерение его автора, так и вторичной – характеризующей потенциальную способность конкретного тек­ста служить источником тех сведений, которые ищет в нем читатель. При этом вторичная информативность текста часто не только не совпадает с первичной, но в абстракции от нее приводит к искажению смысловой информации, заложенной в тексте.

Исследовательская ситуация складывается таким образом, что на первый план выходит вторичная информативность текста Необ­ходимость отвлечения от конкретных коммуникативных целей авто­ра текста (за исключением тех случаев, когда эти цели оказываются в русле гипотезы эксперимента) диктуется здесь самой задачей изу­чения информационного массива, направленной на то, чтобы выя­вить и систематизировать элементы, связанные с исследуемым объек­том, а затем установить нормативные и реальные связи, в которые они вступают в рамках той или иной сферы функционирования объекта.

Будучи методом синтетическим, информационно-целевой анализ текстов соединяет в себе моменты, свойственные различ­ным методам информационного анализа текстов: дедуктивному (контент-анализ), где исследователь подходит к тексту, располагая апри­орно сконструированными им аналитическими категориями, и ин­дуктивному, где исследователь отталкивается от текста, фиксируя в нем искомые термины и терминологические конструкции, отвеча­ющие задачам построения потенциальных показателей исследуемо­го объекта. Присутствует в нем и информационный подход к систе­матизации терминологии, в рамках которого извлеченные из тек­стов элементы берутся не сами по себе, а ставятся в жесткие коорди­наты семантических отношений, основанных на предварительном анализе системы согласованных и взаимосвязанных дефиниций.

Построение системы социальных показателей на основе способа информационно-целевого анализа текстов предпола­гает использование двух групп методик, организованных на основе одного общего принципа: ориентация на выявление, с одной стороны, нормативных и с другой – реальных струк­тур исследуемого социального объекта.

Первая группа методик включает информационно-целевой ана­лиз текстов, описывающих те или иные сферы деятельности, и пред­назначается для извлечения из текстов данных, необходимых для по­строения нормативных моделей деятельности и взаимодействия социальных субъектов.

Вторая группа методик – опросы экспертов и населения, вклю­ченное наблюдение и пр. – предназначается для выявления реаль­ных структур деятельности и взаимодействия социальных объектов. При этом в основу методик второй группы положена та же исследо­вательская схема, что и в основу предварительного информацион­но-целевого анализа текстовых массивов.

Для построения общей исследовательской схемы требуется дать обоснованные ответы на следующие вопросы:

1. Какая из компонент (а следовательно, из соответствую­щих ей категорий анализа) исследуемого объекта принимает­ся за исходную при выработке операционального определе­ния те что именно дополнить «ключом» при анализе текстов?

2. Какие элементы содержания текстов, по каким парамет­рам и почему должны быть приняты в расчет при информаци­онно-целевом анализе текстов?

3. Какие методы можно использовать для трансформации выяв­ленных элементов содержания текстов в параметры нормативных моделей деятельности и взаимодействия социальных субъектов спо­собные служить основой для построения системы нормативных показателей.

4. На основе какой информации такие показатели смогут получить не только качественное, но и количественное выражение?

Иначе говоря, прежде чем приступить к анализу текстов с целью выявления элементов, составляющих основу систем показателей социальных явлений, необходимо провести осно­вательную теоретико-методологическую работу по концепту­ализации объекта исследования в таком плане, чтобы соот­ветствующие элементы текста «трансформировались» в пока­затели не случайно, а в соответствии с определенными крите­риями, заложенными в программу исследования.

Первый этап собственно исследования начинают с пило­тажного анализа текстов, что позволит уточнить список ос­новополагающих категорий анализа, более четко определить харак­тер соответствующих этим критериям эмпирических референтов, после чего составить вопросники для сбора информации, сопоста­вимой с результатами последующего информационно-целевого анализа текстов.

Далее следует опрос и включенное наблюдение исследователя как способы формирования массива первичной информации, при­годной для сопоставления со вторичной информацией, полученной из анализа литературы. Используют два вопросника: один адресо­ван рядовым гражданам, представителям различных социальных групп населения, второй – должностным лицам или специалистам. Каждый вопросник выполняется в двух вариантах: один выявляет настоящее положение вещей и планируемое будущее, второй – сте­пень реализации намеченных планов спустя определенный период вре­мени.

Второй этап составляет собственно анализ текстов. Во избежа­ние ошибок и трудностей, связанных с анализом разнообразных ис­точников, целесообразно вначале отработать методику выявления элементов текста в интересующем исследователя плане. Для этой цели лучше всего обследовать материалы нормативного характера, с четкими формулировками категорий (словари, справочники и т.п.). Приемы, отработанные на подобных четких и компактных текстах, нетрудно перевести на тексты, описывающие те или иные сферы интересующего нас объекта, а затем и на более расплывчатые и потому более трудные для аналитических операций тексты из лите­ратуры по исследуемой проблематике. Создание же перечней эле­ментов содержания текстов, отвечающих избранным категориям анализа, позволяет путем рассмотрения их семантических связей в текстах различного характера перейти к построению «сеток отноше­ний» между элементами, включенными в перечни, – необходимой предпосылки для систематизации совокупностей показателей, све­дения их в системы. Возникает возможность использовать эти систе­мы для построения не только исходных, но и прогностических моде­лей (поисковых и нормативных). Так, при наличии развернутых «се­ток отношений» можно прогнозировать, в каких именно конкрет­ных условиях оказываются необходимыми определенные парамет­ры (признаки) социальных субъектов деятельности или, напротив, какие условия необходимы для заранее известных субъектов дея­тельности, или на какие результаты допустимо рассчитывать при зара­нее известных субъектах и условиях деятельности, или какие значения могут иметь эти результаты при прочих известных параметрах, и т.д.

Такая методика информационно-целевого анализа текстов тре­бует усилий сравнительно большого рабочего коллектива в течение сравнительно долгого периода. Это можно минимизировать плано­мерным переходом от одной группы однородных текстов к другой, более сложной для обработки. Другой путь снижения трудоемкости и повышения эффективности этой методики – предварительное моделирование явлений и процессов, которые излагаются в текстах, подлежащих анализу. По сути дела, предлагаемая методика сама от­крывает один из путей к моделированию исследуемого объекта.

Построение исходной модели любым из предложенных спосо­бов преследует одну цель: формализовать объект прогнозирования, представить его в виде системы показателей, по каждому из которых можно будет построить динамические ряды (переменных, характе­ристик, конкретных данных) на всем протяжении периода основания и упреждения прогноза. Система показателей дает возможность осуществить качественный анализ того или иного динамического ряда, – построить матрицу или математическое уравнение, а главное, позволяет осуществить полноценный аналитический и диагностический подход к объекту исследования, без чего невозможен сам прогноз – поисковая или нормативная разработка исходных данных.

Наши рекомендации