Количественные методы анализа
Количественные методы анализа используются достаточно редко. (Единственная, пожалуй, область, где они широко применяются и дают интересные результаты – стиховедение). Это вполне объяснимо. Раскрыть тайну пушкинской простоты, магию прозы А. Платонова или Гоголя вряд ли удастся, какие бы точные подсчеты мы ни производили.
Но, одновременно с этим, без элементарной статистики даже не возник бы вопрос, например, об одной из странных особенностей «Вечеров на хуторе близ Диканьки». Частотный словарь причинных союзов в «Вечерах…» показывает, что у Гоголя причинных союзов в процентном отношении столько же, сколько и в литературном фоне этого десятилетия. И это может стать основой для предположения, что, судя по той роли, которую играли причинно-следственные отношения в мироощущении Гоголя, он не отличался от писателей-современников. Если же посмотреть на то, как причинные союзы распределяются по отдельным повестям, можно увидеть, что в «Сорочинской ярмарке» и «Предисловии» ко второй части нет ни одного причинного союза. А это уже позволяет поставить достаточно серьезный вопрос: не указывает ли отсутствие причинных союзов в этих текстах на то, что в них торжествует случайность (как абсолютное отсутствие причинности) и, значит, они играют особую роль в структуре цикла?
Поэтому будем считать, что количественные методы могут быть продуктивны при двух условиях: во-первых, с их помощью нужно решать задачи, которые иначе не решаются, и, во-вторых, их можно использовать лишь как относительно объективную базу для качественного анализа. Количественный показатель – не цель, но информация к размышлению.
Вариантам количественного анализа несть числа. В зависимости от поставленной задачи можно подсчитывать звуки, повторы, рифмы, количество персонажей, частотность имен и пр. и пр. Мы попробуем разобраться только с одним вариантом количественного анализа – частотными словарями: любой вербальный текст состоит из слов, а зависимость частотности слова от авторского мироощущения уже давно замечена и писателями, и литературоведами. Таким образом, частотный словарь – универсальный вариант количественного анализа, с помощью которого можно работать и с прозой, и с поэзией.
Принципы составления частотных словарей
Словарь слов или словарь значений?
Казалось бы, нет ничего сложного в том, чтобы составить частотный словарь: нужно расписать текст по словам, посчитать, сколько раз употребляется каждое слово, и в результате получить словник с пометой частоты употребления каждого слова. Текстом в данном случае можно считать (в зависимости от поставленной задачи) одно[180] или несколько[181] произведений, творчество одного или группы писателей (так называемые «словари фона»). На самом деле все обстоит несколько сложнее.
Предположим, мы составляем частотный словарь русской книжной поэзии начала XVII века и видим, что в эпистолах поэтов так называемой «приказной школы» (стихи, написанные теми, кто служил в царских приказах, по-нынешнему, – министерствах) одним из частотных было слово «философия». Разумеется, это становится основанием для вывода о том, что первые русские поэты были очень образованными людьми. Больше того, слово «философия» встречается только в начале стиха. Это, казалось бы, не только подтверждает, но и усиливает вывод об учености приказных дьяков: начало стиха – сильная позиция, и потому слово несет здесь особую нагрузку. Таков безусловный вывод, к которому придет исследователь, интерпретирующий словарь, построенный по принципу словника. Но в художественном произведении контекстное значение слова может быть, по крайней мере не менее важным, чем словарное. Когда акад. А.М. Панченко обратил внимание на то, что слово «философия» стоит всегда только в начале стиха, он пришел к заключению, что оно не имеет отношения ни к «науке о наиболее общих законах развития природы, общества и мышления»[182], ни к образованности поэтов. Дело в том, что стихотворения эти всегда строились только как акростих: из начальных букв каждого стиха, прочитанных по вертикали, складывалось имя того, кому стихотворение было адресовано. Поэтому, в частности, величина стихотворения зависела от титулов и имени адресата (чем длиннее титул и имя, тем длиннее стихотворение). А когда в имя адресата начиналось с буквы «фита», поэт был обречен: на эту букву в словаре XVII в. было лишь два слова – «философия» и «фарисей». Начать имя того, кому адресовалось стихотворение, со слова «фарисей» было совершенно невозможно, и потому неизбежна была «философия». Таким образом, значение слова «философия» в этом контексте оказывается как бы «нулевым». Но слово не может ничего не значить. Поэтому точнее сказать так: контекстное значение в данном случае – это какое-то особое значение, очень опосредованно соотносимое со словарным. В зависимости от того, какое значение слова зарегистрирует словарь (богатое словарное или «нулевое» контекстное), мы получим убедительные, но принципиально разные представления об одном и том же явлении.
Но и в том случае, когда словарные и контекстные значения совпадают, слово в художественном произведении может нести в себе дополнительные значения, не менее важные, чем основные словарные. В этих (гораздо более частых случаях) мы сталкиваемся с той же проблемой.
Предположим, что мы составляем частотный словарь романа А. Платонова «Счастливая Москва». С одной стороны, мы убеждаемся в том, что в романе, как и следовало ожидать от этого «самого страшного», по словам Ю. Нагибина, романа, относительно мало (всего около 50) цветообозначений. С другой стороны, группа слов со значением «цвет» дает совершенно неожиданную картину: широкий цветовой диапазон. В романе есть не только основные холодные и теплые, но и оттеночные цвета: желтый, фиолетовый, красный, розовый, белый, синий, серый, черный, зеленый, рыжеватый, смуглый, темный, бледный. И цветовая палитра оказывается отнюдь не мрачной, разноцветье стабильно и уравновешено: здесь нет доминирующего цвета, каждое цветообозначение употреблено соразмерное количество раз (от 3 до 5). Из этого естественно сделать вывод: мир мрачного платоновского романа, хотя и не насыщен цветом, но многоцветен.
Однако в контексте романа цвет – не только внешний признак предмета. Восстановленные по контексту авторские значения позволяют говорить о том, что каждое цветообозначение для Платонова – это еще и глубинная характеристика мира:
– розовый и чайный (цвет чайной розы) – это юность и цветение;
– синий – цвет покоя и мощи цивилизации;
– фиолетовый – таинственный цвет пространства;
– зеленый – цвет жизни;
– красный – знак интенсивности (физическая мощь, утробное веселье и горение). Он может быть внутренне противоречив (например, соединять в себе здоровье и болезнь: губы, красные от здоровья и температуры). Он может быть даже лжив, выдавая кажимость за сущность (красные от здоровья губы человека, в теле которого текла истощенная желтая кровь);
– желтый – знак нездоровья, конца, увядания; оппозиция цветению и сиянию;
– серый и белый – цвета обыденности и «антижизни».
Словарь этих контекстных значений позволяет говорить о том, что совокупность цветов и соразмерность словоупотреблений (тех дополнительных значений, которые они несут в себе кроме цветообозначения) показывают: А. Платонов ощущал равно значимыми и определяющими цветение и увядание жизни, горение, напор и покой, обыденность и тайну, жизнь и «антижизнь».
Теперь попробуем сопоставить выводы, которые можно сделать на основании словарей, фиксирующих словарные и контекстные значения.
Словарные значения | Контекстные значения |
Частотность слова «философия» позволяет говорить о том, что первые русские поэты были очень образованными людьми. | Частотность слова «философия» говорит о том, что значение слова в русской поэзии начала XVII в. во многом определялось законами формы стихотворной речи. |
Мир мрачного платоновского романа, хотя и не насыщен цветом, но многоцветен. | Совокупность и соразмерность цветов не только окрашивает платоновскую действительность, но и говорит о том, что писатель ощущал равно значимыми и определяющими цветение и увядание жизни, горение, напор и покой, обыденность и тайну, жизнь и «антижизнь». |
Итак, составляя частотный словарь, учитывающий словарные или контекстные значения слов, мы в результате получим разные основания для интерпретации.
То же самое относится и к словарю структурных слов. Некоторые частотные словари художественных текстов учитывают служебные слова. Поэтому, скажем, указанная частотность предлога «в» в данном тексте позволяет, сопоставив ее с частотностью других пространственных предлогов, строить предположения о том, какие именно пространственные отношения доминируют здесь: местоположение «в», движение «из», «к», «от», «сквозь» или «через» и так далее. Но это будут очень приблизительные выводы. Дело в том, что предлог «в» имеет более 40 словарных значений. Он может означать местоположение объекта, направление его движения, адресата действия, целое, в состав которого входит некий элемент, деятельность, обстоятельства, в рамках которых нечто находится, происходит, сферу деятельности, в которую кто-то вовлекается, и так далее[183]. Поэтому словарь структурных слов требует уточнения: в каком именно значении в данном контексте употреблено это слово.
Кроме того, структурное слово (тот же предлог «в») может быть употреблено в авторском значении, не зафиксированном словарями. В «Стихах о Прекрасной Даме» А. Блока предлог «в» может нести одновременно и пространственное, и временное, а иногда еще и причинное значение. Открыть в непогодную полночь окно (когда? куда?); Я вышел в ночь (вышел ночью / вышел в пространство ночи); Там в полусумраке собора, / В лампадном свете образа (в освещенном пространстве / при свете лампад, освещенные лампадами); …Вырастает в их<ангелов>лучах (освещенный лучами / в освещенном пространстве / под действием лучей). Такую нерасчленимость значений можно интерпретировать как маркированность важной особенности авторского мироощущения: единство пространства / времени и даже пространства / времени / причины, интуитивное воплощение ощущения органического единства, «внеаналитичности» мира. Кстати, позже у А. Блока значения предлогов начинают все больше дифференцироваться, и это может быть одним из указаний на глубинную эволюцию поэта, переход от «синкретизма» к «аналитичности».
И, наконец, следует иметь в виду, что одно общее значение может быть выражено не только разными формами структурных слов (например, причинные отношения могут быть выражены союзами так как, потому что, потому, потому, как и пр.), но и разными служебными словами. Так, целевая установка может оформляться и предлогами, и союзами («чтоб», «на»,«за», «для»).
Следовательно, составляя частотный словарь структурных слов, следует ответить на вопрос, какие задачи (по аналогии с частотным словарем полнозначных слов) можно решать с помощью словника, а какие – с помощью словаря контекстных значений. Но прежде чем ставить или решать какие-то задачи, следует знать, с какими проблемами неизбежно сталкивается тот, кто составляет частотный словарь и / или работает с ним.
Словарная единица. Показатель частотности
Каждый, кто составляет частотный словарь, должен решить, из каких единиц он будет состоять. Дело в том, что художественный текст неизбежно содержит в себе тропы, фразеологизмы и другие нерасчленимые сочетания, структура которых есть структура концепта, стоящего за этим нерасчленимым высказыванием. Метафора «В крови горит огонь желанья» – это микрообраз, аналог молекулы, расщепив которую, мы потеряем свойства данного вещества (в нашем случае – образа). Если продолжить аналогию, то каждое слово, входящее в эту метафору, – подобие атома. У него свои свойства, свое сложное строение, но из одних и тех же атомов могут состоять молекулы разных веществ. Поэтому, разрушив структуру тропа, мы тем самым обречем себя на исследование вместо авторского микрообраза чего-то совсем другого, потому что автор не употреблял эти слова как самостоятельные, «независимые» лексемы. Итак, первая проблема – разбивать или не разбивать структуру микрообразов? В зависимости от ее решения единицей тезауруса станут либо только лексемы, либо то, что исследователь считает в каждом данном случае единицей художественной речи: отдельное слово, троп, фразеологизм и т.п. Без «и т.п.» в данном случае обойтись нельзя, потому что вслед за тропами и фразеологизмами станет вопрос о пословицах, поговорках, загадках, и проблема словарной единицы будет становиться все более сложной. Кроме этого, придется решать, считать ли единицей не лексему, а сегмент текста, отграниченный от других пробелом и закрепленный на письме отдельной буквой (Х., Б., N.), знаком (***) и пр. С одной стороны, это не лексемы, а само именование «словарь» предполагает нечто, состоящее исключительно из слов. С другой стороны, приведенные знаки играют роль слова и имеют право быть включенными в словарь. Конечно, ими можно пренебречь: не так уж они частотны, и вряд ли их отсутствие на что-то серьезно повлияет. Но прежде чем остановиться на этом предположении, следует ответить на вопрос о том, какую роль играет частотность. Для этого нужны какие-то основополагающие изначальные тезисы.
Будем исходить, во-первых, из того, что «значимость того или иного элемента текста… в модели мира автора этого текста находится в положительной корреляции с частотой этого элемента в тексте»[184]. Это значит, что словарь адекватно отражает авторскую картину мира, в которой частотность слова указывает на его место в иерархии авторских ценностей. А так как, во-вторых, «мотив и слово развиваются параллельно: любимые слова поэта порождают излюбленные мотивы и обратно»[185], то чем частотнее слово, тем важнее для автора стоящее за ним понятие («мотив»). Поэтому, располагаясь по частотности (от высокой к низкой), слова располагаются тем самым по степени важности: наиболее значимы слова с высокой частотностью, начинающие список, наименее значимы те, что завершат его и отмечены пометой частотности «1», то есть употребляются только однажды.
В целом такой принцип интерпретации частотного словаря как структуры, а не набора слов, не вызывает сомнений, но требует уточнений. Дело в том, что низкочастотные слова отнюдь не всегда малозначимы по сравнению с высокочастотными. Можно говорить, по крайней мере, о двух случаях (мы из подробно рассматривали в разделе «Ключевые понятия»), когда слово, употребленное даже 1 – 2 раза, по своей значимости не уступает высокочастотному. Во-первых, низкочастотным словом, о чем уже шла речь, оказывается заглавие, не имеющее лексических опор в тексте. Слово «хамелеон» употребляется в чеховском рассказе только однажды, но это ключевое понятие, которое определяет предпонимание всего текста. В рассказе «Смерть чиновника» слово «смерть» употреблено лишь однажды. А вся лексико-тематическая группа со значением «смерть» состоит из двух слов: «смерть» и «помер». Но оба слова стоят в самых сильных местах текста: это первое и последнее слова рассказа. Весь рассказ – в рамке из этих двух слов, весь сюжет – это движение от общего понятия «смерть» к просторечно-бытовому итогу «помер». В этих и подобных случаях следует, вероятно, говорить о том, что в частотном словаре могут (или должны) быть пометы, маркирующие особую значимость низкочастотного слова.
Второй случай принципиальной значимости низкочастотного слова – тропеизированный, в частности, метафоризированный текст, в котором развертывающиеся метафорические ряды перебиваются или завершаются словом-понятием, «вбирающим» в себя весь пучок метафорических значений. Таким образом, относительно нейтральной «нормой» остается лексика, расположенная между высоко- и низкочастотными словами.
Проблемы, которые возникают при составлении словаря структурных слов, отчасти те же, что и при составлении словаря полнозначных слов. Исходное положение – «чем более частотно, тем более значимо» – по отношению к структурным словам так же справедливо, как и по отношению к полнозначным. Гораздо сложнее ответить на вопрос о том, что должно быть частотно: само слово или значение, которое оно несет в себе в данном контексте? Будет ли это словарь структурных слов или словарь значений, которые могут быть выражены разными служебными словами?