Интерпретация частотных словарей

Какие задачи можно решать с помощью

«словаря слов»?

Начнем с самого простого: частотный словарь можно использовать как справочник, позволяющий не тратить время на подготовительную работу при интерпретации художественного текста. До того, как появился частотный словарь поэзии А. Ахматовой, нужно было перечитать все ее стихи, написанные до 1940 года, чтобы узнать, было в ее стихах слово «чертополох», или оно впервые появилось в цикле «В сороковом году», и в зависимости от этого так или иначе толковать стихотворение, открывающее цикл (см. об этом в разделе «Текстообразующая роль цитаты»). Безусловно, работа очень трудоемкая. Словарь позволяет не тратить время на длительные поиски.

Кроме того, и сам словник может стать источником постановки задач. В поэме А. Блока «Двенадцать» частотность пространственных предлогов показывает стабильное и устойчивое пространство, где сбалансированы статика и динамика, доминирует местонахождение «внутри», «на поверхности» и движение «внутрь», «на поверхность». Четко маркированы «верх» (над 1), «низ» (под 2), целенаправленное движение (к 3, от 1) и границы (за 2, через 1). Это позволяет структурировать устойчивое пространство с маркированными границами и ориентирами (что само по себе требует объяснения, потому что слишком неожиданно для взвихренного мира поэмы). Но при этом словарь не показал одного важного пространственного параметра. Из оппозиционной пары «позади ↔ впереди» предлогами представлено только «позади», причем достаточно частотно для этого текста (за 3), но нет предлогов, означающих нечто, расположенное впереди или движущееся вперед. Мы вправе поставить достаточно серьезный вопрос, связанный с пониманием и поэмы, и мироощущения автора: не значит ли это, что в блоковском ощущении пространства периода «Двенадцати» среди возможных пространственных ориентиров нет принципиально важного для него: ничего нет, не ощущается «впереди», «перед»? Если это действительно так, то особенно значимым становится обилие наречий «вперед», «впереди» (Вперед, вперед, вперед, / Рабочий народ!; Впереди – с кровавым флагом,.. / Впереди – Исус Христос. Но тогда как объяснить противоречие: поэт настойчиво призывает «вперед», хотя ничего не ощущает «перед», «впереди». Можно ли истолковать это как интуитивную попытку заклинанием и верой (или надеждой?) закрыть пустоту, и не здесь ли одна из причин блоковского недовольства образом Христа, венчающим поэму?

Задачи, о которых шла речь, решаются «в одно действие». Но частотный словарь может стать источником задач не только в одно, но и в «несколько действий». Например, в «Хаджи Мурате» Л. Толстого доминирует союз «и» (1119 употреблений из 1443 общего количества союзов). А причинных союзов всего 36. Если исходить из того, что структура предложения, как любая синтаксическая структура, «материализует» авторское мироощущение, можно предположить, что Толстой ощущает события и явления как равновеликие и равно значимые. Соединительный союз «и» как бы уравнивает соотносимые ситуации в правах, определяя мировой порядок: сосуществование всего со всем. Естественно поэтому, что причинность в мироощущении Толстого периода «Хаджи Мурата» играет слишком малую роль: союзы со значением причинности составляют лишь около 2% от общего количества союзов. Но зато на эти 36 союзов причины приходится 6 разных форм («потому», «так как», «поэтому» и др.). Можно предположить, что Толстой ощущает и дифференцирует минимум 6 оттенков причинных отношений, специфика которых может быть истолкована как конкретные особенности частных причин на фоне тотального «и».

Это «первое действие» задачи. «Второе действие» может быть построено на сопоставлении частотности разных типов структурных слов. Так, если соотнести частотность союзов с частотностью предлогов со значением причины в том же «Хаджи Мурате», оказывается, что причинность, которая только маркирована союзами, доминирует среди значений предлогов. Другими словами, низкая частотность союзов говорит о том, что причинность отнюдь не определяет для Толстого мироотношений, а высокая частотность предлогов – о том, что именно причинность – одно из доминирующих отношений в мире. Это внешнее противоречие заставляет задуматься над особенностями мироощущения автора. С одной стороны, высокий процент причинных предлогов как бы компенсирует низкую частотность союзов, и в совокупности (союзы + предлоги) частотность структурных слов со значением причинности достаточно высока. Вероятно, это будет справедливое и убедительное предположение. Но можно сюда добавить и «третье действие». Дело в том, что между союзами и предлогами есть существенное качественное различие. Выполняя одну и ту же роль (указывая на отношения между явлениями), они различаются тем, что соотносят «разномасштабные» явления. Предлоги соотносят преимущественно объекты, а союзы – преимущественно ситуации. А это уже позволяет предположить многомерность авторского ощущения причинности: она значима для него только там, где соотносятся конкретные объекты, но не ситуации. Там, где соотносятся ситуации, т.е. целые фрагменты бытия, причинность теряет свое значение.

Сопоставление словарей разных писателей тоже может стать источником постановки неожиданных задач, разумеется, требующих дальнейшей разработки и аргументации. Скажем, у трех совершенно непохожих друг на друга авторов – А. Блока, А. Платонова, И. Бродского – словарь структурных слов отмечает одну неожиданную особенность. Если сопоставить предлоги с пространственным значением в «Котловане», «Двенадцати» и «Части речи», оказывается, что в «Котловане» и «Двенадцати» есть только непроизводные пространственные предлоги, то есть те, что первичны по своему происхождению, а в «Части речи» широко используются и непроизводные («первичные»), и производные («вторичные») предлоги. Грамматически одни ничем не отличаются от других: предлоги как предлоги, указывают на пространственные отношения между объектами. Но вот на уровне смысла между ними может быть важная разница. Непроизводные предлоги («к», «от», «над»и т.п.) указывают на сущностные («первичные») параметры, определяющие фундаментальные пространственные отношения. А предлоги производные («выше», «ниже», т.п.) усложняют и детализируют картину, передавая относительность пространственных отношений. Если это действительно так, то с чем мы имеем здесь дело: только ли со своеобразием авторского ощущения пространства или с некими типами художественного пространства (условно говоря, «сущностным» и «детализированным»)? И чем можно объяснить эти неожиданные совпадения и несовпадения: случайностью, особенностями авторского дарования, проблематикой, эпохой или совокупностью названных и еще каких-то причин?

Таким образом, частотные словари даже на уровне словников позволяют ставить (а иногда и решать) самые разные задачи, связанные с пониманием и интерпретацией художественного текста.

Какие задачи можно решать с помощью словаря

значений?

Словарь значений («функциональный тезаурус») был разработан М.Л. Гаспаровым специально для анализа художественного мира.

Понятие «художественный мир» активно вошло в литературоведческий обиход в 60-е гг. XX в. Толчком к его актуализации стала работа Д.С. Лихачева об особой организации внутреннего мира художественного произведения[186]. Проблема оказалась актуальной. Слова «мир», «художественный мир» выносились в заглавия монографий. Художественный мир и основные его законы становились предметом самостоятельного исследования[187]. Но само понятие оставалось при этом недостаточно определенным. С одной стороны, оно, казалось бы, открывало новые подходы, указывая на «сотворенность», целостность и эстетическую значимость художественного мира, на некие внутренние законы, по которым он существует. С другой стороны, методологически оставаясь синонимом понятия «художественный образ», оно не давало принципиально нового видения проблемы текста произведения, поэтому достаточно быстро утратило не только терминологическое, но и вообще самостоятельное значение и стало употребляться как синоним понятий «творчество данного писателя», «произведение».

Предлагая принципы составления и интерпретации функционального тезауруса, М.Л. Гаспаров исходил из того, что художественный мир – это «список тех предметов и явлений действительности, которые упомянуты в произведении, каталог его образов»[188]. Поэтому «все то, из чего состоит художественный мир, выражается в четких и ясных категориях – имена существительные, прилагательные, глаголы»[189]. Если это так, то слова в их контекстуальном значении позволяют назвать те объекты, признаки и действия, из которых состоит художественный мир, а степень частотности каждого из понятий – определить ту роль, которую играет данный объект, признак или данное действие в художественном мире автора. Объединяя слова в тематические группы («цвет», «музыка»», «домашняя утварь», «флора» и т.д.), можно получить тематические поля, в каждом из которых зафиксирована определенная сфера, грань мира. Совокупная частотность и разнообразие слов в каждой тематической группе позволяют увидеть, насколько данная сфера жизни значима, сложна и детализирована (разнообразие слов внутри группы). Отношения между тематическими группами (когда, скажем, одно понятие принадлежит двум и более тематическим полям) свидетельствуют об ощущении соположенности сфер жизни.

Однако при всех достоинствах такого подхода остается не проясненным главный вопрос: действительно ли функциональный тезаурус позволяет анализировать именно художественный мир, а не что-то другое? Дело в том, что основная посылка – «художественный мир – это каталог» – вызывает серьезные сомнения. Ведь когда мы говорим: «растительный мир», «животный мир» «мир искусства», как бы ни были различны эти понятия, в них ощущается нечто общее: всякий раз речь идет об одной из сфер жизни, где явления находятся в неких отношениях друг с другом. Именно отношения и позволяют говорить об этих явлениях не как о перечне (животных, растений или произведений искусства), а как о мире. Иными словами, мир отличается от перечня тем, что он сложно структурирован. Художественный мир – не исключение (кстати, все предшествующие разделы и были, собственно, посвящены тому, что смыслы порождаются не отдельными элементами, а их отношениями).

С этих позиций «художественный мир» – не «перечень» и не «каталог», а система отношений между теми «предметами и явлениями действительности, которые упомянуты в произведении». Поэтому проблема как раз и состоит в том, что при составлении тезауруса неизбежно разрушаются те отношения, которые объединяли слова в авторском тексте. А на следующем этапе работы, когда словарь структурируется (то есть, слова объединяются по каким-то заданным исследователем признакам), между словами возникают новые связи, обусловленные не особенностями художественного мира, а законами языка (группы, сформированные из отдельных частей речи), логикой реального мира (тематические группы «фауна», «флора», «человек») или любыми другими отношениями, заданными исследователем, а не писателем. В результате такого структурирования тезауруса мы реконструируем, по-видимому, не художественный мир, а нечто иное. Что именно?

Текст, по которому создается тезаурус, закончен и потому самодостаточен. Следовательно, самодостаточна и языковая система, в которой «материализована» авторская концепция бытия, т.е. система взглядов писателя на жизнь. Если это так, то создание художественного мира – стремление к адекватному воплощению мировосприятия через комбинацию слов. Поэтому, структурируя частотный тезаурус, мы реконструируем, скорее, не художественный мир, а те особенности «дохудожественной» действительности, из которых автор творил свой художественный мир: существительные свидетельствуют о том, из каких предметов и явлений складывался для писателя мир, прилагательные фиксируют признаки и качества, глаголы – действия и движение.

Полученная в результате интерпретации такого словаря картина «дохудожественного» мира в одних случаях может подтверждать интуитивное представление об авторском мироощущении, а в других – вступать с ним в противоречие. Действительно, нет ничего удивительного или неожиданного в том, что в тезаурусе, составленном по циклу А. Блока «Пляски смерти», группа слов со значением «человек по ту сторону жизни» (мертвец, скелет, призрак, тень) имеет высокую частотность. Если III-й том лирики А. Блока открывается разделом «Страшный мир», а этот раздел в свою очередь открывается «Плясками смерти», а «Пляски смерти» полны мертвецами, то это может значить, что словарь подтверждает интуицию: во время создания и всего III-го тома, и «Страшного мира», и цикла А. Блок ощущал себя в мире мертвецов.

Но словарь может и вступать в противоречие с рефлексией. В «Счастливой Москве» А. Платонова группа слов со значением «музыка» говорит о том, чего не ожидает читатель от страшного платоновского мира. В нем (мире) оказывается много музыки: звучат комсомольский и милицейский оркестры, исполняются песни, мазурка и небольшие пьесы, поют хором, танцуют, играют на рояле и скрипке, трижды назван Бетховен и один раз некий композитор Левченко. Музыка звучит на улице, по радио, в рабочем клубе, в торжественной зале, в ресторане. При этом непонятно, как, по каким основаниям, соотнести данную лексико-семантическую группу слов с другими группами. А так как каждая лексико-семантическая группа позволяет реконструировать отдельную грань (сферу) «дохудожественного» мира, оказывается, что словарь не дает возможности увидеть систему отношений между отдельными гранями, то есть реконструировать «дохудожественный» мир как единство.

Итак, предложенные принципы работы[190] позволяют структурировать лишь отдельные сферы мира «дохудожественного». Впрочем, если в принцип структурирования словаря внести одну поправку, то можно структурировать и отдельные грани мира художественного.

У художественного мира есть своя внутренняя логика, которую мы называли принципом развертывания целостности. Художественный мир не статичен (а формальные и функциональные тезаурусы представляют его именно таким), а динамичен. Он формируется в движении, становлении, развитии. Поэтому для того, чтобы структура словаря отражала структуру художественного мира, слова в тематических группах (учитывая, естественно, их частотность) нужно сгруппировать в той последовательности, в которой они располагаются в тексте, то есть в логике художественного мира. И тогда проявится важная закономерность: в «Счастливой Москве» играющая скрипка (источник музыки) постепенно превращается в молчащую (в знак отсутствия музыки там, где она была или могла быть) в тематической группе «человек» скрипач постепенно становится нищим; многоцветье, угасая, сменяется бледностью свет вытесняется и, в конце концов, заменяется тьмой. А в тезаурусе «Плясок смерти» слова тематических групп «человек по ту сторону жизни», «звук», «движение», расположенные так, как они следуют в художественном мире поэта, прочерчивают жесткую логику «дематериализации» действительности от живого мертвеца – к призраку (мертвец → скелет → тень → призрак), от движения – к статике, от звучания – к тишине.

Но и в этом случае функциональный тезаурус позволяет реконструировать только отдельные фрагменты (грани, области) художественного мира. И в этом случае он не дает возможности увидеть ту систему отношений между фрагментами, которая лежат в основе единства мира.

Предоставляют такую возможность частотные словари служебных слов, которые указывают не на объект, признак или состояние, но на отношения.

Если по-прежнему исходить из того, что структура предложения есть «материализация» структуры авторского мышления, то понятие «служебные слова» можно и нужно заменить понятием «структурные слова», то есть такие слова, которые маркируют структуру авторского мироощущения и, соответственно, структуру художественного мира.

Поэтому функциональные тезаурусы союзов, предлогов и частиц позволяют реконструировать авторское ощущение всех возможных отношений между фрагментами бытия, человеком и бытием[191]. Причем такой тезаурус можно структурировать еще и в логике системы дискурсов. В этом случае появляется возможность реконструировать авторское представление о том, каково мироощущение той или иной социокультурной группы, а в отдельных случаях и персонажа.

Но возможности этого словаря тоже жестко ограничены: позволяя реконструировать структурные отношения, он не дает возможности говорить, какие именно реалии они соотносят. Следовательно, нужен такой тип словаря, который позволяет рассмотреть реалии в их структурных отношениях.

Контекстный тезаурус

Задачи, которые можно решать с помощью «словаря контекстов»:

Выходом из этой ситуации может быть «контекстный тезаурус», который позволяет реконструировать одновременно и структурные связи, и те доминирующие реалии, которые этими связями объединены. «Контекстный тезаурус» – это словарь авторских значений минимальных контекстов, объединенных структурным (служебным) словом. Работа со словарем проходит в несколько этапов. На первом этапе выделяются минимальные контексты: структурное слово (ядро контекста) и объединенные им слова полнозначные. Структурные слова фиксируют наличие и частотность структурных отношений, относящиеся к ним полнозначные – те реалии, из которых структурировался для автора мир.

Как правило, выделение таких контекстов не составляет труда: при всем различии и даже несопоставимости мироощущений, скажем, Е. Баратынского, О. Мандельштама, А. Платонова Л. Толстого, А. Блока, Л. Добычина[192] оптимальный контекст у каждого из них – одна-две реалии, объединенных одним структурным словом. Но иногда, как, например, в цикле И. Бродского «Часть речи», выделить контексты бывает достаточно сложно. Во-первых, «Часть речи» количественно «перенасыщена» структурными словами: они составляют около 40% от общего количества слов цикла. Во-вторых, целый ряд контекстов «Части речи» – это «гроздья», структурных слов, включающие реалии (полнозначные слова) в единое и нерасторжимое целое. Бродский может начать с уточняющего разъяснения (То есть), сразу же ввести условие и следствие (если – то) и указать на последовательность (за). И все это образует единый контекст: То есть, если одна, тоза ней другая. Сложность такого контекста усугубляется тем, что в нем доминируют структурные слова (4 из 7 слов – структурные, и только 3 – полнозначные). В бытовой (естественной) речи такое соотношение служебных и полнозначных слов было бы одним из сигналов косноязычия. В поэтическом языке, где все «элементы суть элементы смысла»[193], это может значить, что структурные отношения важны для поэта, по крайней мере, не менее чем реалии окружающего мира. Больше того, структурное слово часто стоит в сильной позиции конца строки и рифмуется: в тени / и ни; немое / ярмо и; в колене и / тихотворение; на / длина. При этом оно оказывается на строчном переносе (15 «структурных» переносов в 12 стихотворениях из 20). Но если нерасчленимая совокупность структурных слов разрывается переносом, это значит, что рвется, чтобы затем восстановиться, структура мира. Разрыв – сигнал непрочности, возможности обрыва связей в любое время и в любом месте, даже когда они представляются нерасторжимыми (ини / на одной).

Это создает трудности второго этапа работы со словарем: определить то авторское ощущение структурных отношений, которое «материализовано» в каждом данном контексте (авторское значение). В одних случаях это не представляет особого труда. Скажем, контексты на виадуке, на реке, на взморье, на курляндском берегу (роман Л. Добычина «Город Эн») объединяются значением «локальное пространство, место, где что-то находится, происходит». Значение контекста бриз шевелит ботву, и улица сужается («Часть речи») определяется как «соединение равноправных, но разнопорядковых событий». В случаях со сложными контекстами (То есть, если одна, тоза ней другая) есть минимум две возможности. Можно исходить из того, что доминирует какое-то одно значение, а остальные дополняют его. Доминанта определяется в таких случаях интуитивно, поэтому полученные варианты значений с доминирующим разъяснением (То есть), условиями (если), или последовательностью (тоза) будут характеризовать, скорее, не авторское значение, а представление исследователя о том, каким это значение может (или даже должно) быть. Поэтому предпочтительнее кажется вторая возможность: определить значение всей совокупности структурных слов, исходя из их последовательности и не выделяя доминанты («уточнение/разъяснение,(То есть) подчеркивающее условия(если), при которых неизбежна последовательность (тоза) событий»).

Затем третий этап – группировка значений по общей семе («местоположение», «движение», «граница» и т.д.). Принцип группировки предельно прост: сколько у значений общих сем, столько и групп. Само наличие именно этих групп говорит о том, какие именно сферы бытия ощущал автор как значимые, а количество (частотность) и разнообразие значений внутри группы – о том, насколько эта сфера, сложна и разнообразна.

Такой тезаурус контекстуальных значений позволяет реконструировать и отдельную грань авторского мироощущения и / художественного мира, и авторское мироощущение и художественный мир в их многообразии. Посмотрим, как это выглядит на практике.

Наши рекомендации