Лингвистика и теория связи
Норберт Винер отказывается видеть «сколько-нибудь существенную противоположность между проблемами наших инженеров при измерении информации и проблемами наших филологов». В самом деле, между последними этапами лингвистического анализа и подходом к языку в математической теории связи обнаруживаются поразительные совпадения и сближения. Поскольку каждая из этих двух дисциплин имеет дело с одной и той же областью устных сообщений, хотя и различным и совершенно самостоятельным образом, тесный контакт между ними оказался взаимополезным и, несомненно, будет становиться все более плодотворным.
Поток устной речи, физически непрерывный, первоначально поставил математическую теорию связи перед ситуацией «значительно более сложной», чем в случае конечного множества диск-ретных составляющих, даваемых письменным текстом. Однако лингвистический анализ позволил превратить устную речь в конечный ряд элементарных информационных единиц. Эти элементарные дискретные единицы, так называемые «различительные признаки», объединяются в одновременные пучки, называемые «фонемами», которые в свою очередь, идя друг за другом, образуют последовательности. Таким образом, форма в языке имеет отчетливо гранулированную структуру и поддается квантованному описанию.
Главная задача теории информации, как она сформулирована, например, Д. М. Маккеем, состоит в том, чтобы «выделить из частных контекстов те общие признаки представлений, которые могут оставаться инвариантными при всех формулировках». Лингвистической аналогией этой проблемы являются поиски относительных фонематических инвариантов. Различные возможности измерения количества фонематической информации, которые предвидели инженеры-связисты (они различают «структурное» и «метрическое» содержание информации), могут быть весьма полезны как в син-хронной, так и в исторической лингвистике и особенно важны для
1 R. J akobson, Linguistics and Communication Theory, "Structure of
Language and its Mathematical Aspects", Providence, 1961. Перевод В. В. Ла
зарева. .
типологии языков как в чисто фонологическом аспекте, так и при взаимодействии фонологии с лексико-грамматическим уровнем.
Дихотомический принцип, лежащий в основе всей системы различительных признаков в языке, был постепенно обнаружен лингвистикой и поставлен в соответствие с двоичными знаками (битами), используемыми инженерами в качестве единицы измерения в теории связи. Когда они определяют избранную информацию сообщения как минимальное число двоичных решений, которое позволяет адресату реконструировать то, что ему необходимо извлечь из сообщения на основе уже известных ему данных, то эта реалистическая формула вполне соответствует назначению различительных признаков в устном сообщении. Как только был предложен «способ распознавания универсалий при помощи их инвариантов» и обобщающая классификация различительных признаков была описана в соответствии с этими принципами, немедленно вслед за этим в лекциях Д. Габора по теории связи была поставлена проблема перевода критериев, предложенных лингвистами, «на математический и операционный» язык А недавно появилась весьма полезная работа Г. Унгехоера (Ungeheuer), в которой предлагается способ математической интерпретации различительных признаков в их двоичном изображении2.
Понятие «избыточности», пришедшее в теорию связи из риторики, являющейся ветвью лингвистики, приобрело важное значение в развитии этой теории и было несколько смело заново определено как «единица минус относительная энтропия». В этом новом определении оно опять попало в современную лингвистику в качестве одной из основных категорий. Необходимость строгого разграничения различных типов избыточности в настоящее время признается как в теории связи, так и в лингвистике, где понятие избыточности включает, с одной стороны, многословные способы выражения, в противоположность краткости (brevitas — в традиционной терминологии риторики), а с другой стороны, полноту выражения — в противоположность умолчанию (эллипс). На фонологическом уровне лингвисты умеют разграничивать фонематические различительные единицы и контекстуальные, комбинаторные, аллофонические варианты, но обращение с такими взаимосвязанными проблемами, как избыточность, предсказание и условные вероятности в теории связи, позволило внести большую ясность в отношении двух основных лингвистических характеристик свойств звуков — различительных признаков и избыточных признаков.
Фонематический анализ, если он последовательно ставит своей целью исключение избыточности, неизбежно дает оптимальное и однозначное решение. Мистическая вера некоторых теоретиков,
не связанных с лингвистикой, в то, что «не существует сколько-нибудь серьезных оснований для разграничения различительных и избыточных признаков», полностью противоречит многочисленным лингвистическим данным. Если, например, в русском языке различие между передними гласными и соответствующими им задними гласными всегда сопровождается различием между предшествующими им согласными, которые палатализуются перед передними гласными, но лишены палатализации перед задними гласными, и если, с другой стороны, различие между палатализованными и непалатализованными согласными не определяется их гласным окружением, то лингвист обязан сделать вывод, что в русском языке наличие или отсутствие палатализации согласных является различительным признаком, тогда как различие между передними и задними гласными оказывается всего лишь избыточным. Избыточные и различительные признаки, не будучи ни в какой мере произвольными умозаключениями исследователя, являются объективно присутствующими и различаемыми в языке.
Предубежденная трактовка избыточных признаков как не относящихся к делу, а различительных признаков как единственно оправданных, исчезает из лингвистики, причем и здесь именно теория связи, и в особенности ее концепция транзитивных вероятностей, помогает лингвистам изжить их неправильное отношение к избыточным и различительным признакам как нерелевантным и релевантным соответственно.
Согласно Маккею, предугаданные возможности «являются основным элементом теории связи», и аналогичную заявку делает лингвистика. Ни в одной из этих дисциплин не возникает ни малейшего сомнения относительно фундаментального значения избирательных операций в речевой деятельности. Инженер предполагает, что «регистрирующая система» для заранее построенных возможностей является более или менее одинаковой в передатчике и приемнике вербального сообщения, соссюрианская лингвистика соответственно говорит о языке (langue), который делает возможным обмен речью (parole) между собеседниками. Такое «сочетание возможностей, заранее предугаданных и обеспеченных»1, предполагает наличие кода, рассматриваемого в теории связи как «согласованное преобразование — обычно взаимооднозначное и обратимое»2, с помощью которого один набор информационных единиц переводится в другой набор, например грамматическая единица переводится в фонематическую последовательность и наоборот. Код приводит в соответствие обозначение (signans) с его обозначаемым (signatum) и обозначаемое (signatum) с его обозначением (signans). В наши дни в связи с изучением проблем
1 D. G a b о г, Lectures on Communication Theory, Cambridge, Mass.,
1951, p. 82.
2 «Studia Linguistica», vol. 13, 1959, pp. 69—97.
43$
1 Cybernetics: Transactions of the Eighth Conference, New York, 1952,
p. 183.
2 С. С h e r r y, On Human Communication, New York—London, 1957,
p. 7.
кодирования в теории связи дихотомия язык — речь Соссюра может быть обоснована гораздо более точно и приобретает новое операционное значение. G другой стороны, теория связи может почерпнуть в современной лингвистике необходимые сведения относительно стратифицированной структуры сложного языкового кода в его различных аспектах.
Хотя основные черты языкового кода в достаточной мере описаны в лингвистике, все же нередко забывают, что конечный набор «стандартных представлений» сводится к лексическим символам, их грамматическим и фонологическим составляющим, а также к грамматическим и фонологическим правилам сочетания. Только эту часть сообщения можно определить как простую «операцию повторения представления». С другой стороны, необходимо напомнить, что код не сводится только к тому , что инженеры-связисты называют «чисто мыслительным содержанием речи»; стилистическая стратификация лексических символов и соответственно мнимое «свободное» варьирование как в их построении, так и в правилах их сочетания также являются «предугаданными и обес-печенными» при помощи кода.
В своей программе для будущей науки знаков (семиотики) Чарлз Пирс пишет: «Законознак (legisign) есть закон, который есть Знак. Этот закон обычно устанавливается людьми. Любой условный знак является законознаком»1. Словесные символы приводятся в качестве примера законознаков. Собеседники, принадлежащие к одному данному речевому коллективу, определяются как действительные обладатели одного и того же языкового кода, включающего одинаковые законознаки. Общий код является средством их общения; он лежит в основе обмена сообщениями, обеспечивая его возможность. В этом существенная разница между лингвистикой и естественными науками, и эта разница отчетливо и постоянно подчеркивалась в теории связи, особенно в ее английской школе, которая настаивает на четком разграничении теории связи и теории информации. Тем не менее это различие, как ни странно, иногда игнорируется лингвистами. «Стимулы, получаемые от Природы,— как мудро замечает Черри,— не являются картинами действительности, но суть показания, на основании которых мы строим наши собственные модели»2. В то время как физик создает свое теоретическое построение, накладывая свою собственную гипотетическую систему новых символов, на полученные данные, лингвист только перекодирует, переводит в символы метаязыка ее наличные символы, которые используются в языке данного языкового коллектива.
Компоненты кода, например различительные признаки, действительно имеют место и реально функционируют в речевом сообщении. Как для получающего информацию, так и для передаю-
щего ее операция выбора, как указывает Р.М.Фано, составляег основу «процессов передачи информации»1. Набор операций выбора по принципу «да —нет», лежащих в основе любого пучка этих дискретных признаков, не является произвольным измышлением лингвиста, а действительно производится адресатом сообщения, если необходимость их распознавания не снимается данными словесного или несловесного контекста.
Как на грамматическом, так и на фонологическом уровне не только адресат при декодировании сообщения, но и кодирующий это сообщение могут использовать эллипс; в особенности тот, кто кодирует, опускает некоторые признаки или даже некоторые их пучки и последовательности. Но эллипс также управляется кодифицированными правилами. Язык никогда не является монолитным; его основной код включает ряд подкодов, и такие вопросы, как правила трансформации оптимального, явно выраженного, основного кода в различной степени эллиптические подкоды, а также их сравнение в отношении количества информации, требуют как лингвистического, так и инженерного исследования. Обратимый код языка со всеми его переходами от подкода к под-коду и со всеми постоянными изменениями, которые этот код претерпевает, должен быть описан средствами лингвистики и теории связи в результате совместного и внимательного изучения. Понимание динамической синхронии языка, включающей координаты пространства и времени, должно прийти на смену традиционной схеме произвольно ограниченных статичных описаний.
Лингвист-наблюдатель, который уже владеет или овладевает языком в процессе исследования, является или постепенно становится потенциальным или действительным участником в обмене вербальными сообщениями между членами языкового сообщества, его пассивным или даже активным членом. Инженер-связист прав, когда он защищает от «некоторых филологов» совершенно безусловную «необходимость вывести на сцену Наблюдателя» и когда он соглашается с Черри в том, что «описание наблюдателя-участника будет наиболее полным». Антипод участника, совершенно посторонний и незаинтересованный наблюдатель, ведет себя как специалист по расшифровке, который получает сообщения, не будучи их адресатом и не зная их кода. Он старается раскрыть код при помощи тщательного исследования сообщений. Надо стремиться, чтобы этот уровень лингвистического исследования был лишь первым этапом на пути к внутреннему подходу к изучаемому языку, когда исследователь приобщается к говорящим на этом языке, как на своем родном, и декодирует сообщения на их родном языке при помощи их собственного кода.
Коль скоро исследователь не знает обозначаемого (signaturn) в данном языке и не располагает ничем другим, кроме обозначений
438
1 Ch. Pieirce, Collected Papers, vol. 2, Cambridge, Mass., 1932, p. 142.
2 Указанное соч., стр. 62.
1 R. F a n о, The Transmission of Information, Mass. Inst. of Technology, 1949, p. 3.
(signans), он волей-неволей должен напрячь свои детективные способности, чтобы получить всю возможную информацию о структуре этого языка из внешних показателей. Современное состояние этрускологии является хорошим примером такой техники. Но если лингвист знаком с кодом и, в частности, владеет правилами трансформации, с помощью которых ряд обозначений (signans) переводится в ряд обозначаемых (signatum), то ему незачем изображать из себя Шерлока Холмса, если только он не вознамерится обнаружить, сколь широки и надежны данные, которые он мог бы получить таким образом. Трудно, однако же, симулировать незнакомство со знакомым кодом: придуманные значения искажают естественный метод расшифровки.
Вполне очевидно, что «неразделимость объективного содержания и субъективного наблюдения», отмечаемая Нильсом Бором1 как преддверие всякого достоверного познания, следует непременно принимать во внимание также и в лингвистике, и позиция исследователя по отношению к языку, который он наблюдает и описывает, должна быть точно определена. Прежде всего, как отмечает Юрген Рюш (Jurgen Ruesch), информация, которую получает исследователь, зависит от его места внутри или вне изучаемой системы. Более того, если исследователь находится внутри коммуникативной системы, то язык представляется в двух совершенно различных аспектах при рассмотрении его с двух противоположных концов канала связи. Грубо говоря, процесс кодирования идет от значения к звуку и от лексико-грамматического к фонологическому уровню, тогда как процесс декодирования идет в обратном направлении — от звука к значению и от признаков к символам. Если при произнесении речевого сообщения установка (Einstellung) предшествует непосредственно составляющим, то при восприятии речи сообщение является прежде всего стохастическим8 процессом. Вероятностный аспект речи отчетливо проявляется в отношении слушателя к омонимам, в то время как для говорящего омонимии не существует. Говоря /sап/, он знает заранее, подразумевается ли «sun» (солнце) или «son» (сын), тогда как восприятие слушающего зависит от вероятностей контекста. Для принимающего сообщение содержит множество неясностей, которые вполне однозначны для передающего. Двусмысленность в шутливой игре слов и в поэзии основывается на этом свойстве ввода и вывода при передаче сообщений.
Нет сомнения, что существует и обратная связь между говорением и восприятием, но иерархия этих двух процессов является противоположной для кодирующего и декодирующего. Эти два различных аспекта языка не сводимы друг к другу; оба они одина-
1 N. В о h г, Atomic Physics and Human Knowledge, New York, 1958,
30.
2 В сб. «Toward a Unified Theory of Human Behaviour», New York, p. 54.
8 Стохастический — вероятностный. (Примечание составителя.)
ково важны и должны рассматриваться как дополняющие друг друга в том смысле, как это понимает Нильс Бор в упоминавшейся работе. Относительная автономия вводимой модели (input pattern) подтверждается широко известным временным приоритетом пассивного овладения языком как детьми, так и взрослыми. Требование Щербы выделить и создать две грамматики — «активную» и «пассивную»,— недавно вновь повторенное молодыми русскими лингвистами, одинаково важно для лингвистической теории, для обучения языкам и для прикладной лингвистики..
Если лингвист имеет дело с одним из этих двух аспектов языка на манер Журдена, т. е. не отдавая себе отчета, относится ли его наблюдение к выводу или к вводу, то это все-таки менее опасно, чем произвольные компромиссы, часто имеющие место в анализе ввода и вывода, к примеру, описание в грамматике вывода порождающих операций безотносительно к значению, несмотря на безусловный приоритет значения для кодирующего. В настоящее время лингвистика получает из теории связи чрезвычайно важные идеи для изучения вербального ввода, до сих пор несколько недооценивавшегося.
Маккей предостерегает против смешения обмена вербальными сообщениями с получением информации из внешнего мира, поскольку они обычно неправильно объединяются под одним названием «сообщение»; у этого слова существуют неизбежно антропоморфические ассоциации, «обсуждение которых превращается в ожесточеннейшее словопрение»1. Возникает аналогичная же опасность, если интерпретировать общение в человеческом обществе в терминах физической информации. Попытки построить модель языка безотносительно к говорящему и слушающему и таким образом гипостазировать код, абстрагированный от действительного общения, таят в себе опасность превратить язык в схоластическую фикцию.
Помимо кодирования и декодирования, процесс перекодирования, замены кодов, короче говоря, различные аспекты перевода также становятся в ряд основных проблем как лингвистики, так и теории связи не только у нас, но и в Западной и Восточной Европе. Только теперь такие увлекательные проблемы, как способы и степени взаимного понимания говорящих на близкородственных языках, например датском, норвежском и шведском, начинают привлекать внимание лингвистов и обещают дать отчетливое представление о явлении, известном в теории связи под названием «семантический шум», а также о весьма важной, теоретически и педагогически, проблеме преодоления его.
Между прочим, и лингвистика и теория связи в течение некоторого времени имели тенденцию рассматривать всякий интерес к значению как разновидность семантического шума и исключали семантику из изучения вербальных сообщений. В настоящее же
1 Cybernetics: Transactions of the Eighth Conference, New York, p. 221.
время лингвисты обнаруживают тенденцию вновь значению после весьма поучительного опыта его временного изгнга-ни я. В теории связи также можно наблюдать аналогичное явление. Согласно Виверу, анализ сообщений «столь основательно прочистил атмосферу, что сейчас, едва ли не впервые, можно действительно обратиться к теории значения» и в особенности к изучению «одного из наиболее важных и трудных аспектов значения, а именно влияния контекста»1. Лингвисты постепенно приходят к тому, что надо рассматривать значение, и в особенности соотношение между общим и контекстным значениями, как внутренними лингвистическую проблему, отчетливо отделяемую от онтологических проблем отношения.
После того как будет освоен уровень фонематической информации, теория связи сможет подойти к задаче измерения грамматической информации, поскольку система грамматических и, в частности, морфологических категорий, подобно системе различительных признаков, явно базируется на системе исключающих друг друга двоичных знаков. Таким образом, например, девять двоичных выборов лежат в основе примерно ста простых и сложных спрягаемых форм английского глагола, которые употребляются, скажем, в сочетании с местоимением «я». Количество грамматической информации, которое содержит английский глагол, можно сопоставить с соответствующими данными об английском существительном или о глаголе и существительном в различных языках; соотношение между морфологической и синтаксической информацией в английском языке следует сравнить с аналогичным соотношением в других языках, и все эти сравнительные данные обеспечат важный вспомогательный материал для лингвистической типологии языков, а также для изучения лингвистических универсалий.
Количество грамматической информации, которое потенциально содержится в парадигмах данного языка (статистика кода), следует затем сопоставить с Количеством информации в знаках, в действительных употреблениях различных грамматических форм в пределах корпуса сообщения. Любая попытка игнорировать эту двойственность и свести лингвистический анализ и подсчет только к коду или только к корпусу обедняет исследование. Нельзя игнорировать основной вопрос соотношения между типом системы составляющих вербального кода и их относительной частотностью как в коде, так и в реальном употреблении.
Семиотическое определение значения символа как перевод его в другой символ находит эффективное применение в лингвистических опытах, касающихся внутри и межъязыкового перевода, и такой подход к семантической информации соответствует предложению Шенона определять информацию как «то, что остается
перевода», кс
Имея дело со значениями, грамматическими и лексическими, нужно стараться не путать полярно противоположные понятия «регулярность» и «отклонение». Понятие «отклонения» часто возникает из недооценки сложной иерархической структуры языка. Между тем имеется существенное различие между второстепен-ностью и отклонением.. Нет оснований рассматривать как отклонения ни «синтаксические деривации» относительно «первичной функции» у Куриловича, ни «трансформации» относительно «ядра» у Хомского, ни «маргинальные» (переносные) значения относительно «центрального» значения слова у Блумфилда. Метафоры являются не отклонениями, а правильными образованиями определенных стилистических видоизменений, представляющих собой субкоды основного кода, и в пределах такого субкода нет, например, никакого отклонения в фигуральном отнесении конкретного эпитета к абстрактному существительному у Марвелла — a green thought in a green shade («зеленая Мысль в зеленой сени»), или у Шекспира при метафорическом перенесении неодушевленного существительного в класс существительных женского рода — the morning opes her golden gates («утренняя заря раскрывает златые врата свои»), или метонимическое употребление sorrow («печаль») вместо sorrowful while («печальное время»), которое Путнам в своей работе берет из Дилана Томаса,— A grief ago I saw him there («Bo времена печали я видел его там»). В отличие от нарушающего грамматику построения girls sleeps («девушки спит») приведенные выше примеры являются осмысленными, а любое осмысленное предложение может быть подвергнуто испытанию на истинность таким же способом, как и утверждение Peter is an old fox («Питер —- старая лиса»), которое может привести к ответу: «Это неверно; Питер не лиса, а свинья, вот Джон — лиса». Между прочим, ни эллипсы, ни умолчания или анаколуфы нельзя считать отклонениями от правильных структур; они, как и всякий неправильный стиль речи или брахилогический субкод, к которому они относятся, являются всего лишь законными производными от ядерных форм, воплощенных в языковом стандарте. И опять-таки, эту «изменяемость кода», которая объясняет, почему стандарт не реализуется в некоторых искаженных употреблениях, проглядели лингвисты скорее, чем менее «предубежденные» инженеры-связисты.
Итак, имеется широкий круг вопросов, требующих сотрудничества двух различных дисциплин, о которых мы здесь пишем. Первые шаги в этом направлении были чрезвычайно удачными. Позволю себе закончить примером самого длительного и до последнего времени, вероятно, самого удивительного союза между линг-
1 С. Shannon and W. W e a v e r, The Mathematical Theory of Communication, Urbana, 1949, p. 116.
1 См.: Cybernetics: Transactions of the Seventh Conference, New York, 1951, p. 157.
вистикой, особенно при изучении поэтического языка, с одно1 стороны, и математическим анализом стохастических процессов с другой стороны. Русская метрическая школа обязана некоторыми из своих всемирно-известных достижений тому факту, что около сорока лет назад такие ученые, как Б. Томашевский, знаток и математики и филологии, весьма искусно использовал цепи Маркова для статистического исследования стиха; эти данные, дополненные лингвистическим анализом структуры стиха, привели в начале 20-х годов к созданию теории стиха, основанной на исчислении условных вероятностей и напряжения между ожидаемым и неожиданным в качестве измеряемых ритмических величин. Исчисление этого напряжения, которое мы назвали «обманутые ожидания», дало удивительный ключ для решения проблем описательной, исторической и сравнительной, а также общей метрики на научной основе1.
Я убежден, что методы, лолучившие в последнее время развитие в структурной лингвистике и в теории связи, будучи использованы для анализа стиха, а также во многих других областях науки о языке, способны открыть широкие перспективы для дальнейших координированных усилий обеих дисциплин. Будем же надеяться, что наши ожидания не будут обмануты.
1 См.: Б. Томашевский, О стихе, Л., 1929.