Нечеткость природы лингвистических объектов 2 страница

1.6.5.1. Моделирование нечётких лингвистических объектов в системе языка с помощью дискретных примитивов. Опыт последних лет теза-урусно-сетевого моделирования сложных лингвистических систем, опира-ющийся на план их выражения, показал, что построенные этим путём мо-дели плохо отражают структуру этих “мягких” систем. Стало ясным, что к таксономическому анализу и синтезу этого языкового материала целесо-образно подходить с понятийно-функциональных позиций, т.е. с позиций плана содержания. Однако анализ современных работ по построению кла-ссификационных деревьев лингвистических понятий, выполненных на ма-териале разных языков, показывает, что многие исследователи, столкнув-шись с нечёткостью семантики понятий-терминов, образующих моделиру-емые “мягкие” лингвистические системы, определяют смысловые объё-мы этих понятий не экспериментально, но исходя из собственного языко-вого чутья. Это явление специально исследовалось Е.Ю.Горбуновым (22. С. 10 - 17) на материале английской морфосинтаксической терминологии.

Выяснилось, что классификации, построенные на субъективной оцен-ке смыслового объёма и границ понятий, образующих изучаемую предмет-ую область (ПО), также приводит к потере важной информации, а иногда и к искажению системных отношений внутри ПО. Поэтому Е.Ю.Горбунов при-ступил к разработке экспериментальной процедуры, опирающейся на ком-понентный анализ, для объективного описания семантического поля для ка-ждого понятия-термина входящего в “мягкую” терминологическую систему. Новизна этой процедуры заключается в том, что значение (точнее – интен-сионал, см. 2.2.1) каждого понятия-термина, представляющее нечёткий объ-ект, описывается с помощью дискретных лексико-грамматических прими-тивов (табл. 2а). Это даёт возможность без больших информационных по-ерь однозначно формализовать построение нечёткихлингвистическихобъ-ектов с помощью чётких средств ИЯ математики и компьютера. Используя эту процедуру, Е.Ю.Горбунов задался также целью проверить смысловую эквивалентность терминов, являющимися общими для некоторых современ-ных понятийных классификаций, используемых в теоретических граммати-ках английского языка. Результат оказался несколько неожиданным. Выяснилось, в частности, что большинство понятий-терминов, имеющих не только общую графичес-кую форму, но занимающих также одну и ту же позицию в понятийно-функциональном классификационном древе, характеризуются неоди-наковыми наборами примитивов. Так, например, интенсионалы понятия-термина locative ‘местный падеж’ содержат разные наборы примитивов в классификациях Ч.Филмора и Лонгакра [22] .В первой классификации понятие ‘местный падеж’ имеет широкое значение, моделируемое прими-тивами: ’движение к конечной точке обозначенного пространства’, ’движение сверху вниз’, ’движение через обозначенное пространство’, ’место’, ’нахождение на поверхности чего-либо’, ’нахождение ря-дом с чем-либо’, ’нахождение внутри чего-либо’, ’нахождение под чем-либо’, ’нахождение за чем-либо’, ’покой’, ’пространство’, ’состояние’, ’уда-ление от начальной точки обозначенного пространства’, ’действие’, ’глагольное управление и управление от существительных, производных от глагола’’.

Во второй таксономии это понятие описывается ограниченным чи-слом примитивов: ’место’, ’нахождение рядом с чем-либо’, ’нахождение внутри чего-либо’, ’покой’, ’состояние’, ’действие’, ’глагольное управле-ние и управление от существительных, производных от глагола’. При этом часть семантического поля понятия ‘местный падеж’ Лонгакр отнёс к понятиям-терминам Goal ‘цель’, Path ‘’, Source‘источник’, отсутствую-щим в классификации Ч.Филлмора. Применение дискретных примитивов для представления нечётких лингвистических объектов в виде формализ-мов ИЯ, доступных для восприятия и переработки компьютером, являет-ся достаточно трудоёмким процессом. Однако эта процедура представля-ет не только чисто теоретический интерес с точки зрения перехода от не-чёткости

Таблица 2а. Список главных примитивов для формального описания морфологических и морфосинтаксических терминов

NN Тип примитивов Примитивы
Лексические семы (семы) ’вещественность’, ’взаимность’ , ’возникновение’, ’вопросительность’ , ’время’ , ’движение’, ’движение к конечной точке обозначенного пространства’, ’дви-жение сверху вниз’, ’движение через обозначенное пространство’, ’имя нарицательное’, ’имя собст-венное’,’исключение’, ’исчезновение’, ’количество’, ’конкретность’, ’место’, ’намерение’, ’направление’, ’нахождение на поверхности чего-либо’, ’нахождение рядом с чем- либо’,’нахождение внутри чего-либо’,’нахождение под чем-либо’,’нахождение за чем-либо’, ’неопределенность’,’обладание’,’обобщённость’, ’покой’, ’предосторожность’, ’предположение’, ’причина’,’признак’, ’пространство’, ’противи-тельность’, ’разделение’,’процесс’, ' результат’, ,’свойство’, ’свойство процесса’, ‘следствие’,’соединение’, ’сознательность’, ’состояние’,’способ действия’, ’стоимость’, ’удаление от начальной точки обозначенного пространства’, ’указание’, ’условие’, ’физический вес’, ’цель’, ’чувство’, ’эмоция’
Грамматические семы (ГС) ’вид’, ’время’,’залог’, ’лицо’, ’модальность’, ’падеж’, ’род’, ’степени сравнения’, ’число’
Лексико-грам-матические семы (ЛГС) ’действие’, ’единичность’, ’женский пол’ (’женский род’*), ’качество’, ’множественность’, ’мужской пол’ (’мужской род’*), ’не отторжимая принадлежность’, ’неодушевленность’, ’обобщенная единичность’, ’одушевленность’, ’отношение’, ’отторжимая принадлежность’, ’парность’, ’предметность’, ’призыв’, ’степень’, ’сравнение’, ’часть  целое’,
Валентностно-позиционные индикаторы (ВПИ) ’глагольное управление и управление от существительных, производных от глагола’, ’зависимость от субстантивных и глагольных референтов’, ’зависимость от определяемого слова’, ’начальная позиция в предложении’, ’независимость’, ’независимость от опреде-ляемого слова’, ’подчинительная связь’, ’постглагольная позиция в функции прямого дополнения’, ’постглагольная позиция в функции косвенного дополнения’, ’постглагольная позиция в функции числового определения’, ’сочинитель-ная связь’, ’употребление в препозиции к определяемому слову’, ’употребление в постпозиции к определяемому слову’

ЕЯ к “чёткости” ИЯ. Она является достаточно эффективным средством решения таких прикладных инженерно-лингвистических задач как получение в ходе МП, компьютерного аннотирования и индекси-рования эквивалентов входных терминов определённой ПО (см. ниже ).

Не следует, разумеется, преувеличивать объяснительную силу метода моделирования даже в том случае, когда в ходе построения и функци-онирования моделей используются не только традиционные гуманитарные технологии, но также самые изощрённые опыты, использующие совре-менную экспериментальную технику и достаточно сильную математику. Применение моделирования в технике и других предметных областях показывает, что при выдвижении гипотез авторы, не обладая достаточным набором проверенных эмпирических данных, обращаются к собственной интуиции, научной или технической традиции и мнению авторитетов. Именно поэтому специалисты в области естественных наук и техники вводят в проекты и гипотезы разного типа ”коэффициенты незнания” (35а. С. 600) с целью повышения надёжности своего проекта или модели. Этот приём можно использовать и при построении лингвистических моделей.

.

1.7. Заключительные замечания

Применение воспроизводящих моделей, отражает новую познавательную установку в языкознании, лингводидактике и информатике. Суть ее состоит в том, что вместо пассивного созерцания объектов и явлений внешнего мира ученые переходят к созданию их аналогов. В ходе развития этой новой гносеологической установки меняются конечные цели научного исследования. Если при гипотетическом моделировании его результатом становился некоторый идеальный, обычно редко встречающийся в реально наблюдаемой речи или лингводидактической практике конструкт, то итогом построения ВИЛМ и ВЛДМ является не только выявление класса как реальных, так и учебных лексико-грамматических, фонетических и др. единиц, представляющих этот идеальный объект, но также проектирование и реализация их искусственных аналогов.

Новая познавательная установка имеет важные последствия для науки о языке и лингводидактики.

Во-первых она ликвидирует ложное методологическое противопостав-ление традиционной лингвистики, объявляющей себя теоретическим языко-знанием, математической и прикладной лингвистике. Выполняя с помощью воспроизводящих моделей верификацию научных гипотез, последняя оказывается не менее теоретичной, чем "теоретическое" традиционное языкознание, верификационные возможности которого крайне ограничены.

Во-вторых в инженерно-математической лингвистике и лингводидак-тике повышается внимание не только к корректности эпистемологических средств исследования, но также к онтологии модельного эксперимента. В частности применение ВИЛМ и ВЛДМ ограждает ученого от искушения в целях облегчения своей ответственности перед обществом следовать ложно-му совету Л.Ельмслева, согласно которому "экспериментальные данные никогда не могут усилить или ослабить теорию, они могут усилить или осла-бить только ее пригодность" [30. С. 275]. Слепое следование этому совету за-водило в тупик кризиса размерности сотни исследователей, которые, опира-ясь на онтологически неверную "алгебраическую" теорию языка, пытались строить свои системы АПТ..

Глава 2. МОДЕЛИРОВАНИЕ СЕМИОТИЧЕСКИХ ОБЪЕКТОВ И КОММУНИКАТИВНЫХ ПРОЦЕССОВ В ЯЗЫКЕ*)

2.0. Вводные замечания

Знаковость естественного языка является одной из основных и старейших проблем лингвистической науки. К сожалению единого всеми принятого истолкования основных семиотических терминов до сих пор нет. Поэтому прежде приступить к моделированию знаковой природы языка, ну-жно договориться о точной трактовке основных терминов и дать расши-фровку базовых семиотических понятий, которые будут использоваться в этой и последующих главах. Кроме того необходимо сопоставить исполь-зующийся в работе .семиотический понятийный аппарат с терминологии-ческими системами других авторов. Этой цели служит табл. 3.

2.1.Модель лингвистического знака

Люди не могут общаться друг с другом с помощью предметов окружа-ющего мира, как это делали жители фантастической Лапуты, описанной Дж. Свифтом в "Путешествиях Гулливера". Человек передает информацию о пре-дметах внешнего мира (т.н. р е ф е р е н т а х) с помощью иных мате-риальных, чувственно воспринимаемых и удобных в общении объектов  звуковых, графических световых и др. с и г н а л о в. Обычно между референтом и сигналом, например, между реальной березой и буквенной или звуковой цепочкой береза нет изначальной связи. Эта связь, имеющая условный характер, устанавливается человеком в процессе его по-знания внешнего мира и общения с другими людьми. Средством, вопло-щающим эту связь, является лингвистический знак (ЛЗ). Он представляет собой психическую сущность, состоящую из о з н а ч а е м о г о, которое, отражая некоторый объект внешнего мира, замещает его в сознании челове-ка, и о з н а ч а ю щ е г о, которое есть психическое о т р а ж е н и е сигнала. Напомним, что в качестве референтов могут быть не только реально наблюдаемые и осязаемые предметы типа береза, звук, но также:

______________________________________________________________

*)В настоящей главе обобщаются идеи и результаты, содержащиеся в следующих работах автора: «Psycholinguistic Basis of the Linguistic Automaton»//International Journal of Psycholinguistics. An Interdisciplinary Journal of Human Communication, vol. 10, no. 1, 1994, pp. 15-32; Piotrowski R. Quantitative linguistics and information theory// QL, 2005, pp. 857 - 877.

 не существующие в реальности объекты  леший, квадратура круга;

 отвлечённые признаки  гносеологический, ультрафиолетовый;

 процессы и состояния  преобразование, спячка.

Как уже говорилось, единого понятийного аппарата и терминологии в семиотике пока не выработано. Поэтому приведенная на рис. 4 схема знака и обозначения его компонентов, не являются общепринятыми (ср. табл. 3). Существует немало работ, опирающихся на знаковый треугольник Пирса-Фреге, который включает три компонента: знак или имя, (наше название  с и г н а л), денотат (наше название  р е ф е р е н т) и смысл или интерпретанта (у наc  д е н о т а т и д е с и г н а т). При этом между сигна-лом и референтом задается прямая, якобы не опосредованная сознанием человекa связь типа: сторублевка ‘товар, ценой в сто рублей’. При таком подходе не учитывается основная черта человеческого сознания и коммуникации, отличающая их от "мыслительной" и коммуникативной деятельности животных и состоящая в универсальной способности человека отражать внешний мир в виде знаков, в которых установлены биологически не мотивированные, посреднические отношения значения между двумя разными объектами. Действительно, один предмет внешнего мира может стать для человека этикеткой или описанием другого объекта только тогда, когда между психическими образами этих объектов устанавливается в его мозгу определенная связь. Например, образ графического или звукового сигнала сторублёвка становится для человека именем (означающим), имеющим определённую ценность только тогда, когда этот сигнал связывает-

ся с уже увиденной им сторублёвой ассигнацией при условии, что ему разъ-яснена ценность этого куска бумаги.

Для туарега из Сахары, владеющего русским языком, но никогда не видевшего этой ассигнации или ее изображения и никогда ничего не слышавшего об этой купюре, цепочка сторублёвка остается ничего не зна-чащим графическим или звуковым сигналом. Семиотической, т.е. "посре-дническо-отражательной" функции, эта цепочка здесь не выполняет. Т.о. сущность з н а к о о б р а з о в а н и я (семиозиса) заключается в том, что в сознании человека происходит объединение двух психических образов  означаемого и означающего, причем возникший в результате этого объединения знак становится посредником между двумя изначально не связанными между собой объектами внешнего мира. В тех случаях, когда информация об объекте внешнего мира, например о солнце, передается с помощью самого предмета  взошедшего солнца, такой предмет становится сигналом самого себя.

Образование знака и его посредническую функцию формально можно представить следующим образом. Весь набор использующихся в конкретном

ЕЯ означающих будем рассматривать в качестве некоторого алфавита

A={а1, а2,... аi , аj ,... аn},

а всю совокупность означаемых  в качестве некоторого пространства рассуждений или, как принято говорить в математической логике, области интерпретации

M={m1, m2,...mi , mj ,...mn}.

Тогда ЕЯ можно представить в виде некоторой модельной системы интерпретации, включающей множество M и семиозис, реализуемый в виде отношения семантизации (отражения) R и обратного ему отношения воплощения Ro .

Таблица 3. Основные семиотические термины

Терминоло-гия, использу-емая в насто- ящей работе Терминологические соответствия у других авторов
[70. С. 146  152; 30. С. 306] [108, §§ 228, 274; VIII, § 332; 51. С. 39  142] [48. С. 218  258] и другие авторы
Знак Знак (signe) Знак (sign), опосредо- ванное (обобщённое) учитывание (mediated- -taking-account-of) Знаковое отно-шение, знаковая cитуация, монема
Референт Вещь (chose) Объект (object), денотат (denotatum) Денотат
Денотат Означаемое (signifié), транс-цедентальное означаемое Интерпретанта (interpretant) Внутренний Денотат
Десигнат   Десигнат (designaum/signification) Значение
Коннотат Окказиональные смыслы, намека-ния
Означаю- щее (имя) Означающее (signifiant), акус-тический образ (image acoustique) Внутренний знак
Сигнал Звуки (sons), письменность (écriture) Знак (sign), знаконо-ситель (sign-vehicle) Знак, экземпляр знака

Отношение семантизации соотносит с каждым именем аi из A, по крайней мере, один содержательный элемент mi из M . Используя отношение семантизации структуру ЛЗ можно представить в виде выражения

ЛЗ = ai R17 mi.

Обратное отношение  отношение воплощения связывает с каждым значением mi,по крайней мере, одно означающее ai, при этом имеем:

Л3= mi Ro17ai.

Как уже говорилось, и имена ai, и означаемые mi не являются реальными предметами внешнего мира, но лишь отражениями некоторых объектов в сознании человека. То, что mi отражает некоторый объект внешнего мира (референт ri ), выражается записью mi R+ ri . Одновременно то, что ai есть отражение акустического, графического или любого другого сигнала (или их цепочки)si,передается записью ai R+ si .Здесь R+ имеет значение `отражает', а обратное ему отношение R* означает `отражается в'. Весь цикл семиоти

ческого связывания объектов внешнего мира siи riв сознании человека можно представить в виде выражения

siR* ai R17 mi R+ ri, (2.1)

причем собственно лингвистическим знаком является центральная часть выражения (2.1)  ai R17 mi.

2.2. Знак в системе языка

Выше была дана общая схема семиозиса и соотношения ЛЗ с объекта-ми внешнего мира. При анализе этой схемы необходимо всегда иметь в виду, что РМД человека, являясь, с одной стороны, главным средством классифи-кации, систематизации и хранения информации (к л а с с и ф и к а ц и о н н о-в ы р а з и т е л ь н а я функция языка), а с другой  основным инструментом передачи информации (к о м м у н и к а т и в н а я функция), реализуется че-рез систему языка и ограничивающую его норму, и через систему речи, моде-лирующую текст сообщения. Отсюда следует,что каждый знак должен выс-тупать в виде системно-нормативного, т.е. языкового знака (ЯЗ), заданного в парадигматике языка, и в виде узуально-текстового речевого знака (РЗ), творимого в речевой синтагматике.

Говоря о референте ЯЗ, ещё раз напомним, что им могут бытьне только видимые и осязаемые вещи, но и воображаемые, реально не существующие проедметы, различные признаки, процессы и состояния. Эта разнородность референтов приводит к образованию разных типов знаков, например, предметных словесных знаков, воплощаемых в именах существительных и именных словосочетаниях, признаковых (адвербиальных, адъективальных и глагольных) знаков, сложных, синтетических знаков, например, предложений. Не имея возможности сразу охарактеризовать все эти виды ЯЗ (см. об этом ниже), мы займемся построением модели предметного ЯЗ, поскольку он имеет самое простое устройство. Эта модель послужит опорной схемой как при модели-ровании различных лингвистических знаков, так и при сравнении ЯЗ со знаками искусственных языков.

Напомним также, что изображённая на рис. 4 сетевая схема лингви-стического знака является упрощённым гипотетическим аналогом реаль-ного знакового образования, которое функционирует в нейронной сети, являющейся материальным субстратом РМД человека (см. главу 9).

Нечеткость природы лингвистических объектов 2 страница - student2.ru Нечеткость природы лингвистических объектов 2 страница - student2.ru

Рисунок 4. Знаковая ситуация: референт, сигнал, знак, его значимости и валентности

Список используемых на рис. 4 и в разделе 2.1 условных обозначений семиотических объектов

A  алфавит означающих

a  означающее (имя)

s  сигнал (звуковой или графический)

Cn  коннотат

Dn  денотат

Ds  десигнат

F  формальные отношения означающих

G  грамматическая система данного языка

Σ  система вторичной семантизации данного языка

Θ  тезаурус отправителя сообщения

M  область интерпретации

m  означаемое

r  референт (предмет)

s  сигнал

S  ситуация

St  подъязык, функциональный стиль

R  отношение, связь, интерпретация

Rº  воплощает

R+  отражает

R*  отражается, воплощается

R1  отношение означающего и сигнала

R2  отношение референта и коннотата

R3  отношение референта и денотата

R4  ассоциативная связь коннотата с другим референтом

R5  отношение референта и десигната

R6  связь тезауруса и десигната (семантическая значимость)

R7  отношение, связь грамматической системы данного языка

и десигната (грамматическая значимость)

R8  связь означающего и системы формальных средств данного языка (формальная значимость)

R9  связь означающего с другими означающими данного языка

R10  валентностные связи денотата с другими означаемыми

R11  отношение денотата к различным подъязыкам, стилям и

Нечеткость природы лингвистических объектов 2 страница - student2.ru экстралингвистическим ситуациям

R12  стилистические валентности коннотата

R13  отношение отправителя сообщения и сигнала

R14  связь между сигналом и приемником сообщения

R15  положение коннотата в системах вторичной семантизации

R16  отношение десигната и коннотата

R17  связь означаемого и означающего

R18  отношение коннотата и денотата

R19  отношение денотата и десигната

R20  связь между означаемым и десигнатом

R21  отношение, связь означаемого и денотата

R22  отношение означаемого с другими референтами

R23  отношение означаемого и коннотата.

Говоря о референте языкового знака, еще раз напомним, что им могут быть не только видимые и осязаемые вещи, но и воображаемые, реально не существующие предметы, различные признаки, процессы и состояния. Эта разнородность референтов приводит к образованию разных типов знаков,

2.2.1. Денотат и десигнат. Семиозис, т.е. выбор сигнала для обозначе-ния референта и соединения их психических отражений в знаке, производит-ся двумя способами в качестве некоторого алфавита  д е н о т а т и в н ы м и с и г н и ф и к а т и в н ы м.

При денотативном приеме называния объекта внешнего мира и его целостное чувственное отражение в сознании человека связываются с произвольно взятым сигналом-именем. Пример такого приема  присвоение имен собственных, не имеющих прозрачной внутренней формы и метафо-рических ассоциаций (Анна, Василий), а также употребление иноязычных заимствований для обозначения новых реалий (ср. импичмент< англ. impeachment, абзац < нем. Absatz, эхо < фр. écho < греч. ’hcw¢).

При сигнификативном способе выражения применяется такой сигнал-имя, который в своем семантико-синтаксическом построении (внут-ренней форме) отражает концепт (k), т.е. смысловую детерминанту рефе-рента-означаемого. Так, референт, обозначенный с помощью сигнала абзац, может быть выражен с помощью ЛЕ отступ и красная строка, а слово эхо заменено прозрачными в своей внутренней форме ЛЕ отголосок, отзвук, отклик, отраженный звук.

Существование двух видов отношений между именем и означаемым позволяет выделить в последнем по крайней мере два самостоятельных компонента. Первый из них, именуемый денотатом (Dn) (рис. 4), пред-ставляет собой целостное, не расчленяемое сознанием на составляющие его части отражение  гештальт (образ) референта. Этим референтом может быть единичный объект внешнего мира (реальная единичная береза), либо обобщенно-типизированный образ целого класса объектов (береза "вообще"). Связь этого гомогенного образа с отражениями других референтов здесь никак не фиксируется. Если означаемое выступает в виде денотата, то сигнал-имя является этикеткой этого денотата, отражающего в сознании человека референт. При этом выражение (2.1), характеризующее знаковое соотношение сигнала и референта, принимает следующий вид:

siR*1 аiR2 Dn R21 R3ri. (2.2)

Применительно к контрольному примеру, показанному на рис. 4, запись (2.2) следует читать так:

"графическое слово береза отражается в психическом образе-означающем БЕРЕЗА, обозначающем денотат ‘береза’, который является целостным, нерасчлененным отражением референта <<дерева-березы>>".

Второй компонент, выделяемый в означаемом, называется десигнатом

(Ds), иначе  сигнификатом или смыслом (табл. 3). С этой семиотической единицей означающее связано отношением Rs4. Десигнат выражает через концепт или совокупность концептов (и н т е н с и о н а л) сущность ре-ферента. (В роли последнего выступает обычно целый класс предметов, обладающих соответствующим признаком или признаками). Вся цепочка сигнификативной семантизации, связывающая сигнал с референтом, записывается следующим образом:

siR1 aiR17 R20 Ds (k) R5ri(2.3)

Отношение между денотатом и десигнатом, разъясняющее роль десигната по отношению к денотату-гештальту, называется э к с п л и к а ц и е й. Вся цепочка, описывающая это отношение имеет вид

Ds (k) R19 Dn.

Символ R19 может быть представлен в виде выражения q(f(x)), отражающего внутризнаковую номинацию и традиционно именуемого с е м и о т и ч е-

с к о й ф у н к ц и е й. Словесно это расшифровывается следующим образом:

x  аргумент, иными словами, то, о чем говорится (в нашем случае  целостный образ референта или денотат),

f  предикат, т.е. то, что говорится об x, в нашем случае  это анали-тическое отображение референта, т.е. десигнат,

q  некоторые дополнительные операции.

Семиотическая функция легко, без всяких дополнительных операций, обнаруживается через прозрачную внутреннюю форму таких слов и словосочетаний, как отступ, отголосок, отзвук, отраженный звук. Что касается ЯЗ абзац, эхо, береза, то в современном языке их внутризнаковая номинация, казалось бы, полностью забыта. Однако она может быть, с одной стороны, восстановлена с помощью операции этимологизации (q). Так, срав-нительная фонетика и семантика индоевропейских языков показывает, что для знака <<береза>> древним концептом было понятие ‘белый, светлый’. Об этом говорит родство русск. береза (польск.. brzoza, лит. berzas) с алб. bardh ‘белый’, гот. bairths ‘светлый, блестящий’ [76, c. 155].

Наши рекомендации