Стохастические модели порождения речи
Стохастическая модель ( СНОСКА: От греч. stochastikos — умеющий угадывать, вероятностный ) была предложена в начале 60-х гг. прошедшего столетия Дж. Миллером и Н. Хомским, которые исходили из того положения, что язык может быть описан как «конечное число состояний» его элементов. Они считали, что речь (речевые процессы) можно интерпретировать как такую последовательность элементов, где появление каждого нового элемента речевой цепи зависит от наличия и вероятности появления предшествующих элементов. Так, авторами этой «модели» утверждается, что «каждый пятый элемент имеет вероятность появления, зависимую от появления четырех предшествующих элементов» (321, с. 423).
Из различных стохастических моделей более приемлемыми для психолингвистического анализа процесса речепорождения А. А. Леонтьев считает т. н. «марковские» модели. В такой модели в качестве основной единицы выступает не отдельный элемент (например, фонема или слово), а определенная последовательность элементов (например, цепочка из нескольких слов); при этом моделируется вероятностная характеристика их появления в речевом высказывании (РВ).
В прикладной психолингвистике проведен целый ряд экспериментов, в которых было показано, что процесс порождения речи обязательно предполагает использование вероятностного принципа и, в частности, скрытого знания испытуемым условных (зависящих от появления предыдущих элементов) вероятностей появления каждого нового элемента высказывания. Психологическое задействование вероятностного механизма в порождении речевых высказываний можно считать полностью доказанным (А.А.Леонтьев, 1969, 1970; [123, 126|). Очевидным является и то, что в интеллектуальной рече-мыслительной деятельности человека имеется механизм субъективной оценки вероятности слов и других элементов, которая вполне достаточно хорошо «коррелирует» (соотносится) с объективной вероятностью появления этих элементов в тексте (Р. М. Фрумкина [246J и др.).
Экспериментальные исследования показывают тесную связь вербальных (словесных) ассоциаций и процесса порождения связной речи (243).
Один из вариантов стохастических моделей — это так называемые «грамматики с конечным числом состояний». Это любая модель, в которой в качестве элемента выступает грамматический класс слов (например, та или иная часть речи) и определяется характер зависимости между последовательно появляющимися грамматическими классами. В практике психолингвистического исследования рассматриваются именно вероятностные модели с конечным числом состояний. Особенно часто исследуются вероятностные зависимости между словами разных грамматических классов, выявляющиеся в словесном ассоциативном эксперименте (139, 286 и др.).
По Ч. Осгуду, процесс порождения речи осуществляется параллельно на нескольких уровнях — по собственным (в том числе вероятностным) закономерностям каждого уровня. При этом закономерности распределения единиц высших уровней учитывают закономерности распределения единиц низших уровней. На «верхнем» уровне, уровне мотивации, единицей, в отношении которой субъектом РД принимается решение, является предложение (высказывание). На втором, семантическом уровне единицей (в процессе кодирования) является «функциональный класс», а в процессе декодирования — «нуклеус». Определение функционального класса впервые было дано Л. В. Щербой, который назвал соответствующую единицу «фразой». По определению Л. В. Щербы фразы есть «...простейшие элементы связной речи, отвечающие единым и далее в момент речи неразлагающимся представлениям» (274, с. 21). Позднее Л. В. Щерба и В. В. Виноградов предложили вместо этого определения понятие «синтагма» (276, 43). В хрестоматийным примере: Талантливый художник пишет интересную картину (А. А. Леонтьев, 1969, 1997 и др.) — единицами кодирования (функциональными классами, по Ч. Осгуду), являются: талантливый художник — пишет — интересную картину.
Нуклеус (от лат. nucleus — ядро) представляет собой ту часть слова, которая в отечественной школе языкознания определяется как основа слова — словоформа минус морфосинтаксические грамматические элементы — флексии (окончания). В приведенном примере разделение по нуклеусам выглядит следующим образом: «Талантлив-ый — художник — пиш-ет — интересн-ую — картин-у.
На третьем уровне, «уровне последовательностей», единицей является фонетическое слово, а на четвертом, «интеграционном», — соответственно слог (выполняющий функцию кодирования) и фонема {декодирование).
Как считает А. А. Леонтьев, вероятностные модели «работают» только на взаимоотношениях отдельных слов в процессах порождения связной речи; для моделирования процессов грамматического оформления речи они не приемлемы (123, 139). Это касается и моделей «грамматик с конечным числом состояний». Во многом, это определяется следующим. Во-первых, в языке существуют определенные типы грамматических конструкций, которые не могут быть порождены при помощи грамматики с конечным числом состояний. Это так называемые «самовставляющиеся», а также — «гнездующиеся» предложения, которые в русской грамматике соответствуют сложноподчиненным предложениям. Во-вторых, такая модель не объясняет закономерности процесса овладения языком. Согласно этой теории, для того чтобы обучиться производить речь «в последовательности, построенной по принципу «слева направо» (S — Р — О), ребенок должен прослушать огромное количество — 2100 предложений на родном языке, прежде чем сам сможет самостоятельно создавать высказывания. Критики этой теории отмечают, что для этого не хватит и десяти жизней (167, с. 158-159 и др.)
Несмотря на «известную ограниченность», «стохастические модели» речепорождения по некоторым своим концептуальным составляющим могут, как считает А. А. Леонтьев, найти применение в современной психолингвистике (139, с. 89). В частности, в речевой деятельности человека «...есть коммуникативные ситуации, для моделирования которых может оказаться оптимальной именно грамматика с конечным числом состояний. Это, например, детская речь в том периоде ее развития, когда словарь уже усвоен, а грамматика в строгом смысле (морфосинтаксис) еще отсутствует. Это спонтанная жестово-мимическая речь глухонемых, автономная речь, креолизованные жестовые языки, используемые для межэтнического общения народами, говорящими на различных языках, и др.» (там же, с. 89). «Стохастические модели» применимы и для моделирования разговорной речи (А. А. Леонтьев, А. С. Маркосян, 139, 164).