Глава 3. проблема минимизации текста
В настоящее время в экспертизе авторства текстов используются в основном методы анализа формальные характеристик письменной речи. Эти характеристики представляют собой показатели частоты встречаемости тех или иных единиц речи в исследуемом тексте. Лингвистическая природа, количество и уровень организации формальных характеристик могут быть самыми различными. К их числу относятся, например: характеристики лексического богатства текстов, выражающиеся через показатели отношений различных слов ко всем славам данного текста; относительная распространенность различных частей речи в данном тексте; средняя длина предложений и пр.
Что же касается количества используемых при атрибуции формальных характеристик, то и здесь диапазон достаточно широкий. Так, харьковские исследователи выделяют до 63-х формальных характеристик: от сравнительно простых (относительное число знаменательных слов в тексте) до достаточно сложных (частотность определенных грамматических конструкций в тексте)1.
Теоретическим основанием для использования формальных характеристик в целях атрибуции является стохастическая (вероятностная) модель порождения речевого высказывания. Как следствие подобного рассмотрения процессов речепорождения возникает вопрос минимизации атрибутируемого текста. Действительно, с возрастанием объема (длины) текста частота того или иного речевого элемента стабилизируется. И тогда те частотные показатели, которые характеризуют организацию речевых элементов у данного индивида, в конечном счете могут быть выявлены. (Примером тому служат вычисленные показатели лексического богатства, например, языка А. С. Пушкина.)
Иными словами, принцип индивидуализации речевого опыта, речевого общения позволяет предположить, что указанные показатели будут сугубо индивидуальны и могут служить в качестве идентификационных признаков. Но это справедливо лишь при условии достаточного по объему текста данного автора. Но какова «достаточность» объема речевого массива для вывода о возможном авторстве, пока неясно. Это осложняется тем обстоятельством, что различные исследователи используют совершенно различные характеристики при анализе письменной речи.
Характерно, что вопрос о минимальном объеме атрибутируемого текста ставился еще в начале текущего столетия отечественными исследователями2. Используя сравнительно немного формальных характеристик, А. А. Марков, Н. А. Морозов пришли к выводу, что объем исследуемого теиста должен быть порядка нескольких тысяч слов. Исследования последнего времени, где используется современный математический аппарат, показали, что минимальный объем текста при атрибуции должен быть не менее пяти тысяч слов3.
Но эксперты-криминалисты при проведении экспертиз по атрибуции текста практически никогда не располагают текстами такого объема. При анализе текстов меньших по объему (порядка нескольких сот слов), как показали последние исследования4, формальные характеристики непригодны, поскольку они очень изменчивы. Однако уже появилась возможность преодолеть и эти трудности. Эта возможность основана на использовании принципов, имеющих психологический и психолингвистический характер.
Установлено, что при условии нормального развития речевого навыка человек, как правило, адекватно воспринимает речевую информацию даже в случае ее частичного искажения или неполного представления. Например, в условиях сравнительно плохой слышимости часть сообщения может быть не воспринята, однако смысл его все же осознается. Эти и другие наблюдения дают основания считать, что известное в психологии явление «константности восприятия» (исследованное главным образом в сфере зрительного восприятия) имеет место и в сфере речевой деятельности. На это указывают, в частности, результаты исследований частотных измерений элементов речи. Так, например, показано, что субъективная оценка частоты встречаемости тех или иных слов при определенных условиях эксперимента хорошо согласуется с объективной частотой распространенности этих слов, полученной из частотных словарей5.
Выводы, следующие из предположения о константности восприятия речевой информации, весьма перспективны для обсуждаемой проблемы. Речь идет о возможности разработки метода атрибуции на основе не самих формальных характеристик письменной речи, а на основе их субъективных образов, которые менее изменчивы. Психолингвистические и математико-статистические процедуры к настоящему времени достаточно разработаны, для того чтобы осуществить эту попытку. Получены определенные результаты в исследованиях по атрибуции с применением методов анализа психологических образований в процессе восприятия речевой информации. Эти вопросы интенсивно и детально разрабатываются как у нас, так и за рубежом. У нас предпринято исследование по атрибуции опорных текстов М. Е. Салтыкова-Щедрина. Положительные результаты получены и в зарубежных исследованиях 6. Все это дает основания оптимистически оценивать возможность применения подобных методов в автороведческих экспертизах.
1 С. М. В у л. Об использовании признаков письменной речи в криминалистической экспертизе письма, автореф. канд. дисс., Харьков, 1975.
2 Н. А. Морозов, Лингвистические спектры,—«Известия отделения русского языка и словесности», т. 20, кн. 4, 1915; А. А. Марков. Пример статистических исследований над текстом «Евгения Онегина», иллюстрирующих связь испытаний в цепь,— «Известия Императорской Академии наук», серия 6, 1913, т. 7, № 3.
3 Е. В о р о и ч а к, Методы вычисления показателей лексического богатства текстов,— «Семиотика и искусствометрия», сборник переводов, М., 1972.
4 В. И. Б а т о в, Ю. А. Сорокин, Атрибуция текста на основе объективных характеристик (итоги эксперимента),—«Известия АН СССР», серия литературы и языка, 1975, т. 34.
5 Р. М. Ф р у м к и н а, Вероятность элементов текста и речевое поведение, М., 1971.
6 Д. Б. К э р о л л, Факторный анализ стилевых характеристик прозы,— «Семиотика и искусствометрия», сборник переводов, М, 1972.