Квантитативные исследования в области стилистики.
Квантитативные исследования в области стилистики.
Лекции:
Лексическое богатство текста, то есть отношение числа слов к объему текста.
Количество различных слов в тексте – объем словаря.
Объективные методы оценки текстов.
Изучение функциональных стилей, отношение количества разных лексем к объему текста
L\N это индекс лексического богатства, индекс TTR (token type relation), то есть словоформа, лексема, отношение к объему словаря.
L – лексемы, N – объем текста
При сравнении лексического богатства текста, нужно учитывать, что тексты должны быть одинакового объема. Это условие одинаковых объемов текстов.
Рассмотрим отношение числа одноразовых слов к объему словаря или текста
Если большое число слов с частотой 1 (чтобы избежать повторений, показывает объем большой лексики), не является эстетическим критерием.
Особенности методов гуманитарного познания
1.неточность, расплывчатость понятий и определений.
2.преобладание качественных характеристик основных объектов.
3.ограниченная возможность проведения эксперимента.
4.большой объем исходной информации.
Идеостиль - Система смыслов художественного текста, отражающих концептуальную картину мира автора.
Авторское употребление единиц языка, индивидуальное употребление.
-система способов репрезентации доминантных, личностных смыслов.
Формализованные блоки информации
Автоматизированная (автоматическая) обработка текста
-машинный перевод
-реферирование (аннотирование) текста
-информационный поиск
Задача в формализации текстового анализа
Насколько набор самых частотных слов позволяет отличить одного автора от другого
1.статистические методы сводят до минимума субъективизм исследователя, количественно оценить результат и проверить степень достоверности
2.чем больше по объему текст, тем объективней результат исследования
-низкая повторяемость элементов увеличивает статистический прогресс
-при создании большого текста труднее подменить авторство, вероятность стилизации уменьшается
3.количественно исследование текстов (идеостиль автора) становится более объективным, если имеет сравнительный характер.
Лексические универсалии
Суммарный лингвистический портрет автора.
Изучение поэтического и непоэтического стилей может основываться на статистических методах; более того, возможно проводить соответствующие исследования на основе особых форм (параметров), которые языковые законы принимают в текстах различных стилей. В таких случаях квантитативная лингвистика проводит исследование в стилистике: одна из итоговых целей — доказать настолько объективно, насколько это возможно, по крайней мере в одной области действий существование стилистического феномена, ссылаясь на действие языкового закона. Одно из главных предположений квантитативной лингвистики состоит в том, что некоторые законы (например, закон распределения длин слов) требуют различных моделей, по крайне мере различных значений параметров закона (распределений или функций), в зависимости от типа текста, к которому принадлежит этот текст. Если изучаются поэтические тексты, то методы квантитативной лингвистики образуют поддисциплину, которая называется «Квантитативное изучение литературы»
Исследование авторского и функционального стиля, установление авторства произведения - возможности применения статистических методов для исследования свойств текста безграничны, а потребности изучения различных единиц текста чрезвычайно велики. Свойства и отличительные особенности текстов могут быть исследованы с учетом различных параметров и признаков: хронологические, тематические, жанровые, социальные, гендерные, статусные, возрастные, лексические, морфологические, синтаксические и др. количественные характеристики текста и употребляемых в нем единиц.
Конспект
Индекс лексического богатства – отношение количества разных словоформ или лексем к объему текста. Обозначается TTR – token/type relation (ratio).
Прямое сравнение индексов двух текстов возможно только при условии их одинакового объема. Индекс не является эстетическим критерием.
mF – число слов с F частотой встречаемости.
Отличия текстов гуманитарной направленности от технических:
· неточность, размытость понятий
· преобладание качественных характеристик объектов
· ограниченность возможности проведения экспертизы
· большой объем исходной информации
Идиостиль – представление о системе смыслов художественного текста, отражающей концептуальный мир автора. Система способов репрезентации доминантных смыслов концептуальной картины мира автора.
В задачи автоматической обработки текста входят:
· машинный перевод
· автоматизированное реферирование текста
· информационный поиск
Задача лингвиста состоит в формализации текстового анализа.
При исследовании стилистики статистические методы позволяют:
1) свести до минимума субъективизм исследователя, количественно оценить результат и определить его достоверность;
2) чем больше объем текста – тем объективнее результат анализа;
3) количественное исследование текста становится более объективным, если оно имеет сравнительный характер.