Квантитативные исследования в области стилистики.

Квантитативные исследования в области стилистики.

Лекции:

Лексическое богатство текста, то есть отношение числа слов к объему текста.

Количество различных слов в тексте – объем словаря.

Объективные методы оценки текстов.

Изучение функциональных стилей, отношение количества разных лексем к объему текста

L\N это индекс лексического богатства, индекс TTR (token type relation), то есть словоформа, лексема, отношение к объему словаря.

L – лексемы, N – объем текста

При сравнении лексического богатства текста, нужно учитывать, что тексты должны быть одинакового объема. Это условие одинаковых объемов текстов.

Рассмотрим отношение числа одноразовых слов к объему словаря или текста

Если большое число слов с частотой 1 (чтобы избежать повторений, показывает объем большой лексики), не является эстетическим критерием.

Особенности методов гуманитарного познания

1.неточность, расплывчатость понятий и определений.

2.преобладание качественных характеристик основных объектов.

3.ограниченная возможность проведения эксперимента.

4.большой объем исходной информации.

Идеостиль - Система смыслов художественного текста, отражающих концептуальную картину мира автора.

Авторское употребление единиц языка, индивидуальное употребление.

-система способов репрезентации доминантных, личностных смыслов.

Формализованные блоки информации

Автоматизированная (автоматическая) обработка текста

-машинный перевод

-реферирование (аннотирование) текста

-информационный поиск

Задача в формализации текстового анализа

Насколько набор самых частотных слов позволяет отличить одного автора от другого

1.статистические методы сводят до минимума субъективизм исследователя, количественно оценить результат и проверить степень достоверности

2.чем больше по объему текст, тем объективней результат исследования

-низкая повторяемость элементов увеличивает статистический прогресс

-при создании большого текста труднее подменить авторство, вероятность стилизации уменьшается

3.количественно исследование текстов (идеостиль автора) становится более объективным, если имеет сравнительный характер.

Лексические универсалии

Суммарный лингвистический портрет автора.


Изучение поэтического и непоэтического стилей может основываться на статистических методах; более того, возможно проводить соответствующие исследования на основе особых форм (параметров), которые языковые законы принимают в текстах различных стилей. В таких случаях квантитативная лингвистика проводит исследование в стилистике: одна из итоговых целей — доказать настолько объективно, насколько это возможно, по крайней мере в одной области действий существование стилистического феномена, ссылаясь на действие языкового закона. Одно из главных предположений квантитативной лингвистики состоит в том, что некоторые законы (например, закон распределения длин слов) требуют различных моделей, по крайне мере различных значений параметров закона (распределений или функций), в зависимости от типа текста, к которому принадлежит этот текст. Если изучаются поэтические тексты, то методы квантитативной лингвистики образуют поддисциплину, которая называется «Квантитативное изучение литературы»

Исследование авторского и функционального стиля, установление авторства произведения - возможности применения статистических методов для исследования свойств текста безграничны, а потребности изучения различных единиц текста чрезвычайно велики. Свойства и отличительные особенности текстов могут быть исследованы с учетом различных параметров и признаков: хронологические, тематические, жанровые, социальные, гендерные, статусные, возрастные, лексические, морфологические, синтаксические и др. количественные характеристики текста и употребляемых в нем единиц.

Конспект

Индекс лексического богатства – отношение количества разных словоформ или лексем к объему текста. Обозначается TTR – token/type relation (ratio).

Прямое сравнение индексов двух текстов возможно только при условии их одинакового объема. Индекс не является эстетическим критерием.

mF – число слов с F частотой встречаемости.

Отличия текстов гуманитарной направленности от технических:

· неточность, размытость понятий

· преобладание качественных характеристик объектов

· ограниченность возможности проведения экспертизы

· большой объем исходной информации

Идиостиль – представление о системе смыслов художественного текста, отражающей концептуальный мир автора. Система способов репрезентации доминантных смыслов концептуальной картины мира автора.

В задачи автоматической обработки текста входят:

· машинный перевод

· автоматизированное реферирование текста

· информационный поиск

Задача лингвиста состоит в формализации текстового анализа.

При исследовании стилистики статистические методы позволяют:

1) свести до минимума субъективизм исследователя, количественно оценить результат и определить его достоверность;

2) чем больше объем текста – тем объективнее результат анализа;

3) количественное исследование текста становится более объективным, если оно имеет сравнительный характер.


Наши рекомендации