Методы лингвистического исследования
Лингвистические методы не представляет собой единого набора принципов и способов исследования и описания языковых сущностей. Скорее это некоторое «меню» взаимодополняющих и/или взаимоисключающих методов, используемых в различных комбинациях и в различных пропорциях в частных лингвистиках и в конкретных лингвистических исследованиях. Более того, этот набор не является постоянным. Непрерывно происходит его обогащение, изменяется также отношение к тем или иным методам: в различные исторические периоды и в различных научных школах один и тот же метод может быть доминирующим в лингвистической практике или же, напротив, научно дискредитированным. Дать исчерпывающее перечисление лингвистических методов для всех «частных лингвистик» и для всех научных парадигм не представляется возможным. Ограничимся, прежде всего, методами, направленными на решение проблем описательной и теоретической лингвистики, и будем исходить из некоторого обобщенного представления о современном состоянии лингвистики и ее методических предпочтений.
Индукция и дедукция.Известно логическое противопоставление индуктивного и дедуктивного методов исследования. В эмпирических науках, к которым относится и лингвистика, это противопоставление связано с противоречием между природой изучаемого объекта (сущностью) и имеющимся в распоряжении исследователя эмпирическим материалом (фактами). Как уже было замечено выше, объект лингвистики – язык – не дан исследователю в непосредственном наблюдении. Наблюдаемым эмпирическим материалом исследователя являются косвенные свидетельства о языке, а именно – продукты языковой деятельности (языковые выражения).
Количество единичных языковых фактов бесконечно, поэтому сбор всех фактов является принципиально неразрешимой задачей и не может быть конечной целью исследования. Факты необходимы исследователю лишь как носители сущностных свойств языка, так как бесконечное множество фактов есть реализация конечного и весьма ограниченного множества стоящих за ними сущностей. Таким образом, целью лингвистики является обнаружение этих сущностей и описание бесконечного множества наблюдаемых фактов через обращение к этим сущностям.
Процесс научного исследования в такой ситуации может быть двунаправленным: от фактов к сущностям или от сущностей к фактам. Индуктивный метод организации научного процесса в целом состоит в сборе и документации конкретных явлений (фактов) с последующим их обобщением и переходом от фактов к лежащим в их основе сущностям. Дедуктивный метод в качестве отправного пункта предполагает, напротив, основанное на определенных допущениях постулирование сущностей и проверку реальности этих сущностей их соответствием (или несоответствием) наблюдаемым фактам.
В реальной лингвистической практике применение индуктивного или дедуктивного метода в чистом виде невозможно, хотя определенное предпочтение того или иного метода в конкретных научных школах наблюдается нередко. Наиболее продуктивным, скорее всего, является цикличное применение дедуктивного и индуктивного метода с последовательным уточнением представления об изучаемом объекте. А именно, на начальной стадии дедуктивно выдвигаются некоторые гипотезы о языковых сущностях, которые затем индуктивно проверяются в процессе эмпирической работы с наблюдаемым языковым материалом и индуктивных обобщений. Как правило, при этом обнаруживается определенное (порою значительное) несоответствие постулированных сущностей и индуктивно полученных обобщений. Это требует на очередном цикле новых дедуктивных построений и их последующей индуктивной проверки.
Эвристические методы.Эвристические методы связаны со сбором и документацией фактов. Сам процесс получения фактов может быть пассивным или активным. Метод пассивного наблюдения (иначе именуемый регистрационным) предпочитается тогда, когда необходимо получить максимально достоверный языковой материал, независимый от воли исследователя и процесса извлечения языковых данных. Таким материалом является спонтанная речь носителей языка в естественной коммуникативной ситуации. Исследователь является лишь регистратором этой речи или использует ранее зафиксированную речь (например, письменные тексты). Широко распространенной практикой является использование примеров из литературных текстов, однако в целом данный метод не обеспечивает абсолютной чистоты языкового материала, поскольку письменные литературные тексты создаются в искусственной коммуникативной ситуации, когда автор текста имеет возможность обдумывать и изменять написанный текст. Первичной формой реализации языковой деятельности является спонтанная и, прежде всего, диалогическая речь. В последние десятилетия технические средства автоматической фиксации устной речи предоставили исследователям неограниченный доступ к таким фактам; особенно значительный их объем был собран японскими исследователями, принадлежащими так называемой «школе языкового существования» (см. ЯЗЫКОВОГО СУЩЕСТВОВАНИЯ ШКОЛА). Кроме того, новые компьютерные технологии создали условия для появления так называемой корпусной лингвистики, являющейся инструментальным средством усиления пассивного метода, позволяющим обследовать огромные массивы текстов и извлекать из них нужные факты.
Активный (он же экспериментальный) метод состоит в применении всевозможных процедур, управляющих речевым поведением говорящего, с целью получения необходимых исследователю фактов. Например, при изучении словоизменения или словообразования может использоваться парадигматический опрос, предъявление определенным образом модифицированных или специально сконструированных предложений для проверки их грамматической правильности или грамматической интерпретации, предъявление некоторого контекста с предложением его продолжить, перевод с языка-стимула на исследуемый язык и т.д. В качестве стимула для речевого действия могут предъявляться различные объекты или ситуации реального мира: предметы и комбинации предметов, действия с предметами, картинки, фрагменты видеофильмов или компьютерных фильмов – с целью вербального описания испытуемым этого стимула и т.д. Экспериментальный метод является ведущим в психолингвистике и полевой лингвистике.
Интроспективный метод используется, когда языковые факты исследователь не регистрирует, а создает сам, используя себя как носителя языка.
В последние десятилетия в лингвистике все более активно используются различные инструментальные методы. Классической областью их применения (еще с конца 19 в.) является экспериментальная фонетика, в которой исследование осуществляется с помощью различных приборов, фиксирующих артикуляторные и акустические параметры звуковых последовательностей. Весьма разнообразной является инструментальная технология и в психолингвистике. Современные компьютерные технологии позволяют также расширить эмпирическую базу лингвистики.
Метод моделирования является важным компонентом дедуктивного подхода к языку. Моделирование в общем случае является особенно эффективным средством изучения объектов, не данных в непосредственном наблюдении; язык как раз и относится к их числу. Модель в идеале является теоретическим конструктом, отражающим сущностные свойства исследуемого объекта. Проверка адекватности модели объекту осуществляется экспериментально: модель должна вести себя как оригинал в тождественных условиях.
В 1960–1980-е годы весьма популярным был редукционистский вариант метода моделирования, известный как кибернетический метод «черного ящика». Под «черным ящиком» понимается объект, чье реальное внутреннее устройство в принципе не может быть изучено. Метод «черного ящика» исходит из презумпции существования функционально тождественных объектов разной материальной природы и, что особенно существенно, презумпции принадлежности языка именно к такого рода объектам. Метод «черного ящика» оправдывает себя для описания сравнительно элементарных объектов, однако язык к таковым не относится. Поэтому в лингвистике моделирование должно учитывать собственную природу естественного языка.
Описательные методы.В лингвистике используются различные способы представления языковых сущностей и фактов. Традиционная (в том числе структурная) лингвистика исходит из презумпции, что язык состоит из иерархически упорядоченных дискретных сущностей (языковых единиц), каждая из которых обладает уникальным набором признаков (свойств) и образует особый класс, соотносимый по определенным правилам с бесконечным множеством наблюдаемых фактов. Например, в языке на уровне слов выделяются лексические классы, именуемые частями речи – это существительное, глагол, прилагательное и т.д. Каждая часть речи характеризуется множеством грамматических категорий (например, падежа и числа для существительных), которые в свою очередь характеризуются множеством значений (именительный, родительный, винительный и т.д. для падежа, единственное и множественное для числа). Значения грамматических категорий также часто являются множеством более частных значений (например, именительный подлежащего, именительный именного сказуемого и т.д.).
Такое описание языка, называемое таксономическим, по существу является особого рода классификацией, к которой предъявляются определенные требования. Таксономическое описание предполагает установление классов языковых единиц и связей, существующих между ними. Языковые единицы определяются посредством системы необходимых и достаточных признаков. Эта система признаков должна быть максимально полной, т.е. покрывать все объекты, входящие в данный класс, и в то же время максимально узкой, т.е. исключать все объекты, в данный класс не входящие.
В рамках структурной парадигмы к описанию предъявляется требование полноты, т.е. выделения всех сущностей, имеющихся в языке или в его компоненте. Например, на уровне падежей – определение всех падежей, входящих в систему именного склонения или всех словоформ спрягаемого глагола. Если классы в множестве определяются по нескольким основаниям, то обнаружение классов основывается на методе исчисления. Например, максимальное множество словоформ глагола есть результат перемножения всех значений всех сочетающихся словоизменительных грамматических категорий глагола. В полном описании должны быть выделены все реальные элементы этого множества. Например, в русском языке выделяется три времени и два вида, т.е. максимальное число классов, различимых по этому основанию, равно шести. Однако один из классов в русском языке отсутствует (настоящее время совершенного вида). В языках, где глагол различает много категорий, обнаружение всех классов словоформ без использования метода исчисления часто приводит к неполному описанию, так как редко встречающиеся словоформы могут не встретиться исследователю в текстовой выборке.
Наряду с таксономическим возможно и так называемое динамическое описание, к которому предъявляется требование описать все правила, порождающие правильные языковые выражения и только их. Такой тип описания представлен, в частности, в порождающей грамматике или в модели «смысл текст». Он исходит из презумпции, что язык – это не просто свод языковых единиц, но и некоторый механизм, создающий последовательности этих единиц, соответствующих наблюдаемым языковым выражениям. Наряду с классификацией языковых единиц в таком описании описывается процедура вывода правильных языковых выражений. В динамическом описании значительное внимание уделяется языковым правилам.
Для всякого описания стоит проблема адекватности описания объекту. Описание обобщает представительный материал некоторой конечной выборки данных, которую оно в идеале должно описывать адекватно. Проверка адекватности осуществляется на дополнительной контрольной выборке. Если описание удовлетворяет произвольной контрольной выборке, то с определенной вероятностью можно полагать, что описание адекватно. В противном случае необходима модификация описания и проверка на новой выборке и т.д.
Объяснительные описания.Таксономические и динамические описания отвечают на вопрос, как устроен язык. В последние десятилетия к описанию предъявляется также требование объяснения того, почему язык устроен именно таким, а не другим образом. Такие описания называются объяснительными.
Объяснения могут быть внутриязыковыми (обращение к системным или историческим факторам, в частности, объяснения через аналогию, через процессы языковых контактов; к ареальным или генетическим связям исследуемого языка; к типологическим закономерностям) и внеязыковыми (например, апелляция к когнитивным структурам и механизмам; к устройству внеязыковой действительности; к социальным, психическим, культурным факторам). Возможности объяснительного подхода еще далеко не исчерпаны, и в настоящее время идет активная его разработка. Очевидно, что именно в рамках этого подхода лингвистика вплотную приближается к пониманию своего объекта.
Метод реконструкции.В исторической лингвистике важнейшим является метод реконструкции прежних языковых состояний. Этот метод наиболее разработан применительно к фонетической стороне языковых выражений. Он опирается на презумпцию строгой закономерности фонетических изменений, распространяемых на весь лексикон языка. При внешней реконструкции используются данных генетически родственных языков, при внутренней реконструкции объектом наблюдения являются данные одного языка.
Прикладная лингвистика
Итак, лингвистику условно принято подразделять на теоретическую, иногда ее еще называют «научная лингвистика», или «теория языкознания» (в рамках этого направления рассматриваются различные научные концепции, лингвистические теории, лингвистические школы, язык с точки зрения его структуры и систем), и прикладную (практическую) лингвистику, которая в наиболее общем виде определяется как деятельность по приложению научных знаний об устройстве и функционировании языка в различных нелингвистических научных дисциплинах, в различных сферах практической деятельности человека, а также теоретическое осмысление такой деятельности.
Это широкое понимание термина «прикладная лингвистика»; наряду с ним существует и ряд более узких, которые, при этом, сильно различаются в разных научных и национальных традициях (в российской и в западной, например). Например, в западной лингвистике (applied linguistics, angewandte Linguistik) он связывается прежде всего с преподаванием иностранных языков, включая методику преподавания, особенности описания грамматики для учебных целей, преподавание языка как родного и иностранного и т.д. Например, институт в Дублине, носящий название School of Applied Languages фактически представляет собой языковой институт. Появился же этот термин в западной лингвистике в начале двадцатого века, в 1920 годах.
В СССР термин прикладная лингвистика стал широко употребляться в 50-е гг. в связи с разработкой компьютерных технологий и появлением систем автоматической обработки информации (систем машинного перевода, систем информационного поиска, автоматизированных систем обработки текста и пр.). Именно поэтому в русскоязычной литературе вместо термина «прикладная лингвистика» в том же значении часто используются термины «компьютерная лингвистика», «вычислительная лингвистика», «автоматическая лингвистика», «инженерная лингвистика»; между тем отождествление этих дисциплин не вполне удачно, поскольку каждая из них имеет свой предмет и методы работы в рамках прикладной лингвистики как более широкого направления.
В. А. Звегинцев, обсуждая соотношение между теоретической и прикладной лингвистикой, писал, что «под прикладной лингвистикой чаще всего понимают все виды автоматической обработки речевой информации (Language-data Processing) — машинное распознавание устной речи, машинный перевод, автоматическую классификацию технических и иных документов, автоматическое аннотирование текстов, автоматическое кодирование и пр. Но все же было бы неправильно замыкать прикладную лингвистику в пределах данной проблематики».
В настоящее время наибольшей популярностью пользуется именно широкий взгляд на проблематику прикладной лингвистики. Широта проблематики объясняет «способность» прикладной лингвистики существенно увеличивать и активизировать «контакты лингвистики с самыми различными науками». Междисциплинарные исследования функционирования языка оказывают решающее влияние на лингвистическую теорию, способствуя обновлению концептуального аппарата современного языкознания.
В настоящее время прикладная лингвистика понимается как деятельность по приложению научных знаний об устройстве и функционировании языка в нелингвистических научных дисциплинах и в различных сферах практической деятельности человека, а также теоретическое осмысление такой деятельности.
Объект исследования прикладной лингвистики – анализ языка в его естественном состоянии в процессе использования людьми в различных ситуациях общения, а также анализ того, как особенности языка могут быть сформулированы.
Предмет исследования прикладной лингвистики – конструктивное познание системных принципов устройства языка, разработка и совершенствование структурных и формальных методов анализа и описания языка.
Связь прикладной лингвистики с общим языкознанием
Изначально прикладная лингвистика реализовывала идеи и теории общего языкознания. В наши дни, однако, существует следующее разделение: классические лингвистические исследования занимаются описанием и изучением языка на уровне прямого наблюдения (например, восприятия речи и речепроизводства), а прикладная лингвистика занимается предельной детализацией языка на уровне трудно-наблюдаемых и ненаблюдаемых лингвистических объектов (например, морфемный уровень, синтаксический уровень).
Первая методологическая функция прикладной лингвистики по отношению к теоретическому языкознанию состоит в выработке критериев истинности в ходе познания объективной лингвистической действительности: от живого созерцания к абстрактному мышлению, и от абстрактного мышления к практике.
Существует несколько этапов лингвистического познания:
1. Такие эмпирические разделы лингвистики, как диалектология, история языка, описательная фонетика, лексикология, грамматика. Эти разделы осуществляют накопление и первичную обработку языковых и речевых фактов.
2. Теоретическая лингвистика обобщает и гипотетически осмысливает все эти факт, создаёт теоретические концепции языка и текстообразования.
3. Прикладная лингвистика проверяет на практике (чаще всего, методом моделирования) состоятельность гипотез общего языкознания. А для создания модели языка становится необходима объяснительная сторона – т.е. знание того, как функционирует язык. Инженерно-лингвистическое моделирование служит надёжным способом реализации лингвистической теории и средством проверки их строгости и жизнеспособности, тем самым замыкая связь между лингвистической теорией и практикой.
Вторая методологическая функция прикладной лингвистики: инженерно-лингвистическое моделирование, перенося язык на непривычный для него субстрат, обнажает скрытый от прямого наблюдения теоретический парадокс и намечает пути его решения.
Третья методологическая функция: прикладная лингвистика служит тем каналом, через который осуществляется обмен идеями и методами между языкознанием и естественно-техническими науками. Этот обмен имеет двусторонний характер: новые математические и кибернетические идеи закладываются в основу лингво-математических и инженерно-лингвистических моделей, а из них переносятся уже в теоретическое языкознание. Например, использование теории информации и математической статистики для решения чисто лингвистических задач.
Современным естественным наукам присущ повышенный интерес к методам гуманитарных знаний. Специалисты по вычислительной технике зачастую обращаются к лингвистике, т.к. нуждаются в разработке языков программирования, а также организации удобных форм общения человека и машины. Даже математики заимствуют некоторые идеи из лингвистики для создания новых математических концепций (например, теория нечётких лингвистических множеств и алгоритмов, а также математическая теория контекстно свободных языков были созданы под влиянием идей порождающей грамматики Н. Хомского).
Компоненты прикладной лингвистики:
1. Теория и практика перевода
2. Машинный перевод
3. Теория и практика преподавания родного и неродного языка, лингводидактика (дисциплина, занимающаяся описанием языка как учебного предмета и конструированием учебных упражнений)
4. Теория и практика создания информационно-поисковых систем
5. Теория кодирования
6. Социолингвистика
7. Теория воздействия и теория аргументации
8. Политическая лингвистика
9. Лексикография, в том числе автоматическая
10. Терминология и терминография
11. Полевая лингвистика
12. Гипертекстовые технологии
13. Компьютерная лингвистика
14. Лингвистическая криминология
15. Психолингвистика
16. Квантитативная лингвистика
17. Создание искусственных языков
18. Поддержка коммуникации с помощью технических средств
19. Аннотирование, реферирование и классификация текстов
20. Распознавание символов текста
Основные исследовательские задачи прикладной лингвистики:
1. Создание лингво-процессоров – систем автоматического анализа и синтеза речи и текстов на естественном языке. Сюда же входит разработка основных компонентов лингво-процессора: морфологического, семантического и синтаксического анализаторов.
o Синтаксический анализатор – учитывает синтаксическую информацию, лексическую информацию, сочетаемость, семантику, валентности слов и т.д. В результате – построение дерева зависимостей
o Семантический анализатор – осуществляет переход к глубинной семантико-синтаксической структуре предложения после использования правил синтаксического перефразирования. В результате – составление семантической сети и её сопоставление с базой данных автоматических информационных систем
2. Машинный перевод – построение плана выражения на основе плана содержания на различных естественных языка. В идеале, вообще без участия человека.
3. Прикладная лексикология и машинная лексикография – автоматическое составление словарей для разработки автоматических информационно-поисковых систем машинного перевода (сюда входит создание частотных словарей, словоуказателей, конкордансов, терминологических баз данных, машинных словарей и энциклопедий).
4. Системы автоматического анализа и синтеза речи, т.е. разработка естественноязыкового интерфейса. Здесь распознавание речи требует привлечения всех уровней языка.
5. Автоматические обучающие системы – направлены на повышение качества и эффективности обучения
С функциональной точки зрения прикладная лингвистика может быть определена как научная дисциплина, в которой изучаются и разрабатываются способы оптимизации функционирования языка. Функции языка задают точки отсчета для классификации огромной области приложения лингвистических знаний. Оптимизацией коммуникативной функции занимаются такие дисциплины, как теория перевода, машинный перевод, теория и практика преподавания родного и неродного языка, теория и практика информационно-поисковых систем, создание информационных и, шире, искусственных языков, теория кодирования. Социальная функция языка — как часть коммуникативной — находит отражение в социолингвистике, в языковом планировании и языковой политике, в орфографии и орфоэпии, в теории воздействия, в политической лингвистике. Эпистемическая функция так или иначе проявляется в лексикографии (в том числе компьютерной), в терминологии и терминографии, в корпусной и полевой лингвистике. Оптимизация когнитивной функции сосредоточена в компьютерной лингвистике, в «лингвистической криминологии», в психолингвистике и афазиологии, в квантитативной лингвистике.