I.1.Изучение паронимов современной лингвистике
Государственное автономное образовательное учреждение
Высшего образования города Москвы
«Московский городской педагогический университет»
Институт иностранных языков
Кафедра английской филологии
Толкун кызы Гулназ
Эксплораторный анализ семантики имен прилагательных
с использованием корпусного менеджера BNCweb
(на материале паронимов в современном анлийском языке)
Выпускная квалификационная работа
Направление 035700.62 «Лингвистика»
профиль подготовки
«Теория и практика межкультурной коммуникации – английский язык»
Научный руководитель: кандидат филологических наук, доцент | Суворина Екатерина Владимировна | |
_______________ | ||
Рецензент: кандидат филологических наук, доцент | ||
_______________ | ||
Зав. кафедрой: доктор филологических наук, профессор | Афанасьева Ольга Васильевна | |
________________ |
Москва, 2015
СОДЕРЖАНИЕ номера страниц
ВВЕДЕНИЕ............................................................................................................
Глава 1. ТЕОРЕТИЧЕСКИЕ И МЕТОДОЛОГИЧЕСКИЕ ПРЕДПОСЫЛКИ ИССЛЕДОВАНИЯ ...............................................................................................
§1. Изучение паронимов современной лингвистике
§2. Основные понятия корпусной лингвистики
§3. Использование методов корпусной лингвистики
ВЫВОДЫ ПО ГЛАВЕ 1.....................................................................................
Глава 2. ИЗУЧЕНИЕ …… В СОВРЕМЕННОМ АНГЛИЙСКОМ ЯЗЫКЕ...........................................................................................
§1.Лексикографическое представление слов….. в современном английском языке
§2. Построение лексического профиля слов…. на основе корпусных данных
§3.Лингвокогнитивные особенности слов
ВЫВОДЫ ПО ГЛАВЕ 2........................................................................................
Заключение....................................................................................................
библиография.....................................................................................................
приложения..................................................................................................
Введение
Настоящая работа представляет собой исследование по когнитивной семантике и посвящена анализу лингвокогнитивных характеристик лексических единиц ….и их коллокаций в современном английском языке.
Теоретической базой для проведения данного исследования, выполненного в рамках когнитивно-дискурсивной парадигмы, послужили работы отечественных ученых по когнитивной лингвистике (Е.С. Кубрякова, Н.Н. Болдырев, В.З. Демьянков, Т.А. Симонян и др.); по корпусной лингвистике (В.П. Захаров, В.А. Плунгян, В.В. Рыков и др.).
Актуальность ….. а также важностью системного описания конкретного участка лексической системы английского языка, выполненного на основе современных методов исследования, в том числе с использованием методов корпусной лингвистики.
Научная новизна исследования заключается в том, что в работе:
Цель данного исследования состояла в описании лингвокогнивных характеристик слов их коллокаций на языковом, концептуальном и когнитивном уровнях.
Цель исследования предопределила постановку и решение следующих задач:
Для достижения поставленной цели и решения перечисленных задач используется ряд дополняющих друг друга методов. Основным методом исследования является общенаучный индуктивно-дедуктивный метод. Применяется описательно-аналитический метод, основанный на интерпретации лексикографических данных. В работе также используются методы концептуального анализа, синтактико-ориентированный подход лежит в основе метода выявления типов грамматических конструкций, необходимых для последующего извлечения материала из лингвистического корпуса. Для обработки данных, полученных по Британскому Национальному Корпусу, используются методы статистического анализа, а также методы компьютерной лингвистики, с помощью которых обеспечивается визуализация и обработка полученных результатов.
Предметом исследования являются языковые, концептуальные и когнитивные механизмы реализации характеристик слов… на соответствующих уровнях.
Объектом исследования являются …и их коллокации, отраженные в лексикографической и дискурсивной практике современного английского языка, а также в Британском Национальном Корпусе.
Материалом
Теоретическая значимость
Практическая ценность работы связана с возможностью использования ее результатов при составлении учебных пособий и методических рекомендаций по английской лексикографии, в практике преподавания английского языка как иностранного, в курсах общего языкознания, лексикологии английского языка, теории и практики перевода, корпусной лингвистики; в написании дипломных и курсовых работ на материале английского языка.
Структура работы. Настоящее исследование состоит из введения, двух глав, заключения, списка использованной литературы.
Во Введенииобосновывается актуальность темы исследования, аргументируется научная новизна, определяются цель и задачи, предмет и объект исследования, описывается материал и методы исследования, а также раскрывается теоретическая и практическая значимость работы.
В ГЛАВЕ 1 «Теоретические и методологические предпосылки исследования» ОРМАЛЬНЫМ языком
ГЛАВА 2 « » посвящена анализу
В заключениидаются в кратком изложении основные положения и выводы работы, намечаются перспективы дальнейших исследований. Работа завершается списком использованной литературы.
ГЛАВА I. Теоретические и методологические предпосылки исследования
I.1.Изучение паронимов современной лингвистике
Важнейшим достижением современной лингвистики является тот факт, что язык уже не рассматривается «в самом себе и для себя»; он предстает в новой парадигме с позиции его участия в познавательной деятельности человека.
Труды Н.Д. Арутюновой, А.П. Бабушкина, Н.Н. Болдырева, Г.И. Берестнева, Г.А. Волохина, Е.С. Кубряковой, З.Д. Поповой, Ю.С. Степанова, И.А. Стернина, В.Н. Телии и других исследователей содержат важные теоретические положения по вопросу о том, как хранятся наши знания о мире, как они структурированы в языке в процессе коммуникации. Этим кругом проблем занимается когнитивная лингвистика.
Многие когнитологи уверены в том, что язык нужно рассматривать не как замкнутое автономное образование, а как систему, связанную с другими системами человека. В основе когнитивного отношения к языку лежит понимание и изучение языка как «средства формирования и выражения мысли, хранения и организации знания в человеческом сознании, обмена знаниями. Язык – это окно в окружающий и духовный мир человека, в его интеллект, это средство доступа к тайнам мыслительных процессов. В связи с этим, цель когнитивной лингвистики заключается в том, чтобы посредством языка проникнуть в формы разных структур знания и описать существующие между ними и языком зависимости, смоделировать сами эти структуры, их содержание и связи, таким образом, внося вклад в общую теорию интеллекта» [Болдырев, 2004: 19].
По определению Демьянкова В.З. и Кубряковой Е.С. «Когнитивная лингвистика – лингвистическое направление, в центре внимания которого находится язык как общий когнитивный механизм, как когнитивный инструмент – система знаков, играющих роль в репрезентации (кодировании) и в трансформировании информации. Эта система, в противоположность другим семиотическим инструментам человека, одновременно является объектом и внешним, и внутренним для субъекта, конституированным независимо от него и подлежащим усвоению в онтогенезе [Демьянков, Кубрякова, 1996: 53-55].
Стоит отметить, что когнитивная лингвистика прочно заняла свое место в парадигме концепций современного языкознания. Когнитивный подход утвердился в языкознании в течение последних десятилетий в качестве одного из ведущих подходов к изучению явлений языка. Без учета достижений этого направления нельзя сегодня говорить «ни об интерпретации дискурса и текста, ни о функции слова и его разнообразных модификаций в процессах словообразования и формообразования, ни о значениях языковых единиц и мотивах их вставления в синтаксические конструкции, ни о многом другом» [Кубрякова, 1997: 15].
Важная роль когнитивной лингвистики состоит в открытии нового этапа в изучении сложных отношений языка и мышления, роли человека в языке и роли языка в жизни человека. Именно данная проблема всегда волновала представителей отечественного теоретического языкознания, на что указывает Е.С. Кубрякова [Кубрякова, 2004: 11]. Поэтому очевидно, что когнитивные исследования нашли широкое распространение в России.
Как отмечает Е.С. Кубрякова, в задачи когнитивной науки входит и описание/изучение систем представления знаний и процессов обработки и переработки информации, и – одновременно – исследование общих принципов организации когнитивных способностей человека в единый ментальный механизм, и установление их взаимосвязи и взаимодействия. Конечной задачей когнитивной лингвистики является получение данных о деятельности разума. При этом исследование сознания представляет собой общий предмет когнитивной науки и когнитивной лингвистики [Кубрякова, 2004: 10].
Отличие когнитивной лингвистики от других когнитивных наук заключается в ее материале - она исследует сознание на материале языка (другие когнитивные науки исследуют сознание на своем материале), а также в ее методах - она исследует когнитивные процессы, делает выводы о типах ментальных репрезентаций в сознании человека на основе применения к языку имеющихся в распоряжении лингвистики собственно лингвистических методов анализа с последующей когнитивной интерпретацией результатов исследования.
Преимущества когнитивной лингвистики и когнитивного подхода к языку многие когнитологи видят в том, что они открывают широкие перспективы виденья языка во всех его разнообразных и многообразных связях с человеком, с его интеллектом и разумом, со всеми мыслительными и познавательными процессами, им осуществляемыми, и с теми механизмами и структурами, что лежат в их основе.
Болдырев Н.Н характеризует когнитивную лингвистику как «одно из самых современных и перспективных направлений лингвистических исследований, которое изучает язык в его взаимодействии с различными мыслительными структурами и процессами: вниманием, восприятием, памятью и т. д.» [Болдырев 1998: 3].
Центральным понятием когнитивной лингвистики является когниция, исследуются не просто наблюдаемые действия, а их ментальные репрезентации (внутренние представления, модели), символы, стратегии человека, которые и порождают действия на основе знаний; т. е. когнитивный мир человека изучается по его поведению и деятельности, протекающих при активном участии языка, который образует речемыслительную основу любой человеческой деятельности – формирует ее мотивы, установки, прогнозирует результат.
В словаре когнитивных терминов отмечается, что когниция - понятие когнитивной науки, сочетающее в себе значения двух латинских слов – cognitio, познание, познавание и cogitatio, мышление, размышление. Когниция обозначает познавательный процесс или совокупность психических (ментальных, мыслительных) процессов – восприятия, категоризации, мышления, речи, служащих обработке и переработке информации. Включает осознание и оценку самого себя в окружающем мире и построение особой картины мира – все то, что составляет основу для поведения человека. Когниция – все процессы, в ходе которых сенсорные данные трансформируются, поступая в мозг, и преобразуются в виде ментальных репрезентаций разного типа (образов, пропозиций, фреймов, скриптов, сценариев и т.п.), чтобы удерживаться при необходимости в памяти человека. Иногда когницию определяют как вычисление (computation) – обработку информации в символах, ее преобразование из одного вида в другой – в другой код, в иную структуру.
Разные дисциплины в составе когнитивной науки занимаются разными аспектами когниции: лингвистика – языковыми системами знаний; философия – общими проблемами когниции и методологией познавательных процессов; нейронауки изучают биологические основания когниции и тех физиологических ограничений, которые наложены на протекающие в человеческом мозгу процессы и т.п.; психология вырабатывает прежде всего экспериментальные методы и приемы изучения когниции [Краткий словарь когнитивных терминов, 1996: 18].
В.З. Демьянков отмечает, что когниция – важное понятие когнитивной лингвистики, оно охватывает знание и мышление в их языковом воплощении, а потому когниция, когнитивизм оказались тесно связанны с лингвистикой. Сейчас уже стало аксиомой, что во всём комплексе наук о человеке сталкиваются, в первую очередь, отношения между языком и другими видами человеческой деятельности. Язык даже в большей степени, чем культура и общество, даёт когнитивистам ключ к пониманию человеческого поведения. Поэтому язык оказался в центре внимания когнитивистов [Демьянков, 1994: 17–33].
Стоит отметить, что в настоящее время наука о языке претерпевает значительные изменения: от всестороннего изучения системы языка лингвистика обращается к человеку, субъекту письменно-речевой деятельности. Все более актуальными становятся исследования антропоцентрического характера – в рамках диады «язык – человек».
Истоки антропоцентрической парадигмы восходят к идеям В. фон Гумбольдта и Э. Бенвениста. Особую значимость имело гумбольдтовское понимание языка как «мира, лежащего между миром внешних явлений и внутренним миром человека» [Гумбольдт 1984: 304], как средства, «заложенного в самой природе человека и необходимого для развития его духовных сил и формирования мировоззрения» [Гумбольдт 1984: 51]. Именно В. фон Гумбольдт впервые отметил, что «человек становится человеком только через язык, в котором действуют творческие первосилы человека, его глубинные возможности. Язык есть единая духовная энергия народа» [Гумбольдт 1984: 314]. Э. Бенвенист развивает мысль о том, что в мире существует только человек с языком, человек, говорящий с другим человеком, и язык, таким образом, принадлежит самому определению человека [Бенвенист 2002: 298].
В отечественной лингвистике об антропоцентризме как основном принципе современной лингвистики заговорил Ю.С. Степанов, анализируя концепцию Э. Бенвениста: «Язык создан по мерке человека, и этот масштаб запечатлен в самой организации языка; в соответствии с ним язык и должен изучаться. Поэтому в своем главном стволе лингвистика всегда будет наукой о языке в человеке и о человеке в языке» [Степанов 2002: 15].
Арутюнова Н.Д отмечает, что возникновение антропоцентрической парадигмы в языкознании было предопределено, поскольку сам язык антропоцентричен по своей сути: «человек запечатлел в языке свой физический облик, свои внутренние состояния, свои эмоции, свой интеллект, свое отношение к предметному и непредметному миру, природе… свои отношения к коллективу людей и другому человеку [Арутюнова 1999: 3].
Таким образом, когнитологи перемещают свой взгляд с объекта познания на субъект, анализируется человек в языке и язык в человеке. В центре внимания оказывается личность носителя языка. Новый подход учитывает роль человеческого фактора в языке, вместо опоры на форму появляется опора на содержание, не на механизм, лежащий в основе языка, а на его применение. Следовательно, как отмечает Кубрякова Е.С, сущность антропоцентризма как основного принципа лингвистических исследований заключается в том, что «научные объекты изучаются прежде всего по их роли для человека, по их назначению в его жизнедеятельности, по их функциям для развития человеческой личности и ее усовершенствования… человек становится точкой отсчета в анализе тех или иных явлений, он вовлечен в этот анализ, определяя его перспективы и конечные цели. Он знаменует тенденцию поставить человека во главу угла во всех теоретических предпосылках научного исследования и обусловливает его специфический ракурс» [Кубрякова 1995: 212]. Также Е.С. Кубрякова утверждает, что антропоцентризм – это «один из главных параметров современной лингвистики» [Кубрякова, 1994: 5].
Отметим, что когнитивная лингвистика тесно связана с когнитивной семантикой. Т.А. Симонян отмечает, что «когнитивная семантика - это один из центральных разделов когнитивной лингвистики, которая отражает то, как человек воспринимает и осмысливает окружающий мир, а также как опыт его познания реализуется в значениях языковых выражений. Главным отличительным фактором когнитивной семантики является антропоцентричность, т.е. направленность на человека. Человек рассматривается как «наблюдатель», он сам категоризирует и компенсирует, ему приписывается активная роль в выборе языковых средств, выражений для описания той или иной ситуации» [Симонян, 2001:50]
Кубрякова Е.С. отмечает, что поскольку возникновение когнитивной лингвистики отчасти было реакцией на пренебрежение семантикой в лингвистических теориях, господствовавших в 1970-х годах, то поэтому семантика стала играть значительную роль в исследованиях по когнитивной лингвистике и рассматривается в ней как ведущая сила в употреблении языка. Её первой важной чертой является новый подход к интерпретации значения и связывание его со знанием. Знание отражает понимание и осмысление мира, достигаемые в предметно-познавательной деятельности человека, и именно это вызывает необходимость появления определённых форм сознания. Значения языковых форм фиксируют человеческий опыт. Их и следует изучать как определённые результаты обработки и переработки информации, поступающей к человеку по всем его чувственным каналам. Таким образом, важной чертой когнитивной семантики является опора на телесный опыт общения человека с миром, попытка установить значимость и конкретный характер простейшей категоризации того, что получает человек при непосредственном восприятии мира, и как происходит его «структурация» в простейших типах человеческой деятельности [Кубрякова 2004: 560].
Изучение лексической семантики с когнитивной точки зрения предполагает анализ того, как познавательный опыт человека реализуется в значениях языковых выражений. Как отмечает Н.Н. Болдырев, когнитивная семантика – это определенная теория значения, в которой значительное место отводится человеку как наблюдателю, «концептуализатору» и «категоризатору». Человеку приписывается активная роль в формировании значений языковых единиц. Это означает, что он сам формирует значения, а не получает их в готовом виде, выбирая языковые средства выражения для описания той или иной ситуации и в понимании мотивов этого выбора.
Полная семантическая характеристика того или иного языкового явления с точки зрения когнитивной семантики предполагает учет не только и не столько объективных характеристик описываемой ситуации, сколько учет специфики ее восприятия, наличия соответствующих знаний, интенций, выделенности конкретных единиц и выбора точки значения (перспективы), концентрации внимания на определенных эпизодах. Все эти моменты определяют, в конечном итоге, формирование у человека в процессе его познавательной деятельности конкретных концептов и категорий, т.е. специфику процессов концептуализации и категоризации мира. [Болдырев 2000:18].
По мнению Е. В. Рахилиной, внутри лингвистики когнитивный подход естественным образом предполагает главенство когнитивной семантики, которая определяет поведение лексем, их частей и сочетаний, конструкций и т.д. Общие и частные семантические исследования должны, в конечном счете, объяснить, поведение языковых единиц. При этом требуется, чтобы объяснения опирались на достаточно общие «человеческие» механизмы, т.е. были антропоцентричны [Рахилина, 1998: 281]. Исследования по когнитивной семантике, в свою очередь, отличает широкий спектр подходов к языковому материалу.
I.2. Основные понятия корпусной лингвистики
В современной лингвистике все больше внимания и предпочтения отводится корпусной лингвистике. В данном параграфе мы рассмотрим такие понятия как корпусная лингвистика, лингвистический корпус, корпусный менеджер, BNCweb и его возможности, использование лингвистического корпуса в рамках проводимого исследования, а также особенности построения лексического профиля слова.
В настоящее время корпусная лингвистика определяется как раздел компьютерной лингвистики, занимающийся разработкой общих принципов построения и использования лингвистических корпусов с использованием компьютерных технологий [Захаров, 2005: 48].
Корпусная лингвистика часто понимается как относительно новый подход в лингвистике, который имеет дело с изучением использования языка в «реальной жизни» с помощью компьютеров и электронных корпусов. Корпусная лингвистика имеет, по крайней мере, две черты, дающие ей основание претендовать на положение самостоятельной дисциплины:
1) характер используемого словесного материала
2) специфика инструментария.
Под названием лингвистический, или языковой, корпус текстов понимается большой, представленный в электронном виде, унифицированный, структурированный, размеченный, филологически компетентный массив языковых данных, предназначенный для решения конкретных лингвистических задач. Задача авторов корпуса – собрать как можно большее количество текстов, относящихся к тому подмножеству языка, для изучения которого корпус создается. Можно сказать, что корпус – это уменьшенная модель языка. Существует множество разных типов корпусов, что определяется многообразием исследовательских и прикладных задач, для решения которых они создаются, и различными основаниями для классификации. В зависимости от поставленных целей и классифицирующих признаков, можно выделить различные типы корпусов.
Корпуса подразделяются по цели, литературности, жанрам, назначению, динамичности, разметке, доступности.
-По цели создания корпусы делятся на многоцелевые и специализированные. Многоцелевые корпусы обычно содержат тексты различных жанров (сюда относятся национальные корпусы), в то время как специализированные корпусы могут ограничиваться одним жанром или группой жанров.
- По критерию «литературности» выделяются литературные, диалектные, разговорные, терминологические и смешанные корпусы.
- По жанрам идет подразделение на литературные, фольклорные, драматургические, публицистические и др.
- По назначению выделяют исследовательские и иллюстративные корпусы. Исследовательские корпусы создаются с целью изучения различных аспектов функционирования языка. Этот тип корпусов ориентирован на широкий класс лингвистических задач. Иллюстративные корпусы создаются после проведения научного исследования: их цель не столько выявить новые факты, сколько подтвердить и обосновать уже полученные результаты. Они служат для выделения из них лингвистических примеров, подтверждающих те или иные языковые (речевые, текстовые) факты, обнаруженные ранее иными лингвистическими приемами.
- «Динамичность» подразделяет корпусы на динамические и статические. Первоначально корпусы текстов создавались как статические образования, отражающие определенное временное состояние языковой системы. Статические корпусы содержат тексты какого-то небольшого временнóго промежутка. Типичными представителями этого вида корпусов являются авторские корпусы – коллекции текстов писателей.
- Критерий «разметка» делит корпусы на размеченные и неразмеченные. Существуют и другие термины, обозначающие это деление: индексированные и неиндексированные, аннотированные и неаннотированные, таггированные и нетаггированные. В размеченном корпусе словам или предложениям присваиваются метки (тэги) в соответствии с характером разметки: морфологические, синтаксические, семантические, просодические и др.
Важным критерием для пользователей корпуса является его доступность. Свободно доступные корпусы позволяют в любое время в режиме on-line иметь доступ ко всем текстам корпуса в полном объеме.
Любой лингвистический корпус имеет важные особенности. Во-первых, он характеризуется представительностью или сбалансированным составом текстов. Это означает, что корпус содержит по возможности все типы письменных и устных текстов, представленные в данном языке (художественные разных жанров, публицистические, учебные, научные, деловые, разговорные, диалектные и т.п.), и что все эти тексты входят в корпус по возможности пропорционально их доле в языке соответствующего периода. Следует иметь в виду, что хорошая представительность достигается только при значительном объеме корпуса (десятки и сотни миллионов словоупотреблений). Во-вторых, корпус содержит особую дополнительную информацию о свойствах входящих в него текстов (так называемую разметку, или аннотацию). Разметка - главная характеристика корпуса; она отличает корпус от простых коллекций (или «библиотек») текстов, в изобилии представленных в современном интернете, в том числе и на русском языке (таких, как, по-видимому, наиболее известная «библиотека Максима Мошкова» или, например, «Русская виртуальная библиотека»). В настоящее время специалистами создана и пополняется также «Фундаментальная электронная библиотека» русской классической литературы, ориентированная на академический режим подачи текстов, максимально точное воспроизведение авторитетных печатных изданий. Однако такие библиотеки в необработанном виде для научных исследований языка пригодны очень ограниченно. Не следует забывать также, что библиотеки создаются теми, кому интересно в большей степени содержание текстов, чем их языковые качества. Для составителей корпуса такие факторы, как увлекательность или полезность книги, ее высокие художественные или научные достоинства являются важными, но не первостепенными. Корпус, в отличие от электронной библиотеки, — это не собрание «интересных» или «полезных» текстов; это собрание текстов, интересных или полезных для изучения языка. А такими могут оказаться и роман второстепенного писателя, и запись обычного телефонного разговора, и типовой договор аренды и т.п. — наряду, конечно, с классическими произведениями художественной литературы.
Также отметим, что современные компьютерные технологии многократно упрощают и ускоряют процедуры лингвистической обработки больших массивов текстов. Раньше исследователь мог лишь просматривать тексты и вручную выписывать из них нужные примеры; эта предварительная (но абсолютно неизбежная) деятельность была очень трудоемкой и не позволяла обрабатывать большие массивы материала. Теперь ограничений на объем анализируемого материала и скорость поиска информации в нем по существу нет, а это означает, что в распоряжении исследователя оказываются колоссальные массивы текстов самого разного типа. Это не могло не сказаться на развитии наших знаний о языке: возможность массовой — в том числе статистической — обработки текстов, недоступная прежде, позволила обнаружить в структуре и развитии языка такие закономерности, о существовании которых наука раньше или не подозревала, или лишь смутно догадывалась, но не могла строго обосновать. Теперь подлинно научные описания грамматического строя языков, а также авторитетные академические словари — практически все без исключений — должны составляться на основе корпусов этих языков. Учет корпусных данных оказывается крайне желательным (если не строго обязательным) и при многих других более специальных научных исследованиях.
С этой точки зрения основными потребителями лингвистических корпусов являются, конечно, исследователи-лингвисты самого разного профиля. Рассмотрим некоторые примеры использования лингвистического корпуса в современных исследованиях. О.А. Васькова отмечает, что данные корпуса текстов позволяют получить более полные и объективные данные практически обо всех аспектов изучаемого языка [Васькова, 2006]. Е.Б. Кротова в своей работе «Корпусная фразеология» утверждает, что благодаря корпусным данным удалось обнаружить значения, которые не были зафиксированы в существующих словарях [Кротова, 2013]. Отметим также, что в исследованиях, использующих данные лингвистического корпуса, для описания множества слов, окружающего анализируемое, возможно построение лексического профиля слова. Принятый в корпусной лингвистике анализ лексического профиля слова подразумевает нахождение взаимосвязи между значением слова и конструкциями, в которых оно употреблено в корпусе [Janda, Solovyev, 2009: 367].
Однако круг пользователей корпуса вовсе не ограничивается профессиональными исследователями языка. Надежные статистические данные о языке определенной эпохи или определенного автора могут интересовать литературоведов, историков и представителей многих других областей гуманитарного знания. Важное значение корпуса имеют и для преподавания языка в качестве родного или иностранного; всё больше учебников и учебных программ в наше время становятся более ориентированными на корпус. Быстро и эффективно проверить с помощью корпуса особенности употребления незнакомого слова или грамматической формы у авторитетных авторов сможет и иностранец, и школьник, и учитель, и журналист, и редактор, и писатель. Таким образом, лингвистический корпус обращен ко всем, кто в силу профессии, по необходимости или из простой любознательности ищет ответ на вопросы об устройстве и функционировании языка, то есть фактически к большинству образованных носителей этого языка и ко всем, изучающим его в качестве иностранного.
Возникает вопрос о том, чем же корпусная лингвистика отличается от традиционной? На основе прочитанных лекции по корпусной лингвистике В.В. Рыкова, можно привести сопоставительную таблицу этих понятий. (табл.1)
Табл. 1.1. Отличие корпусной лингвистики от традиционной
№ | Корпусная лингвистика | Традиционная лингвистика |
Основное внимание – изучение речи | Основное внимание – изучение языка | |
Цель – описание языка в том виде, как он проявил себя в речи, представленной в виде специально подобранного корпуса текстов | Цель – описание и объяснение языка | |
В своих исследованиях опирается на данные корпуса текста | В своих исследованиях идёт от теории к её объяснению и подтверждению в фактах речи | |
Предпочитает квантитативные методы | Предпочитает квалитативные методы | |
Видит себя частью традиций, базирующихся на эмпирических методах | Видит себя частью традиций, базирующихся на рационалистических методах | |
Текст рассматривается как некоторая физическая сущность | Текст рассматривается как некоторая абстракция | |
Составление грамматики конкретных языков | Изучает языковые универсалии | |
Основное внимание уделяется форме | Основное внимание – не только форме, но и содержанию | |
Рассматривает тексты в глобальной перспективе | Рассматривает тексты в локальной перспективе | |
Фокусирует своё внимание на как можно более широком взгляде на текст, неограниченном ни какими догмами | Анализирует некоторую конкретную, искусственно ограниченную, проблемную область | |
В своих выводах опирается на наблюдение речевой деятельности, проявленной в виде текстов | Опирается на интуицию в отборе речевого материала, в отборе эмпирических материалов своих исследований | |
Часто пользуется вероятностными методами и статистикой для первичной обработки речевого материала | Предпочитает логические рассуждения | |
Проводится работа с лингвистическими данными (словоупотреблениями) в том виде, в каком они встречались в контексте | Предпочитаются искусственные примеры, из изолированных от текста словоупотреблений | |
Предпочитает индуктивные методы обработки эмпирического словесного материала, считает их сутью научного метода | Предпочитает дедуктивные методы обработки эмпирического словесного материала | |
Верит в научные открытия, основанные на обработке эмпирических данных | Верит в открытия, основанные на процедурах, оценках, сравнениях и т.д., т.е., как результат многовековых исследований |
Корпус текстов становится мощным инструментом в руках лингвиста лишь посредством специализированных средств. Неотъемлемой частью понятия «корпус текстов» является система управления текстовыми и лингвистическими данными, которую в последнее время чаще всего называют корпусным менеджером (или корпус - менеджером). Корпусный менеджер – это специализированная поисковая система, включающая программные средства для поиска данных в корпусе, получения статистической информации и предоставления результатов пользователю в удобной форме.
Благодаря корпусному менеджеру, появилась возможность получить информацию о словах-коллокатов интересующего слова. Коллокация – количественная мера совместной встречаемости. Коллокации в корпусной лингвистике определяются как статистически правдоподобные сочетания, при этом они могут быть как фразеологизированными, так и свободными [Захаров, 2011: 161]. Коллокат – слово или словоформа, встречающаяся в качестве ближнего соседа данного слова или словоформы. Коллокация – регулярное, устойчивое сочетание слов в предложении. Подробный обзор понятия «коллокация» представлен в работе М.В. Влавацкой [Влавацкая, 2011: 180]. Также уточняется, что термин «коллокация» имеет довольно широкое значение и допускает различные степени коллокационной связи, «сила» которой измеряется статистическими методами.
В.П. Захаров выделяет ряд требований к корпусным менеджерам. Корпусный менеджер должен:
• строить полные конкордансные списки;
• искать не только отдельные слова, но и словосочетания;
• осуществлять поиск по шаблонам (сложные запросы);
• сортировать списки по нескольким критериям, выбираемым пользователем;
• давать возможность отображать найденные словоформы в неограниченном контексте;
• давать статистическую информацию по отдельным элементам корпуса;
•сохранять и распечатывать результаты;
• работать как с отдельными файлами, так и с корпусами, неограниченными по размеру;
• быстро обрабатывать запросы и выдавать результаты;
• поддерживать различные форматы текстовых данных (txt, doc, rtf, html, xml и др.);
• быть легким (интуитивно понятным) в использовании, как для опытного, так и для начинающего пользователя.
Таким образом, корпусный менеджер – это программа, предоставляющая удобный доступ к базе данных корпуса. Он выдаёт в виде списка все контексты, в которых встретилось слово или группа слов, интересующих пользователя корпуса. Это очень похоже на обычную поисковую систему из числа тех, которыми мы пользуемся для поиска в Интернете, только он может искать не только по простому вхождению слова или его словоформы, но и по заданным лингвистическим параметрам. Так, в Национальном корпусе русского языка мы можем, например, запросить выдачу всех контекстов:
• где есть любая из форм глагола идти;
• где есть глагол движения в форме 2 л. ед. ч. н. вр.;
• где просто присутствует форма 2 л. ед.ч. н. вр. любого глагола, независимо от его лексического значения
Каждый фрагмент текста (контекст) в выдаче к