I.1.Изучение паронимов современной лингвистике

Государственное автономное образовательное учреждение

Высшего образования города Москвы

«Московский городской педагогический университет»

Институт иностранных языков

Кафедра английской филологии

Толкун кызы Гулназ

Эксплораторный анализ семантики имен прилагательных

с использованием корпусного менеджера BNCweb

(на материале паронимов в современном анлийском языке)

Выпускная квалификационная работа

Направление 035700.62 «Лингвистика»

профиль подготовки

«Теория и практика межкультурной коммуникации – английский язык»

Научный руководитель: кандидат филологических наук, доцент   Суворина Екатерина Владимировна
_______________
Рецензент: кандидат филологических наук, доцент      
_______________
Зав. кафедрой: доктор филологических наук, профессор   Афанасьева Ольга Васильевна
________________

Москва, 2015

СОДЕРЖАНИЕ номера страниц

ВВЕДЕНИЕ............................................................................................................

Глава 1. ТЕОРЕТИЧЕСКИЕ И МЕТОДОЛОГИЧЕСКИЕ ПРЕДПОСЫЛКИ ИССЛЕДОВАНИЯ ...............................................................................................

§1. Изучение паронимов современной лингвистике

§2. Основные понятия корпусной лингвистики

§3. Использование методов корпусной лингвистики

ВЫВОДЫ ПО ГЛАВЕ 1.....................................................................................

Глава 2. ИЗУЧЕНИЕ …… В СОВРЕМЕННОМ АНГЛИЙСКОМ ЯЗЫКЕ...........................................................................................

§1.Лексикографическое представление слов….. в современном английском языке

§2. Построение лексического профиля слов…. на основе корпусных данных

§3.Лингвокогнитивные особенности слов

ВЫВОДЫ ПО ГЛАВЕ 2........................................................................................

Заключение....................................................................................................

библиография.....................................................................................................

приложения..................................................................................................

Введение

Настоящая работа представляет собой исследование по когнитивной семантике и посвящена анализу лингвокогнитивных характеристик лексических единиц ….и их коллокаций в современном английском языке.

Теоретической базой для проведения данного исследования, выполненного в рамках когнитивно-дискурсивной парадигмы, послужили работы отечественных ученых по когнитивной лингвистике (Е.С. Кубрякова, Н.Н. Болдырев, В.З. Демьянков, Т.А. Симонян и др.); по корпусной лингвистике (В.П. Захаров, В.А. Плунгян, В.В. Рыков и др.).

Актуальность ….. а также важностью системного описания конкретного участка лексической системы английского языка, выполненного на основе современных методов исследования, в том числе с использованием методов корпусной лингвистики.

Научная новизна исследования заключается в том, что в работе:

Цель данного исследования состояла в описании лингвокогнивных характеристик слов их коллокаций на языковом, концептуальном и когнитивном уровнях.

Цель исследования предопределила постановку и решение следующих задач:

Для достижения поставленной цели и решения перечисленных задач используется ряд дополняющих друг друга методов. Основным методом исследования является общенаучный индуктивно-дедуктивный метод. Применяется описательно-аналитический метод, основанный на интерпретации лексикографических данных. В работе также используются методы концептуального анализа, синтактико-ориентированный подход лежит в основе метода выявления типов грамматических конструкций, необходимых для последующего извлечения материала из лингвистического корпуса. Для обработки данных, полученных по Британскому Национальному Корпусу, используются методы статистического анализа, а также методы компьютерной лингвистики, с помощью которых обеспечивается визуализация и обработка полученных результатов.

Предметом исследования являются языковые, концептуальные и когнитивные механизмы реализации характеристик слов… на соответствующих уровнях.

Объектом исследования являются …и их коллокации, отраженные в лексикографической и дискурсивной практике современного английского языка, а также в Британском Национальном Корпусе.

Материалом

Теоретическая значимость

Практическая ценность работы связана с возможностью использования ее результатов при составлении учебных пособий и методических рекомендаций по английской лексикографии, в практике преподавания английского языка как иностранного, в курсах общего языкознания, лексикологии английского языка, теории и практики перевода, корпусной лингвистики; в написании дипломных и курсовых работ на материале английского языка.

Структура работы. Настоящее исследование состоит из введения, двух глав, заключения, списка использованной литературы.

Во Введенииобосновывается актуальность темы исследования, аргументируется научная новизна, определяются цель и задачи, предмет и объект исследования, описывается материал и методы исследования, а также раскрывается теоретическая и практическая значимость работы.

В ГЛАВЕ 1 «Теоретические и методологические предпосылки исследования» ОРМАЛЬНЫМ языком

ГЛАВА 2 « » посвящена анализу

В заключениидаются в кратком изложении основные положения и выводы работы, намечаются перспективы дальнейших исследований. Работа завершается списком использованной литературы.

ГЛАВА I. Теоретические и методологические предпосылки исследования

I.1.Изучение паронимов современной лингвистике

Важнейшим достижением современной лингвистики является тот факт, что язык уже не рассматривается «в самом себе и для себя»; он предстает в новой парадигме с позиции его участия в познавательной деятельности человека.

Труды Н.Д. Арутюновой, А.П. Бабушкина, Н.Н. Болдырева, Г.И. Берестнева, Г.А. Волохина, Е.С. Кубряковой, З.Д. Поповой, Ю.С. Степанова, И.А. Стернина, В.Н. Телии и других исследователей содержат важные теоретические положения по вопросу о том, как хранятся наши знания о мире, как они структурированы в языке в процессе коммуникации. Этим кругом проблем занимается когнитивная лингвистика.

Многие когнитологи уверены в том, что язык нужно рассматривать не как замкнутое автономное образование, а как систему, связанную с другими системами человека. В основе когнитивного отношения к языку лежит понимание и изучение языка как «средства формирования и выражения мысли, хранения и организации знания в человеческом сознании, обмена знаниями. Язык – это окно в окружающий и духовный мир человека, в его интеллект, это средство доступа к тайнам мыслительных процессов. В связи с этим, цель когнитивной лингвистики заключается в том, чтобы посредством языка проникнуть в формы разных структур знания и описать существующие между ними и языком зависимости, смоделировать сами эти структуры, их содержание и связи, таким образом, внося вклад в общую теорию интеллекта» [Болдырев, 2004: 19].

По определению Демьянкова В.З. и Кубряковой Е.С. «Когнитивная лингвистика – лингвистическое направление, в центре внимания которого находится язык как общий когнитивный механизм, как когнитивный инструмент – система знаков, играющих роль в репрезентации (кодировании) и в трансформировании информации. Эта система, в противоположность другим семиотическим инструментам человека, одновременно является объектом и внешним, и внутренним для субъекта, конституированным независимо от него и подлежащим усвоению в онтогенезе [Демьянков, Кубрякова, 1996: 53-55].

Стоит отметить, что когнитивная лингвистика прочно заняла свое место в парадигме концепций современного языкознания. Когнитивный подход утвердился в языкознании в течение последних десяти­летий в качестве одного из ведущих подходов к изучению явлений язы­ка. Без учета достижений этого направления нельзя сегодня говорить «ни об интерпретации дискурса и текста, ни о функции слова и его раз­нообразных модификаций в процессах словообразования и формообра­зования, ни о значениях языковых единиц и мотивах их вставления в синтаксические конструкции, ни о многом другом» [Кубрякова, 1997: 15].

Важная роль когнитивной лингвистики состоит в открытии нового этапа в изучении сложных отношений языка и мышления, роли человека в языке и роли языка в жизни человека. Именно данная проблема всегда волновала представителей отечественного теоретического языкознания, на что указывает Е.С. Кубрякова [Кубрякова, 2004: 11]. Поэтому очевидно, что когнитивные исследования нашли широкое распространение в России.

Как отмечает Е.С. Кубрякова, в задачи когнитивной науки входит и описание/изучение систем представления знаний и процессов обработки и переработки информации, и – одновременно – исследование общих принципов организации когнитивных способностей человека в единый ментальный механизм, и установление их взаимосвязи и взаимодействия. Конечной задачей когнитивной лингвистики является получение данных о деятельности разума. При этом исследование сознания представляет собой общий предмет когнитивной науки и когнитивной лингвистики [Кубрякова, 2004: 10].

Отличие когнитивной лингвистики от других когнитивных наук заключается в ее материале - она исследует сознание на материале языка (другие когнитивные науки исследуют сознание на своем материале), а также в ее методах - она исследует когнитивные процессы, делает выводы о типах ментальных репрезентаций в сознании человека на основе применения к языку имеющихся в распоряжении лингвистики собственно лингвистических методов анализа с последующей когнитивной интерпретацией результатов исследования.

Преимущества когнитивной лингвистики и когнитивного подхода к языку многие когнитологи видят в том, что они открывают широкие перспективы виденья языка во всех его разнообразных и многообразных связях с человеком, с его интеллектом и разумом, со всеми мыслительными и познавательными процессами, им осуществляемыми, и с теми механизмами и структурами, что лежат в их основе.

Болдырев Н.Н характеризует когнитивную лингвистику как «одно из самых современных и перспективных направлений лингвистических исследований, которое изучает язык в его взаимодействии с различными мыслительными структурами и процессами: вниманием, восприятием, памятью и т. д.» [Болдырев 1998: 3].

Центральным понятием когнитивной лингвистики является когниция, исследуются не просто наблюдаемые действия, а их ментальные репрезентации (внутренние представления, модели), символы, стратегии человека, которые и порождают действия на основе знаний; т. е. когнитивный мир человека изучается по его поведению и деятельности, протекающих при активном участии языка, который образует речемыслительную основу любой человеческой деятельности – формирует ее мотивы, установки, прогнозирует результат.

В словаре когнитивных терминов отмечается, что когниция - понятие когнитивной науки, сочетающее в себе значения двух латинских слов – cognitio, познание, познавание и cogitatio, мышление, размышление. Когниция обозначает познавательный процесс или совокупность психических (ментальных, мыслительных) процессов – восприятия, категоризации, мышления, речи, служащих обработке и переработке информации. Включает осознание и оценку самого себя в окружающем мире и построение особой картины мира – все то, что составляет основу для поведения человека. Когниция – все процессы, в ходе которых сенсорные данные трансформируются, поступая в мозг, и преобразуются в виде ментальных репрезентаций разного типа (образов, пропозиций, фреймов, скриптов, сценариев и т.п.), чтобы удерживаться при необходимости в памяти человека. Иногда когницию определяют как вычисление (computation) – обработку информации в символах, ее преобразование из одного вида в другой – в другой код, в иную структуру.

Разные дисциплины в составе когнитивной науки занимаются разными аспектами когниции: лингвистика – языковыми системами знаний; философия – общими проблемами когниции и методологией познавательных процессов; нейронауки изучают биологические основания когниции и тех физиологических ограничений, которые наложены на протекающие в человеческом мозгу процессы и т.п.; психология вырабатывает прежде всего экспериментальные методы и приемы изучения когниции [Краткий словарь когнитивных терминов, 1996: 18].

В.З. Демьянков отмечает, что когниция – важное понятие когнитивной лингвистики, оно охватывает знание и мышление в их языковом воплощении, а потому когниция, когнитивизм оказались тесно связанны с лингвистикой. Сейчас уже стало аксиомой, что во всём комплексе наук о человеке сталкиваются, в первую очередь, отношения между языком и другими видами человеческой деятельности. Язык даже в большей степени, чем культура и общество, даёт когнитивистам ключ к пониманию человеческого поведения. Поэтому язык оказался в центре внимания когнитивистов [Демьянков, 1994: 17–33].

Стоит отметить, что в настоящее время наука о языке претерпевает значительные изменения: от всестороннего изучения системы языка лингвистика обращается к человеку, субъекту письменно-речевой деятельности. Все более актуальными становятся исследования антропоцентрического характера – в рамках диады «язык – человек».

Истоки антропоцентрической парадигмы восходят к идеям В. фон Гумбольдта и Э. Бенвениста. Особую значимость имело гумбольдтовское понимание языка как «мира, лежащего между миром внешних явлений и внутренним миром человека» [Гумбольдт 1984: 304], как средства, «заложенного в самой природе человека и необходимого для развития его духовных сил и формирования мировоззрения» [Гумбольдт 1984: 51]. Именно В. фон Гумбольдт впервые отметил, что «человек становится человеком только через язык, в котором действуют творческие первосилы человека, его глубинные возможности. Язык есть единая духовная энергия народа» [Гумбольдт 1984: 314]. Э. Бенвенист развивает мысль о том, что в мире существует только человек с языком, человек, говорящий с другим человеком, и язык, таким образом, принадлежит самому определению человека [Бенвенист 2002: 298].

В отечественной лингвистике об антропоцентризме как основном принципе современной лингвистики заговорил Ю.С. Степанов, анализируя концепцию Э. Бенвениста: «Язык создан по мерке человека, и этот масштаб запечатлен в самой организации языка; в соответствии с ним язык и должен изучаться. Поэтому в своем главном стволе лингвистика всегда будет наукой о языке в человеке и о человеке в языке» [Степанов 2002: 15].

Арутюнова Н.Д отмечает, что возникновение антропоцентрической парадигмы в языкознании было предопределено, поскольку сам язык антропоцентричен по своей сути: «человек запечатлел в языке свой физический облик, свои внутренние состояния, свои эмоции, свой интеллект, свое отношение к предметному и непредметному миру, природе… свои отношения к коллективу людей и другому человеку [Арутюнова 1999: 3].

Таким образом, когнитологи перемещают свой взгляд с объекта познания на субъект, анализируется человек в языке и язык в человеке. В центре внимания оказывается личность носителя языка. Новый подход учитывает роль человеческого фактора в языке, вместо опоры на форму появляется опора на содержание, не на механизм, лежащий в основе языка, а на его применение. Следовательно, как отмечает Кубрякова Е.С, сущность антропоцентризма как основного принципа лингвистических исследований заключается в том, что «научные объекты изучаются прежде всего по их роли для человека, по их назначению в его жизнедеятельности, по их функциям для развития человеческой личности и ее усовершенствования… человек становится точкой отсчета в анализе тех или иных явлений, он вовлечен в этот анализ, определяя его перспективы и конечные цели. Он знаменует тенденцию поставить человека во главу угла во всех теоретических предпосылках научного исследования и обусловливает его специфический ракурс» [Кубрякова 1995: 212]. Также Е.С. Кубрякова утверждает, что антропоцентризм – это «один из главных параметров современной лингвистики» [Кубрякова, 1994: 5].

Отметим, что когнитивная лингвистика тесно связана с когнитивной семантикой. Т.А. Симонян отмечает, что «когнитивная семантика - это один из центральных разде­лов когнитивной лингвистики, которая отражает то, как человек воспринимает и осмысливает окружающий мир, а также как опыт его по­знания реализуется в значениях языковых выражений. Главным отличительным фактором когнитивной семантики явля­ется антропоцентричность, т.е. направленность на человека. Человек рассматривается как «наблюдатель», он сам категоризирует и компенсиру­ет, ему приписывается активная роль в выборе языковых средств, выра­жений для описания той или иной ситуации» [Симонян, 2001:50]

Кубрякова Е.С. отмечает, что поскольку возникновение когнитивной лингвистики отчасти было реакцией на пренебрежение семантикой в лингвистических теориях, господствовавших в 1970-х годах, то поэтому семантика стала играть значительную роль в исследованиях по когнитивной лингвистике и рассматривается в ней как ведущая сила в употреблении языка. Её первой важной чертой является новый подход к интерпретации значения и связывание его со знанием. Знание отражает понимание и осмысление мира, достигаемые в предметно-познавательной деятельности человека, и именно это вызывает необходимость появления определённых форм сознания. Значения языковых форм фиксируют человеческий опыт. Их и следует изучать как определённые результаты обработки и переработки информации, поступающей к человеку по всем его чувственным каналам. Таким образом, важной чертой когнитивной семантики является опора на телесный опыт общения человека с миром, попытка установить значимость и конкретный характер простейшей категоризации того, что получает человек при непосредственном восприятии мира, и как происходит его «структурация» в простейших типах человеческой деятельности [Кубрякова 2004: 560].

Изучение лексической семантики с когнитивной точки зрения предполагает анализ того, как познавательный опыт человека реализуется в значениях языковых выражений. Как отмечает Н.Н. Болдырев, когнитивная семантика – это определенная теория значения, в которой значительное место отводится человеку как наблюдателю, «концептуализатору» и «категоризатору». Человеку приписывается активная роль в формировании значений языковых единиц. Это означает, что он сам формирует значения, а не получает их в готовом виде, выбирая языковые средства выражения для описания той или иной ситуации и в понимании мотивов этого выбора.

Полная семантическая характеристика того или иного языкового явления с точки зрения когнитивной семантики предполагает учет не только и не столько объективных характеристик описываемой ситуации, сколько учет специфики ее восприятия, наличия соответствующих знаний, интенций, выделенности конкретных единиц и выбора точки значения (перспективы), концентрации внимания на определенных эпизодах. Все эти моменты определяют, в конечном итоге, формирование у человека в процессе его познавательной деятельности конкретных концептов и категорий, т.е. специфику процессов концептуализации и категоризации мира. [Болдырев 2000:18].

По мнению Е. В. Рахилиной, внутри лингвистики когнитивный подход естественным образом предполагает главенство когнитивной семантики, которая определяет поведение лексем, их частей и сочетаний, конструкций и т.д. Общие и частные семантические исследования должны, в конечном счете, объяснить, поведение языковых единиц. При этом требуется, чтобы объяснения опирались на достаточно общие «человеческие» механизмы, т.е. были антропоцентричны [Рахилина, 1998: 281]. Исследования по когнитивной семантике, в свою очередь, отличает широкий спектр подходов к языковому материалу.

I.2. Основные понятия корпусной лингвистики

В современной лингвистике все больше внимания и предпочтения отводится корпусной лингвистике. В данном параграфе мы рассмотрим такие понятия как корпусная лингвистика, лингвистический корпус, корпусный менеджер, BNCweb и его возможности, использование лингвистического корпуса в рамках проводимого исследования, а также особенности построения лексического профиля слова.

В настоящее время корпусная лингвистика определяется как раздел компьютерной лингвистики, занимающийся разработкой общих принципов построения и использования лингвистических корпусов с использованием компьютерных технологий [Захаров, 2005: 48].

Корпусная лингвистика часто понимается как относительно новый подход в лингвистике, который имеет дело с изучением использования языка в «реальной жизни» с помощью компьютеров и электронных корпусов. Корпусная лингвистика имеет, по крайней мере, две черты, дающие ей основание претендовать на положение самостоятельной дисциплины:

1) характер используемого словесного материала

2) специфика инструментария.

Под названием лингвистический, или языковой, корпус текстов понимается большой, представленный в электронном виде, унифицированный, структурированный, размеченный, филологически компетентный массив языковых данных, предназначенный для решения конкретных лингвистических задач. Задача авторов корпуса – собрать как можно большее количество текстов, относящихся к тому подмножеству языка, для изучения которого корпус создается. Можно сказать, что корпус – это уменьшенная модель языка. Существует множество разных типов корпусов, что определяется многообразием исследовательских и прикладных задач, для решения которых они создаются, и различными основаниями для классификации. В зависимости от поставленных целей и классифицирующих признаков, можно выделить различные типы корпусов.

Корпуса подразделяются по цели, литературности, жанрам, назначению, динамичности, разметке, доступности.

-По цели создания корпусы делятся на многоцелевые и специализированные. Многоцелевые корпусы обычно содержат тексты различных жанров (сюда относятся национальные корпусы), в то время как специализированные корпусы могут ограничиваться одним жанром или группой жанров.

- По критерию «литературности» выделяются литературные, диалектные, разговорные, терминологические и смешанные корпусы.

- По жанрам идет подразделение на литературные, фольклорные, драматургические, публицистические и др.

- По назначению выделяют исследовательские и иллюстративные корпусы. Исследовательские корпусы создаются с целью изучения различ­ных аспектов функционирования языка. Этот тип корпусов ориентирован на широкий класс лингвистических задач. Иллюстративные корпусы создаются после проведения научного исследования: их цель не столько выявить новые факты, сколько подтвердить и обосновать уже полученные результаты. Они служат для выделения из них лингвистических примеров, подтверждающих те или иные языковые (речевые, текстовые) факты, обнаруженные ранее иными лингви­стическими приемами.

- «Динамичность» подразделяет корпусы на динамические и статические. Первоначально корпусы текстов создавались как статические образования, отражающие определенное временное состояние языковой системы. Статические корпусы содержат тексты какого-то небольшого вре­меннóго промежутка. Типичными представителями этого вида корпусов являются авторские корпусы – коллекции текстов писателей.

- Критерий «разметка» делит корпусы на размеченные и неразмеченные. Существуют и другие термины, обозначающие это деление: индексированные и неиндексированные, аннотированные и неаннотированные, таггированные и нетаггированные. В размеченном корпусе словам или предложениям присваиваются метки (тэги) в соответствии с характером разметки: морфологические, синтаксические, семантические, просодические и др.

Важным критерием для пользователей корпуса является его доступность. Свободно доступные корпусы позволяют в любое время в режиме on-line иметь доступ ко всем текстам корпуса в полном объеме.

Любой лингвистический корпус имеет важные особенности. Во-первых, он характеризуется представительностью или сбалансированным составом текстов. Это означает, что корпус содержит по возможности все типы письменных и устных текстов, представленные в данном языке (художественные разных жанров, публицистические, учебные, научные, деловые, разговорные, диалектные и т.п.), и что все эти тексты входят в корпус по возможности пропорционально их доле в языке соответствующего периода. Следует иметь в виду, что хорошая представительность достигается только при значительном объеме корпуса (десятки и сотни миллионов словоупотреблений). Во-вторых, корпус содержит особую дополнительную информацию о свойствах входящих в него текстов (так называемую разметку, или аннотацию). Разметка - главная характеристика корпуса; она отличает корпус от простых коллекций (или «библиотек») текстов, в изобилии представленных в современном интернете, в том числе и на русском языке (таких, как, по-видимому, наиболее известная «библиотека Максима Мошкова» или, например, «Русская виртуальная библиотека»). В настоящее время специалистами создана и пополняется также «Фундаментальная электронная библиотека» русской классической литературы, ориентированная на академический режим подачи текстов, максимально точное воспроизведение авторитетных печатных изданий. Однако такие библиотеки в необработанном виде для научных исследований языка пригодны очень ограниченно. Не следует забывать также, что библиотеки создаются теми, кому интересно в большей степени содержание текстов, чем их языковые качества. Для составителей корпуса такие факторы, как увлекательность или полезность книги, ее высокие художественные или научные достоинства являются важными, но не первостепенными. Корпус, в отличие от электронной библиотеки, — это не собрание «интересных» или «полезных» текстов; это собрание текстов, интересных или полезных для изучения языка. А такими могут оказаться и роман второстепенного писателя, и запись обычного телефонного разговора, и типовой договор аренды и т.п. — наряду, конечно, с классическими произведениями художественной литературы.

Также отметим, что современные компьютерные технологии многократно упрощают и ускоряют процедуры лингвистической обработки больших массивов текстов. Раньше исследователь мог лишь просматривать тексты и вручную выписывать из них нужные примеры; эта предварительная (но абсолютно неизбежная) деятельность была очень трудоемкой и не позволяла обрабатывать большие массивы материала. Теперь ограничений на объем анализируемого материала и скорость поиска информации в нем по существу нет, а это означает, что в распоряжении исследователя оказываются колоссальные массивы текстов самого разного типа. Это не могло не сказаться на развитии наших знаний о языке: возможность массовой — в том числе статистической — обработки текстов, недоступная прежде, позволила обнаружить в структуре и развитии языка такие закономерности, о существовании которых наука раньше или не подозревала, или лишь смутно догадывалась, но не могла строго обосновать. Теперь подлинно научные описания грамматического строя языков, а также авторитетные академические словари — практически все без исключений — должны составляться на основе корпусов этих языков. Учет корпусных данных оказывается крайне желательным (если не строго обязательным) и при многих других более специальных научных исследованиях.

С этой точки зрения основными потребителями лингвистических корпусов являются, конечно, исследователи-лингвисты самого разного профиля. Рассмотрим некоторые примеры использования лингвистического корпуса в современных исследованиях. О.А. Васькова отмечает, что данные корпуса текстов позволяют получить более полные и объективные данные практически обо всех аспектов изучаемого языка [Васькова, 2006]. Е.Б. Кротова в своей работе «Корпусная фразеология» утверждает, что благодаря корпусным данным удалось обнаружить значения, которые не были зафиксированы в существующих словарях [Кротова, 2013]. Отметим также, что в исследованиях, использующих данные лингвистического корпуса, для описания множества слов, окружающего анализируемое, возможно построение лексического профиля слова. Принятый в корпусной лингвистике анализ лексического профиля слова подразумевает нахождение взаимосвязи между значением слова и конструкциями, в которых оно употреблено в корпусе [Janda, Solovyev, 2009: 367].

Однако круг пользователей корпуса вовсе не ограничивается профессиональными исследователями языка. Надежные статистические данные о языке определенной эпохи или определенного автора могут интересовать литературоведов, историков и представителей многих других областей гуманитарного знания. Важное значение корпуса имеют и для преподавания языка в качестве родного или иностранного; всё больше учебников и учебных программ в наше время становятся более ориентированными на корпус. Быстро и эффективно проверить с помощью корпуса особенности употребления незнакомого слова или грамматической формы у авторитетных авторов сможет и иностранец, и школьник, и учитель, и журналист, и редактор, и писатель. Таким образом, лингвистический корпус обращен ко всем, кто в силу профессии, по необходимости или из простой любознательности ищет ответ на вопросы об устройстве и функционировании языка, то есть фактически к большинству образованных носителей этого языка и ко всем, изучающим его в качестве иностранного.

Возникает вопрос о том, чем же корпусная лингвистика отличается от традиционной? На основе прочитанных лекции по корпусной лингвистике В.В. Рыкова, можно привести сопоставительную таблицу этих понятий. (табл.1)

Табл. 1.1. Отличие корпусной лингвистики от традиционной

Корпусная лингвистика Традиционная лингвистика
Основное внимание – изучение речи Основное внимание – изучение языка
Цель – описание языка в том виде, как он проявил себя в речи, представленной в виде специально подобранного корпуса текстов Цель – описание и объяснение языка
В своих исследованиях опирается на данные корпуса текста В своих исследованиях идёт от теории к её объяснению и подтверждению в фактах речи
Предпочитает квантитативные методы Предпочитает квалитативные методы
Видит себя частью традиций, базирующихся на эмпирических методах Видит себя частью традиций, базирующихся на рационалистических методах
Текст рассматривается как некоторая физическая сущность Текст рассматривается как некоторая абстракция
Составление грамматики конкретных языков Изучает языковые универсалии
Основное внимание уделяется форме Основное внимание – не только форме, но и содержанию
Рассматривает тексты в глобальной перспективе Рассматривает тексты в локальной перспективе
Фокусирует своё внимание на как можно более широком взгляде на текст, неограниченном ни какими догмами Анализирует некоторую конкретную, искусственно ограниченную, проблемную область
В своих выводах опирается на наблюдение речевой деятельности, проявленной в виде текстов Опирается на интуицию в отборе речевого материала, в отборе эмпирических материалов своих исследований
Часто пользуется вероятностными методами и статистикой для первичной обработки речевого материала Предпочитает логические рассуждения
Проводится работа с лингвистическими данными (словоупотреблениями) в том виде, в каком они встречались в контексте Предпочитаются искусственные примеры, из изолированных от текста словоупотреблений
Предпочитает индуктивные методы обработки эмпирического словесного материала, считает их сутью научного метода Предпочитает дедуктивные методы обработки эмпирического словесного материала
Верит в научные открытия, основанные на обработке эмпирических данных Верит в открытия, основанные на процедурах, оценках, сравнениях и т.д., т.е., как результат многовековых исследований

Корпус текстов становится мощным инструментом в руках лингвиста лишь посредством специализированных средств. Неотъемлемой частью понятия «корпус текстов» является система управления текстовыми и лингвистическими данными, которую в последнее время чаще всего называют корпусным менеджером (или корпус - менеджером). Корпусный менеджер – это специализированная поисковая система, включающая программные средства для поиска данных в корпусе, получения статистической информации и предоставления результатов пользователю в удобной форме.

Благодаря корпусному менеджеру, появилась возможность получить информацию о словах-коллокатов интересующего слова. Коллокация – количественная мера совместной встречаемости. Коллокации в корпусной лингвистике определяются как статистически правдоподобные сочетания, при этом они могут быть как фразеологизированными, так и свободными [Захаров, 2011: 161]. Коллокат – слово или словоформа, встречающаяся в качестве ближнего соседа данного слова или словоформы. Коллокация – регулярное, устойчивое сочетание слов в предложении. Подробный обзор понятия «коллокация» представлен в работе М.В. Влавацкой [Влавацкая, 2011: 180]. Также уточняется, что термин «коллокация» имеет довольно широкое значение и допускает различные степени коллокационной связи, «сила» которой измеряется статистическими методами.

В.П. Захаров выделяет ряд требований к корпусным менеджерам. Корпусный менеджер должен:

• строить полные конкордансные списки;

• искать не только отдельные слова, но и словосочетания;

• осуществлять поиск по шаблонам (сложные запросы);

• сортировать списки по нескольким критериям, выбираемым пользователем;

• давать возможность отображать найденные словоформы в неограниченном контексте;

• давать статистическую информацию по отдельным элементам корпуса;

•сохранять и распечатывать результаты;

• работать как с отдельными файлами, так и с корпусами, неограниченными по размеру;

• быстро обрабатывать запросы и выдавать результаты;

• поддерживать различные форматы текстовых данных (txt, doc, rtf, html, xml и др.);

• быть легким (интуитивно понятным) в использовании, как для опытного, так и для начинающего пользователя.

Таким образом, корпусный менеджер – это программа, предоставляющая удобный доступ к базе данных корпуса. Он выдаёт в виде списка все контексты, в которых встретилось слово или группа слов, интересующих пользователя корпуса. Это очень похоже на обычную поисковую систему из числа тех, которыми мы пользуемся для поиска в Интернете, только он может искать не только по простому вхождению слова или его словоформы, но и по заданным лингвистическим параметрам. Так, в Национальном корпусе русского языка мы можем, например, запросить выдачу всех контекстов:

• где есть любая из форм глагола идти;

• где есть глагол движения в форме 2 л. ед. ч. н. вр.;

• где просто присутствует форма 2 л. ед.ч. н. вр. любого глагола, независимо от его лексического значения

Каждый фрагмент текста (контекст) в выдаче к

Наши рекомендации