Лабораторная работа № 10 «Корпусная лингвистика. Мангеймский корпус немецкого языка»
1 Изучите основную информацию о Мангеймском корпусе немецкого языка (http://www1.ids mannheim.de/kl/projekte/korpora, http://www.ids mannheim.de/cosmas2/), который является самым представительным корпусом немецкого языка, поддерживаемый Институтом немецкого языка (Мангейм). Он содержит более 5,4 млрд. слов и состоит из текстов художественной, научной и научно-популярной литературы периодики, а также подкорпуса устной речи. Ответьте на следующие вопросы.
- Кто является создателем МКНЯ?
- Чем характеризуется корпус?
- Какие типы разметок существуют в МКНЯ? Поясните каждую дефиницию.
- Как Вы, как переводчик, можете использовать МКНЯ?
- Какие виды подкорпусов включает МКНЯ? Охарактеризуйте каждый подкорпус.
2 Зарегистрируйтесь на сайте https://cosmas2.ids-mannheim.de/cosmas2-web/.
3 Для выполнения последующих заданий необходимо изучить инструкцию, «как пользоваться корпусом» размещенную на сайте https://cosmas2.ids-mannheim.de/cosmas2-web/faces/investigation/archive.xhtml в разделе Hilfe (рисунок 4 ).
Рисунок 4
4 Прежде чем начать частотный поиск слов в корпусе необходимо задать параметры, используя функцию «optionen» (рисунок 5).
Рисунок 5
5 Используя различные архивы корпусов: например: W Archiv der geschriebenen Sprache, W2Archiv der geschriebenen Sprache, W3Archiv der geschriebenen Sprache, и т.д. изучите использование следующих слов: Moskau, Putin, Russische Föderation, Feuer, Kosmos, Computer, Zufall.
Каждый архив содержит некоторое количество корпусов, распределенных по различной тематике, годам, газетам и т.д. Выбор корпуса сделайте самостоятельно. Представьте данный анализ письменно по следующим критериям: архив, вид корпуса, года газет, в которых использовались данные слова, количество текстов, количество использований. Представьте два-три предложения, в которых использовалось слово.
6 Выявите при помощи корпуса значение глаголов eingehen, umgehen на основе сочетаемости. Сопоставьте полученный список значений со словарями.
7 Выявите при помощи корпуса возможное управление глаголов abhängen, ableiten, diskutieren. Представьте эти примеры в документе Word.
11 Лабораторная работа № 11 «Корпусная лингвистика. Корпус современного американского варианта английского языка (COCA)»
1 Изучите основную информацию о национальном корпусе современного американского варианта английского языка (Corpus of Contemporary American English – COCA) на сайте http://corpus.byu.edu/coca/ и ответьте на следующие вопросы.
- Кто является создателем COCA?
- Чем характеризуется данный национальный корпус?
- Какие типы разметок существуют в корпусе современного американского варианта английского языка? Поясните каждую дефиницию.
- Как Вы, как переводчик, можете использовать COCA?
- Какие виды подкорпусов включает COCA? Охарактеризуйте каждый подкорпус.
2 Для выполнения последующих заданий необходимо изучить инструкцию, «как пользоваться корпусом» размещенную на сайте http://corpus.byu.edu/coca/ в разделе Help (рисунок 6).
Рисунок 6
Для работы в корпусе необходимо зарегистрироваться (рисунок 7).
Рисунок 7
3 Осуществите простой частотный поиск.
В устном корпусе, задав в выборе подкорпуса следующие параметры: регистр, тематика текста, устная публичная речь, устная непубличная речь, исследуйте употребление следующих слов: cognitive, think, I (рисунок ).
4 В газетном корпусе, задав следующий параметры: 1999-2005, 2006-2009 исследуйте употребление следующих слов: Brexit, President race, White House.
5 В основном корпусе исследуйте употребление словосочетания с «cognitive», устанавливая расстояние 1-3 (рисунок 8).
Рисунок 8
Для осуществления частотного поиска, задайте следующие параметры (рисунок 9)
Рисунок 9
Варианты сортировки результатов для параметра Mi (рисунок 10):
- По MI (=mutual information) – выбрать «relevance» в первой строчке, «frequency» во второй строчке .
- По частотности – выбрать «frequency» в первой строке, «mutual info» – во второй.
6 Осуществите поиск N-grams (рисунок 11).
- N = number of words
- N-grams – сочетания слов по количеству компонентов (без оценки устойчивости сочетания, «коллокационности» и т.д.)
Рисунок 10
Рисунок 11
7 Осуществите простой поиск KWIK (key words in context).Осуществите поиск allow как глагол, need как глагол, need как существительное, suggest.
Варианты поисковых запросов (рисунок 12):
- [=serious] - все синонимы без вариантов грамматических форм.
- [=question].[n*] – все синонимы для question как имени существительного.
- [[=question]].[n*] – все синонимы для question как имени существительного во всех возможных грамматических формах (леммы). Рисунок 12
8 Проведите один из указанных ниже видов анализ при помощи корпуса:
СЕМАНТИКА
1) Выясните при помощи корпуса значения глагола RISK на основе сочетаемости. Сопоставте полученный список значений со словарями. Проверьте возможные переводы на русский по параллельному корпусу.
2) Проанализируйте структуры stop doing sth vs. stop with doing sth- Представьте возможные варианты значений и интерпретаций, переводов на русский язык.
3) Выявите особенности семантики due to / owing to / because of /as
СЛОВООБРАЗОВАНИЕ
1) Найдите все возможные дериваты с префиксом dis-.
2) Найдите все возможные дериваты с суффиксом –less.
3) Найдите все возможные дериваты с компонентом –phobia.
4) Составте список глаголов, образованных при помощи суффикса –ize в британском и американском вариантах. Найдите новообразования, не зафиксированные в словарях. Представте переводы на русский язык (привести примеры из контекста).
СОЧЕТАЕМОСТЬ
1) Найдите случаи постпозитивного употребления прилагательного в английском (N+Adj). (left branching).
2) Выявите возможные различия употребления глагола protect against и protect from.
3) Найдите все случаи заполнения правой валентности в модели kind of + Ving.
4) Найдите все случаи правой сочетаемости выражения not (no) more than _____.
5) Дискурсивное варьирование в употреблении чистой формы (без частицы TO) и полной формы инфинитива (с частицей TO) после ряда глаголов: зависимость от функционального типа дискурса (например, help smb do sth; need; dare).
6) Выявите особенности употребления наречия vs. прилагательного как правой валентности глагола act
7) Выявите особенности сочетаемости наречия clear.
8) Выявите особенности сочетаемости наречия pretty.
9) Выявите особенности сочетаемости наречия truly.
10) Выявите особенности употребления предлогов после имен существительных prospect, hope, forecast, prognosis.
11) Выявите сочетаемость глагола know с наречием suddenly; регистровое, региональное варьирование; особенности перевода на русский по данным параллельных корпусов.
КОЛЛОКАЦИИ, ИДИОМАТИКА
1) Найдите идиоматические выражения, образованные по модели IN + NOUN + OF. Определите критерии идиоматичности. Сопоставить данные со словарями.
2) Найдите идиоматические выражения, образованные по модели AT + (THE) NOUN + OF. Определите критерии идиоматичности. Сопоставить данные со словарями.
ПРОБЛЕМЫ ПЕРЕВОДА
1) Выявите особенности перевода unlike (параллельный корпус).
2) Выявите особенности перевода глагола know (параллельный корпус)
3) Найдите варианты перевода выражений с squall (шквал___) в метафорическом значении (например, шквал огня).
СИНОНИМЫ, СИНОНИМИЧЕСКИЙ РЯД
1) Представьте корпусный анализ сочетаемости квантификаторов (интенсификаторов) с прилагательными или наречиями: utterly, totally, completely, entirely.
2) Представьте сравнительную характеристику употребления наречий fairly и rather с прилагательными.
3) Найдите различия (если есть) между allocate и distribute
4) Проанализируйте употребление лексем-интенсификаторов с лексемами семантического поля УВЕРЕННОСТЬ: sure, certain, confident. Распределите интенсификаторы по категориями (maximizers, boosters, compromizers, diminishers, minimizers, approximators). Проведите сравнительный анализ по частотности, сделайте выводы.
СОЦИОЛИНГВИСТИЧЕСКИЙ АНАЛИЗ (Lancaster corpus)
1) Представьте анализ гендерных особенностей употребления лексем-интенсификаторов:
- Maximizers: absolutely, completely, utterly, in all respect;
- Boosters: badly, deeply;
- Compromizers: kind of, sort of;
- Diminishers: partly, slightly, somewhat, a little;
- Minimizers: a bit, barely, hardly
- Approximators: almost, nearly
МОРФОЛОГИЯ
1) Представьте сравнительный анализ частотности морфологических форм peas vs. pea? facts vs. fact? course vs. courses? good vs. better? be done vs. get done?
2) Проанализируйте тенденции в употреблении падежных форм who/whom.
3) Выявите варьирование в употреблении морфологической формы родительного падежа vs. именительного падежа для имен существительных, обозначающих профессии.
4) Выявите частотность в употреблении морфологических форм глагола: perfect – non-perfect (для глаголов mean, hear, understand, see, feel).
5) Опишите употребление way в качестве наречия степени.
6) Выявите возможные случаи совмещения значения активного и пассивного залогов (так называемый средний залог, например, the book divides…) при употреблении активной и пассивной форм глагола divide.
7) Опишите употребление вариантов форм степеней сравнения двусложных наречий и прилагательных (напр., often, early, friendly): синтетический и аналитический способы образования, читывая региональное, регистровое варьирование, частотность. Сопоставьте с данными нормативных грамматик, словарей.
8) Опишите частеречное варьирование лексемы unlike. Проведите анализ частеречных статусов по корпусу, затем проверка по словарям и грамматическим справочникам.
9) Представьте сравнительный анализ GET-passive vs. BE-passive vs. BECOME-passive.
10) Представьте частотность конкурирующих грамматических форм (want vs. is wanting; have understood vs. understood; I hear vs. I heard).
11) Проанализиурйте употребление формы ain’t в шотландском диалекте.
12) Проанализиурйте тенденции в употреблении морфологической формы родительного падежа (генитив):
- Перечислите существующие значения генитива (по учебникам грамматики)
- По указаниям в грам.справочникам выделите, какие группы существительных могут образовывать формы генитива.
- По корпусным базам данных найдите слова, используемые в форме генитива. Сопоставте полученные данные с данными грамматических справочников.
- Сгруппируйте слова по семантическим категориям.
- Определите слова каких семантических групп наиболее частотны в форме генитива.
- Определите какие значения генитива наиболее частотны.
- Используя метод трансформаций, определите, может ли данное значение выражаться формой of+Noun
- Выявите тенденции: какие из значений генитива продолжают сохраняться в реальной речи.
МОРФОСИНТАКСИС
1) Найдите все (фразовые) глаголы с послелогом up/down; in/out, on/off
2) Представьте анализ употребления split infinitive.
3) Просмотрите использование герундиальной и инфинитивной неличных форм после глаголов start, begin, finish, stop. Дополнительно: выявите регистровую зависимость, региональное варьирование (американский vs.британский варианты), отметьте тенденции.
4) Проанализиурйете употребление рефлексивных местоимений: INDULGE ONESELF (in doing sth) or INDULGE (in doing something)
5) Найдите случаи элатива. Выявите тенденцию в употреблении определенных прилагательных в форме элатива:
- After three years, you would think this president could learn how to work in Washington, D.C. If there has ever been a greater example of on-the-job training, this is it. Couldn't have been at aworst time for America.
- agreatest hits album of love songs in honor of Valentine's Day.
(Поиск наиболее частотных употреблений превосходной степени прилагательного в сочетании с существительным с неопределенным артиклем).
СИНТАКСИС
1) Представьте анализ атрибутивного/предикативного употребления прилагательных grandiose, unstrustworthy
ЛЕКСИМОРФОСИНТАКСИС (?)
1) Создайте модель употребления существительного REFUGE (синтаксис, сочетаемость, семантика)
2) Изучите ипользование глаголов чувственного восприятия в форме CONTINUOUS – региональное, регистровое варьирование, возможные изменения значения.
КОННОТАЦИИ
1) Выявите оценочные коннотации для BE AWARE OF + ___ (POS or NEG?)
ВАРЬИРОВАНИЕ
1) Найдите различия в употреблении наречий PARTLY и PARTIALLY
2) Выявите варьирование в употреблении I shall vs. I will в различных типах дискурса (региональное, регистровое варьирование, возможные изменения значения).
3) Найдите случаи употребления It’s I vs. It’s me. Провести анализ регистрового /регионального варьирования.
4) Выявите региональное варьирование в употреблении форм PERFECT (американский vs. британский варианты) для различных групп глаголов (глаголы мнения, движения, состояния – по 3-4 глагола в каждой группе).
5) Представьте анализ особенностей употребления конкурирующих выражений: risk vs. take a risk; be proud of vs. take pride in; walk vs. have a walk; talk vs. have a talk, etc.
6) Выявите особенности варьирования значения глагола screw в зависимости от регистра.
АНАЛИЗ ТИПОЛОГИЧЕСКИХ ТЕНДЕНЦИЙ
1) Какие типологические тенденции в английском языке иллюстрируют следующие языковые факты?
- A greatest hits album of love songs in honor of Valentine's Day.
- The best we can hope for, it appears, is some truly high-quality reality show drama.
- Auto dealers said their sales were well below year-ago levels.
- As for the other suspect, neighbors and friends say eighteen- year-old Dallin Morgan was a good student taking AP classes.
- Well, I think if you commit to winning and you change the entire dynamic in the region. You change the dynamic with respect to the Taliban, and you recognize that we're going to stay there and we're going to finish the job.
Далее:
2) Найдите примеры употребления существительного во множественном числе в качестве определения.
3) Найдите случаи лексикализации словосочетаний с прилагательными HIGH/LOW, SHORT/LONG.
4) Найдите случаи лексикализации лексикализации словосочетаний с существительным YEAR.
5) Найдите случаи субстантивизации прилагательных с компонентом –ic (e.g. dynamic).