Дистрибутивный анализ ( метод)
Дистрибутивный анализ - метод лингвистического исследования, при котором классификация языковых единиц и изучение их свойств производятся исключительно на основе распределения (дистрибуции) рассматриваемых единиц в потоке речи, т. е. на основе их сочетаемости с другими единицами, которые называются окружением, или Контекстом, рассматриваемых единиц. Д. а. был разработан представителями так называемой дескриптивной лингвистики.
Идея дистрибутивного анализа как особого метода лингвистики широко использовалась американскими языковедами 1930—1940-х гг. (Л. Блумфилдом и его последователями: Б. Блоком, Ч. Хоккетом, 3. Харрисом и др.), которые стремились к выработке твердых объективных методов описания языка. Больше всего боялись они субъективности исследователя, как личной, так и коллективной, навязанной старой традицией. В практике работы над неописанными языками эти лингвисты старались больше полагаться на дистрибутивные критерии. Получая данные от информанта (носителя языка), они стремились как можно реже спрашивать его о смысле сказанного.
При описании языка дескриптивист сначала постарается зафиксировать как можно больше высказываний информантов (связных текстов — монологов и диалогов, отдельных реплик, сопровождающих бытовые ситуации). Далее лингвист с помощью транскрипционных значков передаст звучание на бумагеВот здесь и вступает в ход дистрибутивный анализ
Первая задача — переписать наши тексты в виде последовательности фонем (а не просто звуков) Решение задачи заключается в анализе дистрибуции звуков Сравнивая дистрибу цию двух звуков, мы должны установить, представляют ли они одну фонему или относятся к разным фонемам Три правила помогут нам в этой задаче
1 Если два звука имеют одинаковую дистрибуцию, но не различают смысла высказываний, они являются свободными вариантами одной фонемы Так, русские звуки [г] и [у] встречаются практически в одних и тех же окружениях (Второй звук, звонкий, щелевой, заднеязычный, характерен для юга России, встречается он и в литературном языке, например в словах бога, ага). Поскольку смысл высказываний не меняется, произнесем ли мы [дуга] или [ду уа], два звука считаются представителями одной фонемы.
2. Если два звука могут встречаться в одном и том же окружении и при этом различают смысл высказываний, они являются представителями разных фонем. (Это — общее правило фонологии, лишь записанное в терминах дистрибутивного анализа.) Раз в русском языке встречаются пары рук и лук, мор и мол, болт и борт, значит, этот язык обладает двумя разными фонемами— (л) и (р).
3. Если два звука никогда не встречаются в одном окружении (случай «дополнительной дистрибуции»), они принадлежат одной фонеме; они — аллофоны (представители одной фонемы). В литературном корейском языке звуки [л] и [р] иллюстрируют это правило. Звук [р] встречается между гласными и перед звуком [Ь],звук [л] появляется во всех остальных случаях. В положении перед гласным конечный согласный корня звучит как [р], если же гласного далее нет, то корень кончается звуком [л]. В корейском языке тол («камень»), соединяясь с умул («колодец»), дает сложное слово торумул («колодец, выложенный камнем»). Аналогично кул («пещера») + умул = курумул («глубокий колодец»); пол («щека») + умул = порумул («ямочка на щеке»). Корейские [л] и [р] не встречаются в одном окружении, следовательно, они — аллофоны одной и той же фонемы, а не разные фонемы.
Точно такие же правила применяются при выделении морфем. И здесь кандидаты в морфемы (последовательности фонем) проверяются на сходство дистрибуции. Результат может быть трояким: 1) два кандидата — свободные варианты одной морфемы (калош-а и галош-а); 2) кандидаты — разные морфемы (би- в бить и пи- в пить); 3) они — алломорфы одной морфемы ([би] и [6j] в словах бить и бью: первый встречается перед согласными, второй — перед гласными).
Вслед за выделением подлинных лингвистических единиц (например, фонем или морфем) наступает черед объединения их в дистрибутивные классы. Теперь уже тремя правилами не обойтись. Общий принцип таков: единицы языка, сходные в своей дистрибуции, объединяются в один дистрибутивный класс.Так, английские существительные (boy, book, dog, street, war, peace и т. п.) выделяются в особый класс не потому, что они могут обозначать предмет (это был бы семантический принцип, к тому же приложимый лишь к части существительных), а потому, что в тексте им могут предшествовать слова из класса детерминативов: a, the, my, this, some и т. п., сами же они предшествуют словам из класса глаголов (is, has, looks, сап и т. д.).
26 Метод непосредственно составляющих. Трансформационный метод.
В лингвистической грамматике, составля́ющая (англ. constituent) — структурная единица (отрезок) предложения, целиком составленная из более тесно связанных друг с другом составляющих меньшего размера. Грамматика составляющих (метод составляющих; англ. constituencygrammar, phrasestructuregrammar) основана на постулате, согласно которому всякая сложная грамматическая единица складывается из двух более простых и не пересекающихся единиц, называемых её непосредственными составляющими (англ. immediateconstituent).
Составляющая, включающая более одного слова, называется группой (англ. phrase), а слово, соответствующее корневому узлу в дереве зависимостей, описывающем группу, — вершиной (англ. head) группы.
Представление синтаксической структуры предложения в виде иерархии непосредственных составляющих используется в различных вариантах в формальных моделях языка, в частности в генеративной лингвистикеН. Хомского.
.4. Метод непосредственных составляющих (НС).
Метод НС используется для получения синтаксической информации.
Метод НС основан на следующих содержательных допущениях: 1) существенную роль в синтаксической структуре предложения играет одно единственное отношение - отношение подчинения;2) предложение не собирается непосредственно из словоформ, но строится последовательно, иерархически: элемент, его части соединяются в простые, «строительные» блоки, из этих блоков строятся более крупные блоки, пока все предложение не будет представлено в виде единичного блока; 3) верхом иерархии является сказуемое, или группа подлежащего и сказуемого.
В ходе анализа устанавливаются как единичные предложения, так и отношения между ними.
Для дальнейших определений, Ю.Д. Апресян вводит понятие ранга. Пара символов XY является синтагмой первого ранга, если в любой содержащей ее правильной конструкции она может быть заменена без нарушения правильности конструкции символом Y, а Y заменен парой XY. Возьмем предложение
^ Моя подруга купила очень красивое платье
An Nn V D Aa Na
В данном примере синтагмой первого ранга можно считать пару символов DAn (очень красивое платье), которую можно заменить на An (красивое платье). Синтагмой n-ого ранга называется пара символов XY, если в любой правильной конструкции, где X не входит в состав синтагмы (n - 1)-го ранга, она заменима символом Y, и наоборот. X и Y - непосредственные составляющие синтагмы, причем Y - ядро, X - зависимый элемент. Благодаря этому можно установить синтаксические связи между словоформами и иерархию связей. В приведенном выше примере синтагмами являются AnNn, DAa, NnV и др., причем главным является 2-ой элемент, а зависимым - 1-ый. Каждая синтагма по своим внешним синтаксическим свойствам эквивалентна ядру, взятому в отдельности. Анализ по НС называется свертыванием:
D Ax Ax
Ax Nx Nx
Результирующий элемент предыдущей синтагмы является НС следующей синтагмы, т.е. более простая синтагма может вкладываться в более сложную, выступая в качестве НС последней.
Существует несколько правил свертывания по НС: 1) одновременно можно свертывать не более двух символов в один новый; 2) запрещается перестановка символов; 3) порядок применения правил фиксирован.
Весь процесс анализа предложения (свертывания по НС) может быть изображен тремя способами: в виде правил подстановки, в виде скобочной записи и в виде дерева НС.
Однако эта модель имеет много недостатков: 1) в ряде случаев приводит к грубейшим решениям, поскольку не дает возможности фиксировать различия в синтаксической структуре предложений. Возьмем два предложения:
^ Изучение событий становится интересным
Развитие событий становится интересным.
В первом случае события являются объектом некоторого действия, во втором же - события являются субъектом действия (они сами развиваются).
Анализ по НС не вскрывает этих структурных различий. 2) метод НС не показывает связи между активными и пассивными, утвердительными и отрицательными, утвердительными и вопросительными конструкциями, которые связаны отношением производности. 3) с трудом поддаются анализу экзоцентрические конструкции, конструкции с так называемыми разрывными морфемами и конструкции с аппозитивными элементами вида товарищ Иванов, князь Андрей и др. 4) по настоящему эффективной эта модель является только в рамках простого предложения. 5) не дает возможности ответить на вопрос, что является элементарной единицей языка на синтаксическом уровне.
Виды синтаксических групп
Классификация групп может основываться на частеречной принадлежности их вершин. Такие классы называются фразовыми категориями, или классами групп (англ. phrasalcategories), среди которых выделяются:
· именная группа (группа существительного, ИГ; англ. noun phrase, NP) — возглавляется существительным;
· группа прилагательного (ГПрил; англ. adjectivalphrase, AP) — возглавляется прилагательным;
· наречная группа (НарГ; англ. adverbialphrase, AdvP) — возглавляется наречием;
· предложная группа (ПрГ; англ. prepositionalphrase, PP) — возглавляется предлогом;
· глагольная группа (ГГ; англ. verbphrase, VP) — возглавляется глаголом;
· предложение (П; англ. sentence, S).
Некоторые фразовые категории, в частности именная группа и предложение, обладают свойством рекурсивности — способностью включать в себя составляющие той же фразовой категории
ТРА́НСФОРМАЦИОННЫЙ МЕ́ТОД — используемый в синтаксисе с сер. 20 столетия метод описания структуры предложения, в основе к-рого лежит представление о том, что все множество синтаксич. типов предложений любого яз.строится из огранич. набора исходных, или ядерных, типов с помощью небольшого числа правил, называемых трансформац. правилами, или трансформациями. Ядерными принято считать элементарные, т. е. простые, утвердит.предложения, состоящие из знаменат. глагола в форме изъявит. наклонения наст. времени действит. залога и слов, реализующих его валентности(Водитель закрывает двери, Больной кашляет). Все остальные предложения являются производными.
К числу стандартных, широко употребит.трансформаций относятся, напр., пассивная(Двери закрываются водителем), вопросит. (Водитель закрывает двери?) и выделит.трансформации(Водитель закрывает двери). В результате выделительной трансформации из исходного предложения получается предложение с выделенной темой(Что касается водителя, то он закрывает двери).
Исходные предложения могут трансформироваться не только в предложения, но и в словосочетания. Напр., предложение Больной кашляет преобразуется в производное словосочетание кашель больного; Ребенок плачет — плачущий ребенок. Подобные трансформации также служат для построения разл. производных предложений, эл-тами к-рых и выступают полученные словосочетания (Врачабеспокоит кашель больного, Плачущий ребенок всем надоел).
К числу трансформаций, в ходе к-рых происходит изменение значения исходного предложения, относятся, напр., модальная(Водитель закрывает двери — Водитель хочет закрыть двери)и фазовая трансформация (Больной кашляет — Больной начинает кашлять). В подобных случаях в производных предложениях появляются операторные модальные и фазовые глаголы.
Трансформац. процесс в принципе может быть многостепенным. В результате последоват. применения разл. трансформаций образуются цепочки предложений, связанных трансформац. отношениями(Водитель закрывает двери — Водитель начинает закрывать двери — Водитель хочет начать закрывать двери). Трансформац. процесс в принципе может быть и разнонаправленным. Это значит, что из каждого исходного предложения можно построить неск. ветвящихся цепочек предложений, к-рые в совокупности образуют т. н. "древо производности".
С помощью Т. М. в яз.-знании устанавливаются закономерности образования и употребления в тексте предложений, к-рые хотя и обозначают одну ситуацию, но по-разному ее характеризуют.
Компонентный анализ.
Компоне́нтный ана́лиз — в языкознании: метод исследования плана содержания значимых единиц языка, целью которого является разложение значения на минимальные семантические составляющие. Основан на гипотезе о том, что значение всякой языковой единицы состоит из семантических компонентов (сем) и словарный состав языка может быть описан с помощью ограниченного (сравнительно небольшого) числа семантических признаков[
Уард Гуднаф ввел понятие " компонентный анализ ", который описывает исследовательскую технику, развившуюся в рамках лингвистики , и которая, по его мнению, должна быть применена и к другим аспектам культуры. Используя эту систему формального семантического анализа, исследователь может открыть собственные когнитивные процессы информанта.Метод компонентного анализа был развит Н. С. Трубецким применительно к фонемам и в силу своей эффективности и универсальности распространился на исследование грамматических и затем лексических значений.Признаки для описания выделяются на основании сопоставления однородных единиц языка. Так, при сопоставлении фонемы <д> и <т> различаются по единственному признаку - звонкости - глухости; все остальные признаки у них общие, интегральные. Напротив, для фонем <д> и <б> признак звонкости-интегральный. Последовательно сопоставляя фонему, например <д>, с другими фонемами - <н>, <д>, <з>, выделяем дифференциальные признаки неназальности, твердости, взрывности, совокупностью которых и определяется фонема <д>, представляющая собой со структурной точки зрения пучок дифференциальных признаков.