Возраст слова и языковая диахрония. глоттохронология.

Закономерности в языке могут быть синхронические и диахронические.
Диахрония — это изучение процессов, исторически присущих языку. Например, в XIII— XIV вв. в русском языке шел процесс изменения конечных звонких согласных в глухие. После падения редуцированных гласных впервые в русском языке на конце слова оказались звонкие согласные. Было: морозъ, садъ — с гласным [ъ] в конце. После исчезновения [ъ] осталось: мороз, сад — согласные [з], [д] произносились звонко. Постепенно, медленно, шаг за шагом шел процесс оглушения: [з] превращалось в [с], [д] превращалось в [т]. Вначале такое произношение появлялось редко, в виде оговорок. Постепенно оно становилось распространенным у часто употребляемых слов и лишь потом охватывало и другие. Возможно, артикуляция сперва была полузвонкой и лишь только после этого полностью глухой. Диахроническая закономерность заключалась в том, что все звонкие согласные на конце слова превратились в глухие.
Синхрония — это изучение отношений между единицами языка в одну определенную эпоху (т. е. в пределах существования именно этой системы). Сравним: роза — много роз, морозы — мороз, влезу — влез, грызу — грыз, два раза—много раз... Мы замечаем: перед гласным— [з], на конце слова— [с]. Таков закон современного русского языка: на конце слова звонкие согласные чередуются с глухими. Процесса нет. Есть отношение: роза — роз, кожа — кож, трава — трав... Здесь одинаковые отношения: [з] : [с] = [ж] : [ш] = [в] : [ф]... иначе говоря: звонкий согласный перед гласным чередуется с глухим согласным на конце слова.
Сколько времени шло диахроническое изменение [з] в [с] в форме морозъ — моро[з] — л«оро[с]? С XIII по XIV в. Сколько времени занимает синхроническое чередование [з] — [с] ? Этот вопрос не имеет смысла. Звуки чередуются всякий раз, как употребляются соответствующие формы; это чередование дано в модели языка как норма современного произношения.
Разграничение синхронии и диахронии возникло в процессе развития исторического изучения языка. Сравнительно-исторический метод дал возможность установить факты огромной давности. В конце XIX в. ученые — и именно блестящие историки языка И. А. Бодуэн де Куртенэ и Ф. Ф. Фортунатов — выставили требование: надо добиться доказательств, что факты, добытые сравнительно-историческим методом, современны, синхроничны друг другу. Так сама логика исторического исследования привела к проблеме синхронии.

Многие лингвистические понятия имеют два разных значения — синхроническое и диахроническое, например понятие продуктивности. Сравним количество слов с суффиксом -льщик в начале XX в. и сейчас. Мы обнаружим, что их стало больше. Значит, данная модель продуктивна. Это — диахроническая продуктивность.
В современном языке есть соотношения: крепить — крепильщик, точить — точильщик, подметать — подметальщик, поливать — поливальщик... По этой модели можно образовывать слова от любого переходного глагола. Если возникнет потребность в словах пере-кладывальщик, обмазывальщик, подбиваль-щик, они легко войдут в речь, и мы, скорее всего, даже не заметим, что они новые. Дана возможность свободно создавать отношения единиц: переходный глагол — существительное на -лыцик. Такая продуктивность — явление синхроническое.
Синхроническое изучение языка не является внеисторическим. Это исследование связей, отношений в языке определенной эпохи, т. е. изучение исторически конкретное. Поэтому неверно рассматривать строго синхроническое изучение языка как неполное, недостаточное, поскольку его-де необходимо дополнить историческим взглядом. Оно возникло в ходе развития исторического языкознания и само обращено к конкретной языковой данности. И. А. Бодуэн де Куртенэ призывал: «Не мерить язык одной эпохи аршином другой эпохи!» — это и есть девиз синхронической лингвистики. Замечательный советский лингвист В. Н. Сидоров писал: «Не нужна диахрония, когда я изучаю язык в его структуре, то есть как вещь, которая реальна и находит свое употребление. Если вы, положим, хотите изучить шкаф, его назначение, вы будете говорить просто: вот эти полочки для того-то, эти для другого. А как его сделал столяр, вам совершенно ие нужно знать. Это неверно говорят, что в синхронии будто бы всегда есть диахрония. Синхрония должна быть чиста от диахронии».

Глоттохронология — метод определения возраста родственных языков, т е давности их разделения, по количеству слов, имеющих в этих языках одинаковое происхождение, этот метод называют также лексико-статистическим Он был предложен в 1951 —1952 гг американским лингвистом М Свадешем
Языки называются родственными, если они имеют общее происхождение Любой язык все время меняется Если племя или народ, говорящий на одном языке или на близких диалектах, по какой-то причине разделится на две части, которые потеряют связь между собой, то язык каждого из этих двух новых племен или народов будет меняться по-своему Рано или поздно окажется, что они говорят на разных, хотя и похожих, языках Пройдут тысячелетия, и между ними не останется почти никакого сходства, но они по-прежнему оста нутся родственными, хотя даже ученые будут спорить о том, действительно ли эти два языка произошли от одного языка предка
Чем больше времени прошло после разделе ния двух народов, тем меньше общего сохранится в их языках
Если так, то по большему или меньшему сходству родственных языков можно судить о том, как давно они разошлись Надо только найти в них что-то такое, чем можно измерить это сходство. Такой мерой может служить число совпадающих слов, или, вернее, слов, имеющих одинаковое происхождение.
Обычно появление в языке новых слов и исчезновение старых бывает связано с изменениями в окружающем мире: появляются новые вещи, для них должны быть созданы названия; другие вещи исчезают, забываются, и постепенно уходят в прошлое относящиеся к ним слова. Но есть слова, обозначающие предметы или явления, знакомые людям любой страны, эпохи: солнце, луна, огонь, вода, рука, нога, глаз, нос, есть, пить, черный, белый... Они заменяются редко, но это все же бывает. Например, в русском языке старинные слова очи, уста, чело были вытеснены новыми — глаза, рот, лоб.
М. Свадеш пытался определить, как часто происходит в разных языках замена слов с таким «общечеловеческим» значением. Составив список из 215 таких слов (позже он сократил его до 200 и наконец до 100), он проверил его на нескольких языках, история которых хорошо известна. Например, французский язык происходит от латинского (от народной латы-ии); можно сравнить эти два языка и посмотреть, какой процент латинских слов сохранился во французском, а какая часть была замещена совершенно новыми словами. Оказалось, что скорость обновления основного словаря для всех языков более или менее одинакова: в списке из 215 слов за тысячу лет заменяется 15—24% слов, в среднем 19%, а остальные — 81% —остаются прежними. Средний процент слов, сохраняющихся в языке через тысячу лет, называется коэффициентом сохраняемости.
Вскоре выяснилось, что не все слова основного словаря имеют одинаковую устойчивость: одни меняются чаще, другие — реже. Поэтому у каждого списка слов свой коэффициент сохраняемости. У стандартного диагностического списка из 100 слов, принятого сейчас в глоттохронологических исследованиях, он равен 86%.
Если язык распался на два, то в обоих новых языках с течением времени какие-то слова изменятся, но это будут не одни и те же слова. Через тысячу лет в одном языке останется 86% слов, включенных в диагностический список, и в другом языке их останется 86%, но не тех же самых, что в первом языке.

Итак, для того чтобы узнать давность разделения двух языков, мы должны: перевести слова диагностического списка на оба языка; определить (обращаясь к этимологическим словарям), какие слова списка имеют в этих языках общее происхождение; подсчитать долю общих слов, подставить соответствующее число в формулу и вычислить значение t.
Метод Свадеша пригоден не для всех языков. Он неприменим к литературным языкам, имеющим долгую непрерывную историю. Такой язык часто остается почти неизменным в течение многих веков. Пример этого — исландский язык: на нем уже около тысячи лет назад существовала богатая литература, но она и сейчас вполне понятна каждому исландцу. Если народы после разделения не теряли связи между собой и их языки могли влиять друг на друга, то возраст их, вычисленный по формуле, окажется гораздо моложе настоящего. В таком положении находятся, например, языки, входящие в славянскую группу.
Многие лингвисты (может быть, большинство) считают метод глоттохронологии ненадежным или вообще ненаучным. Вот их главные возражения: ста слов слишком мало, чтобы применять к ним статистические методы; понятия, входящие в диагностический список, не универсальны — в конкретном языке не которых из них может не быть; нельзя считать, что коэффициент сохраняемости есть постоянная величина, — вычисление его по разным языкам приводит к разным результатам.
Но защитники глоттохронологии могут ответить, что нередко правильность сроков, вычисленных методом Свадеша, может быть проверена — она подтверждается данными археологии. Например, можно подсчитать, что общий финно-угорский язык распался на две ветви — пермскую и угорскую — около 4000—4500 лет назад; и действительно, уральско-камская археологическая культура, которая, как считается, принадлежала предкам финно-угров, относится к III тыс. до н. э. Прямые предки современных китайцев создали культуру Яишао, существовавшую в IV тыс. до н. э.; приблизительно этим же временем датирует глоттохронология отделение китайского языка от тибето-бирманских. Сванский язык существует отдельно от языков грузинско-заиской группы около 4000 лет, поэтому он имеет собственные, не совпадающие с грузинскими названия для лошади и железа, которые стали известны на Кавказе на тысячу лет позже вычисленного времени его отделения.
Спор о глоттохронологии не закончен, но во всяком случае эта область исследований интересна и заслуживает внимания.

14. Лингвистическая география и статистика.

ЛИНГВИСТИЧЕСКАЯ ГЕОГРАФИЯ(лингвогеография, геолингвистика), раздел лингвистики, изучающий вопросы территориального размещения языков и языковых явлений (на земном шаре, на континентах, в рамках более мелких географических ареалов).

Географические факторы исключительно важны для объяснения многих языковых явлений. Так, тип географической среды, в которой распространяются языки, принципиально влияет на характер генетических связей между формирующимися языками или диалектами. Географическая среда с явно выраженными границами (водные преграды, горы) часто формирует четкие границы между языками (ср. австронезийские языки Океании, распространенные на отдельных островах). Напротив, географическая среда без явных границ (равнины, побережья) часто приводит к возникновению так называемых диалектных цепей, или континуумов, в которых соседние популяции хорошо понимают язык друг друга, а отдаленные – нет (так устроены, например, эскимосские языки инуитской группы, распространенные от Берингова пролива до Гренландии). Географические факторы могут объяснять характер и скорость языковых изменений. Например, грамматический консерватизм литовского языка на фоне его родственников по индоевропейской семье часто объясняется тем, что литовцы в течение многих веков жили в географически изолированной области, ограничивающей контакты с другими языками. С другой стороны, языковые инновации также могут быть вызваны географическими обстоятельствами. В турецком языке, в отличие от тюркских языков более восточных ареалов, в результате влияния соседних иранских и, возможно, семитских языков изменился характер полипредикативных конструкций: вместо типично тюркских конструкций с нефинитными зависимыми глаголами (т.е. неспрягаемымими формами – такими, как инфинитив, отглагольное имя и т.п.) в турецком распространилось сложное предложение с союзной связью и финитным зависимым глаголом. Еще более кардинальному влиянию окружающих (славянских и романских) языков подвергся другой тюркский язык, гагаузский, который приобрел порядок слов «подлежащее – сказуемое – дополнение», в отличие от общетюркского порядка слов «подлежащее – дополнение – сказуемое».

Наблюдаемые общности между языками традиционно именуются изоглоссами. Так, можно сказать, что изоглосса «базовый порядок слов „подлежащее – сказуемое – дополнение"» объединяет гагаузский, румынский и болгарский языки, но отличает их от турецкого.

Исторически лингвистическая география выросла из исследования родственных, в первую очередь индоевропейских языков (см. ИНДОЕВРОПЕИСТИКА), а также из диалектологии. В последней четверти 19 в. накопилось много свидетельств того, что дискретная модель генеалогического древа, применяемая как к языкам одной семьи, так и к диалектам одного языка, является слишком грубым упрощением реальности. Наряду с общим происхождением географическая близость также является очень важным фактором общностей между языками и диалектами. Х.Шухардт и Й.Шмидт предложили так называемую «теорию волн» – идею распространения языковых инноваций из центров, где они возникают, к периферии, подобно кругам, расходящимся по воде от брошенного камня и постепенно затухающим. В результате взаимовлияния смежных языков и диалектов границы между ними оказываются не столь четкими, возникают сходства, которые не могут быть объяснены общим происхождением. Так, в рамках индоевропейской семьи италийские языки (к которым относится прежде всего латынь) по одним признакам объединяются с кельтскими, по другим – с германскими, по третьим – с греческим, и эти сходства в каждом случае не обязательно связаны с общим прошлым языков (существованием периода общности именно данных групп языков), а могут объясняться более поздними контактами на основе территориальной близости. Таким образом, очень трудно решить, с какой ветвью индоевропейской семьи италийские языки следует сгруппировать в первую очередь при создании индоевропейского генеалогического древа.

Формирование лингвистической географии как сложившегося направления обычно связывают с диалектологическими атласами немецкого и французского языков, создававшимися соответственно в конце 19 и в начале 20 в. Значительное влияние имели книги А.Доза (1922) и Э.Косериу (1956), каждая из которых носила заголовок Лингвистическая география. В итальянском лингвистическом направлении, известном как неолингвистика, использовался термин «ареальная/пространственная лингвистика» (М.Бартоли, 1925, 1943). В советском языкознании о проблемах лингвистической географии писали такие авторы, как В.М.Жирмунский, Э.А.Макаев, М.А.Бородина, Д.И.Эдельман, А.В.Десницкая, Б.А.Серебренников.

Основное понятие лингвистической географии – языковой ареал. Можно говорить о больших и малых ареалах. Например, иногда весь мир делят на три макроареала – Старый свет, Новый свет и Океанию. Возможно множество вариантов более дробного деления, вплоть до ареала распространения диалекта того или иного языка. В работах американского лингвиста Дж.Николс были указаны важные типы ареалов – так называемые протяженные (spread) и замкнутые (residual) зоны. Протяженные зоны, обычно представленные на равнинах, характеризуются сравнительно малым генетическим разнообразием. Замкнутые зоны обычно возникают в географически ограниченных ареалах (ограниченных горами, океанами и т.п.) и отличаются высоким уровнем разнообразия. Классические примеры: для протяженной зоны – евразийская степь, для замкнутой зоны – Кавказ.

Практическая сторона лингвистической географии – создание карт и атласов, так или иначе связанных с языками и языковыми явлениями. Не следует отождествлять лингвистическую географию как теоретическую дисциплину с лингвистической картографией. Существует множество видов лингвистической картографии, но самыми распространенными являются два. Во-первых, это карты, отражающие распространение языков; в частности, с 1999 такими картами оснащаются тома издания Языки мира, посвященные отдельным семьям или группам языков. Во-вторых, это карты территориального распространения языковых явлений. На таких картах с помощью тех или иных графических средств указываются изоглоссы.

Наиболее известные ранние атласы, с которыми часто связывают возникновение лингвогеографии как дисциплины, – это атлас немецких диалектов, начатый Г.Венкером в 1876, но изданный лишь в 20 в., а также атлас французских диалектов Ж.Жильерона и Э.Эдмона (1902–1910), состоящий из 1920 карт. В этих диалектологических словарях предметом описания является география распространения отдельных слов. Несколько позже аналогичные начинания были предприняты в других странах, в том числе в России (по инициативе А.А.Шахматова). В 1915 была издана первая диалектологическая карта европейской части России (Н.Н.Дурново, Н.Н.Соколов, Д.Н.Ушаков). В советское время Р.И.Аванесов возглавлял работу по созданию нескольких диалектологических атласов русского языка. С 1958 была начата работа надОбщеславянским лингвистическим атласом. Этот проект затем стал составной частью Атласа языков Европы.

Атлас языков Европы – это проект, который был начат около 1970 при участии лингвистов всех европейских стран. С 1983 по 1997 было опубликовано пять выпусков карт с комментариями. На картах отражается географическое распространение отдельных концептов, например, ГРУША, РАДУГА, РОЖДЕСТВО и т.п. в сотнях различных диалектах языков Европы. Данный атлас продолжает, в несколько модифицированном виде, традицию диалектологических атласов отдельных языков. Большинство карт характеризуют либо этимологии корней, соответствующих данному концепту в европейских языках и диалектах, либо лексические мотивации встречающихся обозначений; на картах последнего типа, например, рус. рождество и франц.Noël отражаются как сходные концетуализации, основанные на идее рождения, а англ. Christmas и нем. Weihnachten представляют другие типы. Однако встречаются и отдельные карты, посвященные более общим лингвистическим явлениям, например грамматическому способу выражения значения идет дождь.

В конце 1980-х годов Европейский союз начал финансирование ЕВРОТИПа (EUROTYP) – проекта, целью которого было грамматическое, типологически ориентированное изучение языков Европы от Атлантики до Урала. В настоящее время уже опубликовано несколько трудов, посвященных отдельным проблемам (порядок слов, видо-временные категории, адвербиальные конструкции, клитики и т.д.).

В 1996 был издан совершенно особый лингвистический атлас – Атлас языков межкультурной коммуникации в Тихоокеанском регионе, Азии и Америке (под ред. С.Вурма и др.). Это коллекция из нескольких сотен карт, показывающих территориальное распространение контактных языков, а также смежных языков. Каждая карта сопровождается статьей, описывающей языковую ситуацию в регионе.

В настоящее время в институте эволюционной антропологии им. М.Планка в Лейпциге готовится Атлас языковых структур мира, целью которого является отображение на картах множества типологически существенных изоглосс. На отдельных картах будет отображено более сотни параметров, таких, как размер инвентаря гласных; аналитический/синтетический/полисинтетический тип выражения грамматических значений; базовый порядок слов; тип маркера релятивизации; тип ролевой кодировки и т.д.

ЛИНГВИСТИЧЕСКАЯ СТАТИСТИКА

— отрасль языкознания, занимающаяся анализом количественных характеристик языка и речи. Осн. исходным материалом Л. с. является текст, рассматриваемый как последовательность лингвистических единиц фиксированного уровня (текст может рассматриваться как последовательность букв, фонем, слогов, морфов, словоформ, предложений). Изучаются статистические характеристики распределения лингвистических единиц в тексте речи и на основе этих данных формируются высказывания о системе языка и механизме порождения текста. Свои важнейшие понятия (напр., понятие генеральной совокупности и выборки), как и матем. аппарат, Л. с. заимствует у математической статистики. Так, в качестве выборки могут служить либо тексты, либо лингвистические формы. Соответственно этому меняется представление о генеральной совокупности: генеральной совокупностью может служить совокупность как текстов, так и совокупность единиц, содержащихся в них.

Кроме того, в качестве различных генеральных совокупностей могут рассматриваться инвентари лингвистических форм: в этом случае каждая лингвистическая форма является выборкой (с повторением) из инвентаря форм одного из предшествующих уровней, напр., любые предложения можно рассматривать как выборку слов из инвентаря словоформ, или как выборку морфов из инвентаря морфем, или как выборку звуков речи из инвентаря фонем.

В зависимости от характера исследуемых лингвистических единиц различают фонологическую статистику, занимающуюся статистическим изучением закономерностей употребления звуков речи, фонем, слогов и т. п., морфологическую статистику, занимающуюся статистическим изучением употребления различных морфологических форм (основ, суффиксов, моделей слов, частей речи и т. п.), лексическую статистику, занимающуюся статистическим изучением закономерностей употребления слов и словосочетаний. Стилистическая статистика устанавливает статистическими методами особенности функциональных, жанровых и индивидуальных стилей. Кроме указанных разделов, в Л. с. выделяют также типологическую статистику, занимающуюся выработкой количественных типологических признаков языков, ихронологическую статистику (глоттохронологию), занимающуюся разработкой методов определения времени расхождения языков. Для всех разделов Л. с. характерно использование понятия частоты лингвистической формы в качестве меры ее употребительности.

Л. с. как науч. дисциплина возникла в связи со стремлением расширить совокупность структурных характеристик лингвистических форм характеристикой их употребительности. При этом исходили из предположения, что любой лингвистической форме присуща априорная вероятность быть употребленной в тексте. Собственно эта вероятность и должна характеризовать употребительность данной лингвистической формы. В качестве способа отыскания этих вероятностей используется выборочный метод статистики, дающий приближенную оценку употребительности лингвистической формы в виде ее относительной частоты. Л. с. изучает не только относительные частоты лингвистических форм и их классов, но и такие характеристики форм, как их размер (длина), сочетаемость (сила связи), распределение в тексте. Различие между текстами может состоять в различном составе форм и в различной их употребительности. Этот факт использует стилистическая статистика, вырабатывающая методы сравнения текстов по составу и употребительности форм и получения оценок степени различия текстов. Тексты на различных языках характеризуются различной относительной частотой элементов сходного типа. Это использует типологическая статистика для разработки методов типологического сопоставления языков и получения оценок для т. н. типологических индексов. Напр., отношение числа морфем к числу слов в тексте может служить мерой синтеза языка (наз. его индексом синтетичности). Вьетнамский язык, в котором слова практически одноморфемные, характеризуется индексом синтетичности 1,06 в отличие от эскимосского, в котором индекс синтетичности равен 3,72. Между ними располагаются английский (1,68), русский и украинский языки.

Отдельную отрасль Л. с. составляют исследования, использующие методы теории информации. В Л. с. сформулирован ряд специфических лингвостатистических задач, таких, как нахождение объема словника текста по его длине, нахождение объема полного словаря писателя по выборке из текстов этого писателя, оценка степени неоднородности текстов на разных уровнях, характеристика статистической структуры текста, установление связей между статистическими характеристиками лингвистических форм разных уровней и др.

В связи с решением этих задач возникли проблемы изучения лингвостатистических распределений. В исследовании структуры языка используются и качественные, и количественные характеристики его элементов, а это позволяет глубже понять механизм языка и принципы его порождения. Данные об употребительности элементов языка, прежде всего слов, широко используются в таких прикладных областях, как преподавание языков, текстология, стенография, машинный перевод, связь и др. См. также Языка информационные измерения.

Наши рекомендации