Лексикографическая деятельность

Итак, среди разнообразных проблем лексикографии се­годня на передний план выдвигаются вопросы, связанные с организацией самой лексикографической деятельности. Все эти вопросы подчинены одной сверхзадаче — повыше­нию уровня обоснованности создаваемых слова­рей. Следовательно, внимательному рассмотрению должны быть подвергнуты все операции (процедуры) лексикографи­ческой работы. <…> Сегодня уже недостаточно сделать какой-нибудь словарь — необходимо обосновать его адекватность; нужно показать, как ее добиться. Тем самым первостепенную важ­ность приобретает разработка методов лексикогра­фической деятельности. <…>

Лексикографическая деятельность распадается на ряд этапов. Их примерная последовательность такова:

I. Разработка системы требований, касающихся внеш­них параметров словаря (его назначения, круга потребите­лей, способов использования, информационной области и т. п.).

II. Разработка системы требований, касающихся внут­ренних параметров словаря (единиц описания, основных свойств метаязыка, объема, структуры, видов словарной информации и т. п.).

III. Формальная инвентаризация выбранных подъязы­ков (отбор текстов, характеристика грамматических форм, составление предварительных словников, расписывание контекстов и т. д.).

IV. Экспериментальное исследование семантики опи­сываемых единиц (дистрибутивный анализ текстов, прове­дение тестов с носителями языка и т.д.).

V. Обобщение экспериментальных данных.

VI. Построение дефиниций на соответствующем мета­языке и их проверка в ходе новых экспериментов.

VII. Сбор и систематизация дополнительной информа­ции о каждой словарной единице.

VIII. Оформление словарных статей.

IX. Системный анализ и упорядочение словарных статей.

X. Оформление словаря в целом, включая вспомога­тельные указатели (или машинная реализация словаря).

Если обратить внимание на относительную важность этих этапов, то, разумеется, на первое место мы должны бу­дем поставить экспериментальное исследование семантики и связанное с ним построение дефиниций. Затем нужно на­звать этап выявления дополнительной информации о слове. Наконец, немаловажен и плане обоснованности словаря этап обоснования его состава (словника), начиная с разра­ботки систем требований и кончая формальной инвента­ризацией текстовых массивов. Приведенная оценка отно­сительной важности этапов условна. Все названные задачи в конечном итоге связаны с повышением уровня объективности словаря как результата лексикографичес­кой деятельности.

<…>

Как указывалось выше, лексикографическая деятель­ность по своей сущности может быть определена как се­мантическая инвентаризация языка (или подъязыка). Рас­кроем эту сущность более подробно.

Дать абсолютно полное описание семантической структуры языка можно только в идеале: имеющиеся труд­ности связаны как с глубиной, так и с широтой описания. Поэтому реальные описания являются ограниченными.

На пути к полному и адекватному описанию первым ша­гом является инвентаризация семантических фактов. Она не всегда делается в явном виде. Но для многих задач такой шаг необходим именно в явном виде. Инвента­ризация семантики — это составление определенного на­бора семантических инвентарей (словарей).

Семантический инвентарь (СИ) — это определенным образом упорядоченный перечень всех се­мантических объектов определенного класса, зафиксиро­ванных с помощью некоторого метаязыка с заданной точ­ностью и эксплицитностью. Виды семантических инвента­рей могут различаться в зависимости от того, какие семан­тические объекты фиксируются, на каком метаязыке они описываются, какова степень точности и эксплицитности описания, каков порядок расположения объектов в инвен­таре. Как подсказывает практика, в инвентарях могут фиксироваться семантические единицы и их классы, семан­тические отношения, семантические комплексы и после­довательности семантических комплексов.

В чем же состоит разница между полным описанием се­мантики и ее инвентаризацией? Прежде всего в степени фа­культативности. Если в первом случае она минимальна, то во втором она может сильно колебаться в зависимости от целей инвентаризации, которые определяют набор состав­ляемых инвентарей. Хотя каждый данный СИ и включает все объекты определенного класса, набор инвентарей мо­жет быть более или менее далек от охвата всех вообще се­мантических объектов. Для каждой данной инвентаризации характерна целенаправленная выборочность инвентари­зуемых аспектов семантической структуры. Этим и оправ­дывается роль инвентаризации как первой (для некоторых целей — и последней) ступени в последовательном описа­нии семантики: отвлекаясь от полноты общей картины (осо­бенно от взаимосвязей ее частей), она дает исчерпывающий состав отдельных фрагментов.

Далее, отмеченная факультативность касается и сте­пени подробности (глубины) описания семантических объек­тов. При разных целях инвентаризации может фиксировать­ся разная степень подробности.

Другая существенная черта: при инвентаризации часто оказывается естественным и удобным уделять срав­нительно мало внимания семантическим отношениям как таковым, составляя лишь инвентари семантических еди­ниц и комплексов, с тем чтобы на более высоких этапах се­мантического описания выявить и описать все отношения в зафиксированном множестве единиц и комплексов.

Еще одна черта инвентаризации — ограниченная обобщающая сила; ведь перечень элементов (пусть даже задан­ный в виде исчисления) — далеко не самый объяснитель­ный способ описания. Однако разумно организованный инвентарь может сильно облегчить и ускорить обобщение зафиксированных данных.

Выделение этапа инвентаризации в семантическом опи­сании позволяет тем самым выделить этап частично алгоритмизуемой работы, не требующей во всех вопросах вы­сокой лингвистической квалификации. Такое разделение труда удобно в лабораторных коллективах, особенно в прикладных областях, и способствует применению ЭВМ.

Каждый СИ задается определенным идентифика­тором, описывающим совокупность признаков, с помо­щью которых о любом семантическом объекте можно ска­зать, входит он в данный СИ или нет. В инвентарь должны входить те, и только те, объекты, которые удовлетворяют его идентификатору.

На СИ естественно наложить следующие интуитивные общие требования: 1) однородность (в нем должны фиксироваться однородные объекты); 2) полнота (он дол­жен полно охватывать какой-либо класс объектов); 3) рав­номерность (семантические объекты в нем должны быть опи­саны равномерно, с одинаковой степенью подробности, расчлененности); 4) различительная сила (все фиксируе­мые объекты должны быть различимы с помощью применяе­мого метаязыка). Разумеется, частные виды СИ подчиня­ются своим системам требований.

Выбор системы требований, предъявляемых к конкрет­ному словарю в соответствии с его целевой направленно­стью, во многом определяет его состав, строение и форму представления. Важно подходить к созданию словаря с самых общих позиций, чтобы с самого начала выбирать оп­тимальные решения из принципиально возможных.

Поэтому необходимо знать, какие вообще требования могут предъявляться к словарю, как они связаны между собой, какова их относительная важность, какие из них зависят от специального исследования в каждом конкрет­ном случае. Иначе говоря, желательно иметь полную сис­тему возможных частных требований, т. е. исчисление требований. Наряду с их теоретической разработ­кой необходимо экспериментально изучить их влияние на структуру словаря. Исчисление требований может служить основой для классификации словарей, а также для выра­ботки критериев оценки различных словарей с точки зре­ния степени соответствия тем или иным требованиям.

Наши рекомендации