Лексикографическая деятельность
Итак, среди разнообразных проблем лексикографии сегодня на передний план выдвигаются вопросы, связанные с организацией самой лексикографической деятельности. Все эти вопросы подчинены одной сверхзадаче — повышению уровня обоснованности создаваемых словарей. Следовательно, внимательному рассмотрению должны быть подвергнуты все операции (процедуры) лексикографической работы. <…> Сегодня уже недостаточно сделать какой-нибудь словарь — необходимо обосновать его адекватность; нужно показать, как ее добиться. Тем самым первостепенную важность приобретает разработка методов лексикографической деятельности. <…>
Лексикографическая деятельность распадается на ряд этапов. Их примерная последовательность такова:
I. Разработка системы требований, касающихся внешних параметров словаря (его назначения, круга потребителей, способов использования, информационной области и т. п.).
II. Разработка системы требований, касающихся внутренних параметров словаря (единиц описания, основных свойств метаязыка, объема, структуры, видов словарной информации и т. п.).
III. Формальная инвентаризация выбранных подъязыков (отбор текстов, характеристика грамматических форм, составление предварительных словников, расписывание контекстов и т. д.).
IV. Экспериментальное исследование семантики описываемых единиц (дистрибутивный анализ текстов, проведение тестов с носителями языка и т.д.).
V. Обобщение экспериментальных данных.
VI. Построение дефиниций на соответствующем метаязыке и их проверка в ходе новых экспериментов.
VII. Сбор и систематизация дополнительной информации о каждой словарной единице.
VIII. Оформление словарных статей.
IX. Системный анализ и упорядочение словарных статей.
X. Оформление словаря в целом, включая вспомогательные указатели (или машинная реализация словаря).
Если обратить внимание на относительную важность этих этапов, то, разумеется, на первое место мы должны будем поставить экспериментальное исследование семантики и связанное с ним построение дефиниций. Затем нужно назвать этап выявления дополнительной информации о слове. Наконец, немаловажен и плане обоснованности словаря этап обоснования его состава (словника), начиная с разработки систем требований и кончая формальной инвентаризацией текстовых массивов. Приведенная оценка относительной важности этапов условна. Все названные задачи в конечном итоге связаны с повышением уровня объективности словаря как результата лексикографической деятельности.
<…>
Как указывалось выше, лексикографическая деятельность по своей сущности может быть определена как семантическая инвентаризация языка (или подъязыка). Раскроем эту сущность более подробно.
Дать абсолютно полное описание семантической структуры языка можно только в идеале: имеющиеся трудности связаны как с глубиной, так и с широтой описания. Поэтому реальные описания являются ограниченными.
На пути к полному и адекватному описанию первым шагом является инвентаризация семантических фактов. Она не всегда делается в явном виде. Но для многих задач такой шаг необходим именно в явном виде. Инвентаризация семантики — это составление определенного набора семантических инвентарей (словарей).
Семантический инвентарь (СИ) — это определенным образом упорядоченный перечень всех семантических объектов определенного класса, зафиксированных с помощью некоторого метаязыка с заданной точностью и эксплицитностью. Виды семантических инвентарей могут различаться в зависимости от того, какие семантические объекты фиксируются, на каком метаязыке они описываются, какова степень точности и эксплицитности описания, каков порядок расположения объектов в инвентаре. Как подсказывает практика, в инвентарях могут фиксироваться семантические единицы и их классы, семантические отношения, семантические комплексы и последовательности семантических комплексов.
В чем же состоит разница между полным описанием семантики и ее инвентаризацией? Прежде всего в степени факультативности. Если в первом случае она минимальна, то во втором она может сильно колебаться в зависимости от целей инвентаризации, которые определяют набор составляемых инвентарей. Хотя каждый данный СИ и включает все объекты определенного класса, набор инвентарей может быть более или менее далек от охвата всех вообще семантических объектов. Для каждой данной инвентаризации характерна целенаправленная выборочность инвентаризуемых аспектов семантической структуры. Этим и оправдывается роль инвентаризации как первой (для некоторых целей — и последней) ступени в последовательном описании семантики: отвлекаясь от полноты общей картины (особенно от взаимосвязей ее частей), она дает исчерпывающий состав отдельных фрагментов.
Далее, отмеченная факультативность касается и степени подробности (глубины) описания семантических объектов. При разных целях инвентаризации может фиксироваться разная степень подробности.
Другая существенная черта: при инвентаризации часто оказывается естественным и удобным уделять сравнительно мало внимания семантическим отношениям как таковым, составляя лишь инвентари семантических единиц и комплексов, с тем чтобы на более высоких этапах семантического описания выявить и описать все отношения в зафиксированном множестве единиц и комплексов.
Еще одна черта инвентаризации — ограниченная обобщающая сила; ведь перечень элементов (пусть даже заданный в виде исчисления) — далеко не самый объяснительный способ описания. Однако разумно организованный инвентарь может сильно облегчить и ускорить обобщение зафиксированных данных.
Выделение этапа инвентаризации в семантическом описании позволяет тем самым выделить этап частично алгоритмизуемой работы, не требующей во всех вопросах высокой лингвистической квалификации. Такое разделение труда удобно в лабораторных коллективах, особенно в прикладных областях, и способствует применению ЭВМ.
Каждый СИ задается определенным идентификатором, описывающим совокупность признаков, с помощью которых о любом семантическом объекте можно сказать, входит он в данный СИ или нет. В инвентарь должны входить те, и только те, объекты, которые удовлетворяют его идентификатору.
На СИ естественно наложить следующие интуитивные общие требования: 1) однородность (в нем должны фиксироваться однородные объекты); 2) полнота (он должен полно охватывать какой-либо класс объектов); 3) равномерность (семантические объекты в нем должны быть описаны равномерно, с одинаковой степенью подробности, расчлененности); 4) различительная сила (все фиксируемые объекты должны быть различимы с помощью применяемого метаязыка). Разумеется, частные виды СИ подчиняются своим системам требований.
Выбор системы требований, предъявляемых к конкретному словарю в соответствии с его целевой направленностью, во многом определяет его состав, строение и форму представления. Важно подходить к созданию словаря с самых общих позиций, чтобы с самого начала выбирать оптимальные решения из принципиально возможных.
Поэтому необходимо знать, какие вообще требования могут предъявляться к словарю, как они связаны между собой, какова их относительная важность, какие из них зависят от специального исследования в каждом конкретном случае. Иначе говоря, желательно иметь полную систему возможных частных требований, т. е. исчисление требований. Наряду с их теоретической разработкой необходимо экспериментально изучить их влияние на структуру словаря. Исчисление требований может служить основой для классификации словарей, а также для выработки критериев оценки различных словарей с точки зрения степени соответствия тем или иным требованиям.