Пример реализации тезаурусной системы на ИСИР
Созданные компоненты реализации тезауруса позволяют просматривать, редактировать и добавлять данные тезауруса в систему через webформы а также импортировать и экспортировать данные в систему в специальном XMLформате.
Реализация тезауруса выполнена в соответствии с технологией Интегрированной Системы Информационных Ресурсов (ИСИР)
Эта технология имеет следующие особенности архитектуры. Компоненты системы, реализующие бизнес-логику приложения, работают с объектной моделью данных на основе RDF/RDFS. Это достигается с помощью специальных компонентов, осуществляющих отображение объектной модели в реляционную базу данных. При этом хранимые информационные объекты, которыми оперируют компоненты бизнеслогики, реализованы через Javabean классы, отображаемые в соответствующие таблицы СУБД.
Для создания форм редактирования данных тезауруса был использован сервис ИСИР FormBuilder
Данный сервис предназначен для автоматизации процесса построения форм редактирования ресурсов, их заполнения начальными данными по полям редактируемых объектов и обработки данных, получаемых из этих форм. Сервис представляет собою набор специальных тегов, с помощью которых создаются JSPстраницы форм редактирования.
Для представления данных тезауруса реализация использует «XMLсерверные страницы ИСИР (ISP*XSP)»
ISP*XSP отвечают за динамическую генерацию RDF/XML-документов, то есть за выборку необходимой объектной информации из хранилища при помощи Ядра ИСИР и представление её в RDF/XMLвиде. Дальнейшее преобразование информации в необходимое представление (например, в виде HTML для пользователя Internet) осуществляется с помощью XSLTфильтров.
Рис. 3 Алгоритм получения готового запроса
Язык «XMLсерверных страниц» в ИСИР позволяет максимально наглядно и декларативно описать, какие данные следует выбрать. Такая страница похожа на шаблон XMLдокумента, в который осталось лишь подставить значения из хранилища.
Существует 2 способа функционирования тезауруса в системе:
1. Тезаурус встроен в информационную систему и является ее неотъемлемой частью.
2. Тезаурус является хранимым ресурсом информационной системы.
Во втором случае для просмотра и редактирования всех таких тезаурусов, а также его использования их для классификации и индексации других ресурсов, используются единые интерфейсы (например, предлагаемые в данной реализации).
Тезаурусы могут динамически в процессе работы системы добавляться и удаляться из нее.
В первом случае хранение тезауруса в базе данных системы осуществляется так же как и во втором случае, или в отдельных таблицах. Кроме того, для конкретного встроенного тезауруса могут быть созданы отдельные Javaклассы – наследники классов, используемых в для тезаурусов хранимых ресурсов. Это позволит при разработке информационной системы для разных встроенных тезаурусов использовать при необходимости разные интерфейсы, например, упрощенные для простых иерархическихрубрикаторов.
Заключение
Следуя всей вышеприведенной информации, можно сделать вывод, что тезаурусные модели- это модели, которые основаны на принципе организации словарей, содержат определенные языковые конструкции и принципы их взаимодействия в заданной грамматике. Эти модели эффективно используются в системах-переводчиках, особенно многоязыковых переводчиках. Принцип хранения информации в этих системах и подчиняется тезаурусным моделям. Это не самый популярный в данное время способ хранения информации, однако во некоторых сферахдеятельности он практически незаменим и максимально рационален.
Список литературы
1. Описание и использование тезаурусов в информационных системах, подходы и реализация // w2 URL: http://w2.ict.nsc.ru/jspui/bitstream/ICT/1221/1/adjiev.pdf (дата обращения: 29.10.2016).
2. Жмайло С. В. К разработке современных информационно-поисковых тезаурусов. // НТИ. Сер. 1. - 2004. - №1. - С.23-31. (дата обращения: 29.10.2016).
3. Азарова И. В., Митрофанова О. А., Синопальникова А. А. Компьютерный тезаурус русского языка типа WordNet
http://www.dialog-21.ru/dialog.asp?page=26362&parentmenuid=711-60 kb. (дата обращения: 29.10.2016).