Современные реализации RDF

В настоящее время разработано несколько применений RDF. Наиболее известными среди них являются:

Dublin Core – средства описания документов;

RSS – формат для публикаций и обмена содержимого между Web-сайтами;

RDFa – средство для вставки утверждений RDF непосредственно в документ XHTML.

Dublin Core

Дублинское ядро (англ. Dublin Core) – словарь (семантическая сеть) основных понятий английского языка, предназначенный для унификации метаданных для описания широчайшего диапазона ресурсов. С 2005 года словарь представлен и в формате RDF и является популярной основой для описания ресурсов в Семантической паутине.

Словарь разделён на два уровня:

– простой (неквалифицированный, simple), состоящий из 15 элементов;

– компетентный (квалифицированный, qualified), состоящий из 18 элементов и группы т. н. тонкостей (или квалификаторов), которые уточняют семантику элементов для повышения полезности поиска ресурсов.

Семантика Дублинского ядра была создана международной междисциплинарной группой профессионалов библиотечного дела, компьютерных наук, кодирования текстов, музейного дела и других смежных групп.

Простой набор элементов метаданных Дублинского ядра (Dublin Core Metadata Element Set; DCMES) состоит из 15 элементов метаданных:

Title – название;

Creator – создатель;

Subject – тема;

Description – описание;

Publisher – издатель;

Contributor – внёсший вклад;

Date – дата;

Type – тип;

Format – формат документа;

Identifier – идентификатор;

Source – источник;

Language – язык;

Relation – отношения;

Coverage – покрытие;

Rights – авторские права.

Квалифицированный (компетентный) набор элементов метаданных Дублинского ядра, помимо 15 вышеперечисленных, может включать:

Audience – аудитория (зрители);

Provenance – происхождение;

RightsHolder – правообладатель.

Каждый элемент опционален и может повторяться. Инициатива метаданных Дублинского ядра (Dublin Core Metadata Initiative; DCMI) описала стандартные пути определения элементов и поощряет использование схем кодирования и словарей. Не существует заранее заданного порядка перечисления этих элементов. DCMI также поддерживает небольшой общий словарь, который рекомендуется использовать с элементом Type (Тип) и который состоит из 12 слов.

Полная информация по определениям элементов и отношениям между ними описана в Реестре метаданных Дублинского ядра (Dublin Core Metadata Registry). Познакомиться со спецификацией Dublin Core можно на сайте http://dublincore.org/.

Приведем пример RDF-описания электронного журнала с использованием Dublin Core.

<rdf:RDF

xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"

xmlns:dc="http://purl.org/dc/elements/1.1/"

xmlns:dcterms="http://purl.org/dc/terms/">

<!-- Описание электронного журнала -->

<rdf:Description rdf:about=

"http://magazine.tele-satellite.com/TELE-satellite-0805-rus.pdf">

<!-- Наименование журнала на английском и русском языках -->

<dc:title xml:lang="en">TELE-satellite, 05-06, 2008</dc:title>

<dc:title xml:lang="ru">Теле-сателлайт, 05-06, 2008</dc:title>

<!-- Описание журнала -->

<dc:description>Крупнейший в мире журнал по спутниковым

приемо-передающим устройствам</dc:description>

<!-- Создатель (редактор) журнала -->

<dc:contributor>Alexander Wiese</dc:contributor>

<!-- Издательство, выпускающее журнал -->

<dc:publisher>TELE-satellite Medien GmbH85774 Unterföhring,

Германия</dc:publisher>

<!-- Дата выпуска журнала -->

<dc:date>2008-05-01</dc:date>

<!-- Тип журнала -->

<dc:type>электронный журнал</dc:type>

<!-- Темы журнала (ключевые слова) -->

<dc:subject>

<rdf:Bag>

<rdf:li>СПУТНИКИ</rdf:li>

<rdf:li>ОБОРУДОВАНИЕ</rdf:li>

<rdf:li>ТЕЛЕКОММУНИКАЦИИ</rdf:li>

</rdf:Bag>

</dc:subject>

<!-- Формат MIME файла с журналом -->

<dc:format>application/pdf</dc:format>

<!-- Язык, на котором выпущен журнал -->

<dc:language>ru</dc:language>

<!-- Идентификатор журнала (в формате ISSN) -->

<dc:identifier rdf:resource="urn:issn:1619-8786"/>

<!-- Ресурс, частью которого является журнал -->

<dcterms:isPartOf rdf:resource="http://www.tele-satellite.com/rus/"/>

<!-- Ссылка на этот журнал -->

<dcterms:isReferencedOf rdf:resource=

"http://www.tele-satellite.com/eng/"/>

</rdf:Description>

</rdf:RDF>

RSS

Под RSS понимается семейство форматов на основе XML, предназначенных для описания лент новостей, анонсов статей, изменений в блогах и т.п.

Информация из различных источников, представленная в формате RSS, может быть собрана, обработана и представлена пользователю в удобном для него виде специальными программами, которые называются программами чтения RSS (RSS reader), программами чтения каналов (feed reader) или программами-агрегаторами (aggregator). Эти программы могут быть как отдельными программами, так и плагинами, встроенными в Web-браузеры. Все наиболее распространенные Web-браузеры: Internet Explorer (начиная с версии 7), Chrome, Firefox, Opera и Safari имеют встроенные плагины для работы с RSS.

Из-за того, что форматы RSS создавались разными организациями и людьми, существует семь различных форматов RSS, в которых даже сама аббревиатура RSS расшифровывается по-разному. Эти форматы можно разбить на две большие группы.

Первую группу составляют форматы, в которых документ XML формируется с использованием RDF. Это первый формат RSS – RSS 0.90, разработанный фирмой Netscape в 1999 году на основе тогда еще предварительных рекомендаций языка RDF (эта версия сейчас уже не используется). Новая версия, RSS 1.0 была принята в 2000 году. В этих форматах RSS расшифровывается как RDF Site Summary (краткое содержание сайта на основе RDF). Версия RSS 1.0 поддерживается рабочей группой RDF-DEV.

Вторая группа включает форматы на основе разработанных наборов элементов XML – приложений XML (без использования языка RDF). В эту группу входят форматы RSS 0.91, RSS 0.92, RSS 0.93 и RSS 0.94. В этих форматах RSS расшифровывается как Rich Site Summary (содержание сайта с широкими возможностями). На основе RSS 0.94 в 2002 году был разработан новый формат – RSS 2.0. В этой версии RSS расшифровывается как Really Simple Syndication (по-настоящему простое распространение). В настоящее время все форматы второй группы поддерживаются группой RSS Advisory Board в центре Беркмана (Berkman Center for Internet & Society) в Гарварде.

Практически все реализации RSS в настоящее время используют либо RSS 1.0, либо RSS 2.0, а все Web-браузеры могут работать с обоими форматами.

Знакомство с форматом RSS можно начать, например, здесь:

https://ru.wikipedia.org/wiki/RSS

RDFa

Язык RDF/XML предоставляет широкие возможности для построения логических утверждений с целью их последующей семантической обработки на компьютере. Однако для семантической обработки документов на языках других приложений XML, необходимо иметь средства импорта документа RDF/XML или его фрагмента в документ, например, на языке XHTML. В настоящее время это является довольно сложной задачей. Кроме того, одни и те же данные, используемые в документе, могут потребоваться и для предложений RDF/XML, т.е. одни и те же данные будут дублироваться, что может существенно увеличить объем документа и осложняет его корректировку (данные необходимо будет откорректировать в двух местах).

Чтобы избежать этих сложностей, консорциум W3 предложил задавать утверждения RDF в атрибутах элементов документа XML. При компьютерной семантической обработке документа имена и значения этих атрибутов переводятся в утверждения на языке RDF/XML с помощью специального модуля программы обработки – процессора RDF. Набор этих атрибутов и правил их обработки описан в спецификации RDFa консорциума W3. Хотя эта спецификация предназначена для описания утверждений RDF в документах XHTML, введенный в ней набор атрибутов можно использовать в документах на других языках приложений XML (например, SVG). Спецификация RDFa пока находится в стадии обсуждения, но уже существуют программные средства, реализующие описанные в ней средства.

Начальное руководство по RDFa доступно здесь:

http://shcherbak.net/translations/ru_rdfa_primer_shcherbak_net.html

Наши рекомендации