Прочие встроенные простые типы
Еще три встроенных простых типа описывают значения, часто используемые в документах XML.
Адреса URI относятся к типу anyURI.
Расширенное имя тега или атрибута (qualified name), т. е. имя вместе с префиксом, отделенным от имени двоеточием, — это тип QName.
Обозначение NOTATION описания DTD выделено как отдельный простой тип схемы XML. Его используют для записи математических, химических и других символов, нот, азбуки Бройля и прочих обозначений.
Определение простых типов
В схемах XML с помощью встроенных типов можно тремя способами определить новые типы простых элементов. Они вводятся как сужение (restriction) встроенного или ранее определенного простого типа, список (list) или объединение (union) простых типов. Простой тип определяется компонентом схемы simpieType, имеющим вид
<xsd:simpleType name="имя типа">Определение типа</xsd:simpleType>
Сужение
Сужение простого типа определяется компонентом restriction, в котором атрибут base указывает сужаемый простой тип, а в содержимом задаются ограничения, выделяющие определяемый простой тип. Например, почтовый индекс zip можно определить, как шесть арабских цифр следующим образом:
<xsd: simpleType name="zip">
<xsd:restriction base="xsd:string">
<xsd:pattern value="[0-9]{6}" />
</xsd:restriction>
</xsd:simpleType>
Можно дать другое определение простого типа zip как целого положительного числа, находящегося в диапазоне от 100000 до 999999:
<xsd:simpleType name="zip">
<xsd:restriction base="xsd:positiveInteger">
<xsd:minInclusive value="100000" />
<xsd:maxInclusive value="999999" />
</xsd:restriction>
</xsd:simpleType>
Теги <pattern>, <maxInclusive> и др., задающие ограничения, называются фасетками (facets). Вот их список:
· <maxExclusive> — наибольшее значение, которое уже не входит в определяемый тип;
· <maxInclusive> — наибольшее значение определяемого типа;
· <minExclusive> — наименьшее значение, уже не входящее в определяемый тип;
· <minInclusive> — наименьшее значение определяемого типа;
· <totalDigits> — общее количество цифр в определяемом числовом типе — сужении типа decimal;
· <fractionDigits> — количество цифр в дробной части числа;
· <length> — длина значений определяемого типа;
· <maxLength> — наибольшая длина значений определяемого типа;
· <minLength> — наименьшая длина значений определяемого типа;
· <enumeration> — одно из перечислимых значений;
· <pattern> — регулярное выражение;
· <whitespace> — применяется при сужении типа string и определяет способ преобразования пробельных символов ‘\n’, ‘\r’, ‘\t’. Атрибутvalue этого тега принимает одно из трех значений:
· preserve — не убирать пробельные символы;
· replace — заменить пробельные символы пробелами;
· collapse — после замены пробельных символов пробелами убрать начальные и конечные пробелы, а из нескольких подряд идущих пробелов оставить только один.
В тегах-фасетках можно записывать следующие атрибуты, называемые базисными фасетками (fundamental facets):
· ordered — задает упорядоченность определяемого типа, принимает одно из трех значений:
· false — тип неупорядочен;
· partial — тип частично упорядочен;
· total — тип полностью упорядочен;
· bounded— задает ограниченность или неограниченность типа значением true или false;
· cardinality — задает конечность. или бесконечность типа значением finite или countably infinite;
· numeric — показывает, числовой этот тип или нет, значением true или false.
Как видно из приведенных выше и ниже примеров, в одном сужении может быть несколько ограничений-фасеток. При этом фасетки и задают независимые друг от друга ограничения, их можно мысленно объединить союзом "или". Остальные фасетки задают общие, совместно накладываемые ограничения, их можно мысленно объединить союзом "и".
Список
Простой тип-список — это тип элементов, в теле которых записываются через пробел несколько значений одного и того же простого типа. Например, в документе XML может встретиться такой элемент, содержащий список целых чисел:
<days>21 34 55 46</days>
Список определяется компонентом list, в котором атрибутом itemType указывается тип элементов определяемого списка. Тип элементов списка можно определить и в содержимом элемента list. Например, показанный выше элемент документа XML days можно определить в схеме так:
<xsd:element name="days" type="listOfInteger" />
а использованный при его определении тип listOfInteger задать как список не более чем из пяти целых чисел следующим образом:
<xsd:simpleType name="listOfInteger">
<xsd:restriction>
<xsd:simpleType>
<xsd:list itemType="xsd:integer" />
</xsd:simpleType>
<xsd:maxLength value="5" />
</xsd:restriction>
</xsd:simpleType>
При определении списка можно применять фасетки <length>, <minLength>, <maxLength>, <enumeration>, <pattern>. В приведенном выше примере список — тело элемента days — не может содержать более пяти чисел.
Объединение
Простой тип-объединение определяется компонентом union, в котором атрибутом memberTypes можно указать имена объединяемых типов. Например:
<xsd:union memberTypes="xsd:string xsd:integer listOfInteger" />
Другой способ — записать в содержимом компонента union определения простых типов, входящих в объединение. Например:
<xsd:attribute name="size">
<xsd:simpleType>
<xsd:union>
<xsd:simpleType>
<xsd:restriction base="xsd:positivelnteger">
<xsd:minInclusive value="8"/>
<xsd:maxInclusive value="72"/>
</xsd:restriction>
</xsd:simpleType>
<xsd:simpleType>
<xsd:restriction base="xsd:NMTOKEN">
<xsd:enumeration value="small"/>
<xsd:enumeration value="medium"/>
<xsd:enumeration value="large"/>
</xsd:restriction>
</xsd:simpleType>
</xsd:union>
</xsd:simpleType>
</xsd:attribute>
После этого атрибут size можно использовать, например, так:
<font size='large'>Глава l</font>
<font size='12'>Простой текст</font>