Унифицированная система медицинского языка UMLS

История классификации и кодирования

К вопросу кодирование практически не существует универсального подхода. В разное время, в разных странах создавались свои системы кодов, в частности для информации в медицине. Существует например Международная Классификация в системе Охраны здоровья (ICPC) с различными модификациями и дополнениями она может использоваться в разных странах. Она была разработана Всемирной организацией семейных врачей.(WONCA ).

Наиболее распространенной в системе здравоохранения является системы классификации ICD и классификации разработанные на ее основе. Первой попыткой регистрации данных были письменные отчеты Лондона о смертности в 1629. Первое издание Международного списка причин смертности было представлено Жаком Бертилоном на встрече в Международному статистическом институте (ISI - International Statistical Institute) в 1893 в Чикаго(США), и было официально принято в 1900. Этот список регулярно утверждался под наблюдением ISI, до пятого издания включительно в 1938. Он использовался в первую очередь для статистики смертности. Компании страхования здоровья, больницы, учреждения медицинского обслуживания, армия и другие организации почувствовали необходимость расширения списка кодов для регистрации заболеваний. На Международной конференции здравоохранения, которая проходила в городе Нью-Йорк в 1946, было принято решение расширить Международный список причин смертности Международным списком заболеваний.

Что такое классификация?

Термин классификация имеет два разных значения: во-первых – это процесс проектирования системы классификаций; во-вторых – это сам процесс кодирования( описание объекта с использованием кодов и условий, которые являются показателями понятия) у рамках определенной системы классификации.

Мы будем использовать этот термин только в первом значении, тоесть:

классификация– это упорядоченная в рамках определенной области система понятий с явными или неявными принципами организации.

Классификация базируется на предварительных знаниях и формирует ключ, который позволяет углубить знания

Цель классификации – поддерживать создание статистики охраны здоровья или облегчать исследования в этой области. Примером может служить классификация отклонений электрокардиограммы или диагноза в определенном классе болезней.

При классификации понятия упорядочиваются по родовым связям. Родовые связи – это связи типа ”А из рода B”.

Пример: Язва желудка- более узкое понятие, а заболевание органов пищеварительного тракта-более широкое.

Классификация позволяет упорядочивать понятия в пределах определенной области. Примерами таких областей упорядочивания есть множества диагнозов. В этом отношении Международная Классификация Заболеваний, 9-го издания (ICD-9 – International Classification of Diseases, 9th edition) – это классификация диагнозов. Вона позволяет сравнивать полученные результаты, собраные в разных областях.

Например, если мы хотим выяснить, какое колличество кроватей разного типа нам необходимо в больнице, мы можем воспользоваться такой возрастной классификацией больных.

Таблица 1.

Класс возраст(лет)
Малыши 0 – 3
Дети 4 – 12
Подростки 13 – 18
Взрослые 19 – 64
Пожилые люди 65 - >

Критерий дифференциации– критерий по которому происходит разбиение на классы.

В данном примере это возраст. Разбиение группы больных по этому критерию произвести довольно легко. Но так легко работать не со всеми критериями.

В таблице2 приведены требования к классам и дополнительные требования для компьютерных систем кодирования.

Таблица 2.

Требования к классификации Дополнительные требования для компьютерных систем кодирования
Сформированность области; Классы не должны пересекаться(взаимное исключение); Соответствие поставленной цели; Однородный порядок(один принцип на уровень); Понятные критерии для определения границ класса; Однозначные и полные принципы для использования; Достаточный уровень детализации;   Учтите использование синонимов; Учтите использование лексических вариаций(разновидностей); Нечувствительность к орфографическим ошибкам; Надежность; Последовательность действий( нечувствительность к терминам и срокам)

В ситуациях, когда используется более одного принципа классификации, ситуация очень усложняется. В классификации заболеваний мы должны учитывать разные аспекты: анатомическое расположение, этиология, морфологи, дисфункция. Каждый из них может быть использован для упорядочивания.

Ось классификации- упорядочивание класса по определенному признаку;

Многоосевая классификация - упорядочивание по нескольким критериям одновременно.

В системе здравоохранения используются в основном многоосевые классификации. Например, Международная классификации в системе Охраны здоровья использует две оси:

первая - для системы организма-записывается буквой(Таблица 3.1.)

вторая - для компонентов(Таблица 3.2.).

Таблица 3.1.

Первая ось - система организма
Код Система организма
A Общая неопределенная
B Кровь
D Пищеварение
F Зрение
H Слух
K Кровообращение
L Скелетно - мускульная
N Неврологическая
P Психологическая
R Дыхательная
S Кожа
T Эндокринология и метаболистика
U Урология
W Беременность и планирование семьи
X Женская половая система
Y Мужская половая система
Z Социальные проблемы

Таблица 3.2.

Вторая ось - компоненты
Код Компонент
1 - 29 Системы и жалобы
30 - 49 Диагностическое обследование и предупреждение
50 - 59 Обработка и лечение
61 - 61 Результаты тестов
Административные
63 - 69 Другие
70 - 99 Диагнозы

Организация в классе происходит следующим образом – выбирается необходимая система организма на 1й оси и для нее прописываются все необходимые компоненты в соответствии со структурой 2 оси.

Виды кодов

Кодирование – это процесс отнесения индивидуального объекта к определенному классу или набору классов (в случае многоосевой классификации).

В большинстве классификаций разные свойства обозначают кодами. Фактически, кодирование это сопоставление определенного свойства объекта и его кода.

Кодами могут быть – числа, буквы, составные.

Числовые коды (чаще всего целые) могут формироваться последовательно(как порядковый номер). В этом случае новый класс получает следующее не использованное число, что удобно при добавлении нового класса. Они также могут назначаться случайным образом, для того чтобы избежать конкретики, скрытой в коде.

Мнемонический код - формируется из одного или нескольких символов класса. Это помогает пользователям запоминать коды. При большом количестве классов это приводит к очень длинным кодам, поэтому мнемонический код используется для ограниченного типа классов. Больничные листы чаще всего нумеруют мнемоническими кодами.

Иерархические кодыформируются для расширения существующего кода для каждого уровня детализации. То есть “родительский подкласс” имеют более короткий код чем “его дети”

Составные коды – это сложные коды, которые формируются из более простых сегментов. Каждый сегмент характеризует связанный с ним класс. В ICPC, например, код формируется буквы 1й оси и двухзначным числом со 2й оси.

Таксономия – это теоретическое определение классификации, в том числе ее основных принципов, процедур и правил. Мы будим использовать этот термин в смысле науки классификации. Термин Классификация используется для определения конечного продукта, то есть сформированной системы классов.

Нозология – наука про определение болезней. Она описывает симптоматику, синдромы, нарушения и другие повреждения, а так же само заболевание. Определяет только существенные характеристики болезни.

Нозография– наука про описание болезней. В отличии от Нозологии содержит описание болезни, то есть случайные характеристики, которые эмпирически соотносятся с сущностью заболевания.

Например, критерии классификации ревматического артрита американской ассоциации ревматизма (ARA – American Rheumatism Association) приведены в Таблице 4 . В их определении только случайные характеристики. Возможно, существенную характеристику ревматического артрита медицина еще не знает.

Таблица 4.

Номер Характеристика
1. Утренний твердый
2. Артрит трех или более объединенных областей
3. Артрит ручных соединений
4. Симметричный артрит
5. Ревматичные узлы
6. Ревматический фактор сыроватка
7. Типовые радиографические изменения

Для постановки соответствующего диагноза как минимум четыре из 7 критериев должны выполняться.

Унифицированная система медицинского языка UMLS

В 1986 году Национальная медицинская библиотека США начала разработку Унифицированной системы медицинского языка UMLS. Ее основная цель - значительное улучшение возможностей поиска биомедицинской информации и обеспечение интеграции различных информационных систем, включая системы ведения электронной истории болезни, библиографические и фактографические базы данных, экспертные системы. В результате работы над системой UMLS были созданы три источника знаний:

- метатезаурус;

- лексикон SPECIALIST;

- семантическая сеть.

Метатезаурус обеспечивает синонимическую связь между различными терминами, взятыми из 60 биомедицинских словарей и классификаций, в том числе не англоязычных. Версия 2000 года охватывает 730 155 концепций, 1 338 650 терминов и 1 718 083 строки источников, в том числе 39 768 строк русских рубрик классификации MeSH. Наибольший вклад в метатезаурус принадлежит рубрикатору MeSH (426 716 строк), затем системе клинических кодов Рида (347 569 строк) и номенклатуре SNOMED International, версия 3.5 (164 180 строк). Для сравнения укажем, что классификация МКБ-10 (ICD-10) представлена в метатезаурусе 13 503 строками.

Лексикон SPECIALIST содержит синтаксическую информацию о построении многих терминов, компоненты и ряд английских слов, отсутствующих в метатезаурусе.

Семантическая сеть классифицирует каждую концепцию (например, <Заболевание или синдром>, <Вирус>), описывает возможные связи между концепциями (например, <Вирус> вызывает <Заболевание или синдром>, отношения обобщения и детализации, и др.).

Таким образом, Унифицированная система медицинского языка является не самостоятельной классификацией наподобие МКБ, а надстройкой над наиболее известными биомедицинскими классификациями, значительно облегчающей поиск литературных источников и построение медицинских баз знаний.

Наши рекомендации