Математические модели, их достоинства, этапы создания
Математические модели – это системы математических выражений (формул, функций, уравнений и т.п.), описывающие те или иные свойства изучаемого объекта, явления. При создании математических моделей используют физические, химические, биологические и т.п. закономерности, выявленные при экспериментальном или теоретическом исследовании объекта моделирования. Так математические модели кровообращения основаны на законах гидродинамики. Классическим примером математической модели явлений природы служит основной закон Ньютона.
Математическое моделирование как метод исследования обладает рядом достоинств:
1) Метод представления количественных закономерностей в виде графиков, формул, таблиц и т.п. точен и экономичен;
2) Математическая модель позволяет судить о поведении таких систем и в таких условиях, которые трудно (или даже невозможно) создать в эксперименте или в клинике;
3) Математическая модель позволяет уменьшить время исследования систем, экономит материальные ресурсы;
4) Математическая модель облегчает решение задач прогнозирования хода и результатов экспериментов, эффектов лечебных воздействий. Такое прогнозирование позволяет подобрать оптимальные варианты применения лекарственных препаратов. Например, можно рассчитать схему внутрисосудистого непрерывного введения лекарства так, что будет обеспечен максимальный лечебный эффект при минимальном побочном воздействии. Наконец, можно лечебную терапию так рассчитать, что она обязательно приведет к выздоровлению (если таковое ещё возможно);
5) Математическая модель является важной составной частью систем интенсивной терапии;
6) Анализ математических моделей может выявить в организме пациента новые, не известные практике явления и тем самым стимулировать более глубокое исследование тех или иных органов человека.
Перечислим основные этапы математического моделирования:
1 этап: Формулировка цели моделирования.
2 этап: Построение упрощенной схемы реального процесса или явления на основании соответствующих законов и имеющихся данных.
3 этап: Изображение моделируемого процесса в виде соответствующей геометрической структуры.
4 этап: Формализация модели, т.е. составление уравнений, формул и т.п., адекватно описывающих происходящие процессы.
5 этап: Решение уравнений.
6 этап: Анализ полученных данных.
Вопрос 4. Первым шагом, предваряющим статистический анализ данных, является анализ типов данных. Принято выделять в качестве основных типов данных количественные и качественные.
Количественные данные в свою очередь подразделяются на непрерывные и дискретные.
Непрерывные данные – это данные, которые получены при измерении на непрерывной шкале, т.е. теоретически они могут иметь дробную часть. Примерами могут служить масса тела, рост, артериальное давление.
Дискретные данные – количественные данные, которые не могут иметь дробную часть. Пример: количество детей.
Качественные данные подразделяют на номинальные и порядковые.
Номинальные данные – вид качественных данных, которые отражают условные коды не измеряемых категорий (например, коды видов болезней).
Порядковые данные – вид качественных данных, которые отражают условную степень выраженности какого-либо признака (например, стадии онкологического заболевания, степени сердечной недостаточности). Их основное отличие от дискретных количественных данных заключается в отсутствии шкалы для измерения выраженности признака.
Бинарные (дихотомические) данные –особо выделяемый вид качественных данных. Признак такого типа имеет лишь два возможных значения (например, мужчина-женщина, здоров – болен).
Особым типом данных являются даты.
Анализ типов медицинских данных необходим для того, чтобы определить правомочность использования в дальнейшем того или иного способа представления данных и статистического метода. Тип получаемых данных необходимо также учитывать на этапе планирования исследования при определении необходимых объемов выборок.
Вопрос 5. Аналоговый сигнал - это в простейшем случае число x(t), зависящее от времени t, величина которого непрерывно изменяется во времени. Аналоговый сигнал обеспечивает передачу данных путем непрерывного изменения во времени амплитуды, частоты либо фазы. Примерами аналоговых сигналов ЭКГ-сигналы, данные с пульсоксиметра, приборов для измерения уровня кровяного давления.
Ввести такой сигнал в компьютер и обработать его невозможно, так как на любом интервале времени он имеет бесконечное множество значений. Поэтому необходимо преобразовать аналоговый сигнал так, чтобы можно было представить его последовательностью чисел заданной разрядности. Это можно выполнить, например, с помощью дискретизации сигнала. Дискретизация — это замена сигнала x(t) с непрерывным временем на дискретный сигнал -- последовательность чисел x(ti) для дискретного набора моментов времени t1, t2,…, ti,…(чаще всего интервалы между моментами времени Δt= ti,- ti-1, берутся одинаковыми). При дискретизации, конечно, часть информации о сигнале теряется. Но если сигнал x(t) за время не сильно изменяется, числа x(ti) и x(ti-1) близки друг к другу, то поведение x(t) между временами ti и ti-1 нетрудно восстановить (сигнал практически линейно изменяется во времени от x(ti-1) до x(ti)). При дискретизации мы теряем частотные составляющие сигнала с частотами порядка f > 1/Δt и выше.
При дискретизации время из аналогового как бы становится цифровым -- моменты времени ti можно нумеровать, кодировать. Производится замена непрерывного времени t на нечто, которое может принимать не все значения, а только некоторые, а именно t1, t2,…, ti,… Приведем конкретный пример дискретизации: Пусть сигнал x(t) такой, что x(t)=√t, шаг дискретизации (т.е. набор моментов времени t=0; 0.1; 0.2; 0.3; …), значение сигнала мы будем записывать с точностью до одной сотой (т.е. набор значений сигнала x=0; ±0.01; 0.02; …). После дискретизации сигнала получим
= | 0. | 0.3162... | 0.4472... | 0.5477... | 0.6324... | ... | |
= | 0.1 | 0.2 | 0.3 | 0.4 | ... |
Значения x(ti) называются отсчётами; Δt называется интервалом дискретизации. Величина f > 1/Δt называется частотой дискретизации.
Исходная частота дискретизации ЭКГ сигнала составляет 8 кГц. Разрядность данных ЭКГ – 16 бит, что обеспечивает очень высокое качество ЭКГ - сигналов.
Вопрос 6.Для альтернативного диагностического признака, с помощью которого делается заключение «положительно-отрицательно» или «не норма-норма», легко определяются ИП, ЛО, ИО, и ЛП, а затем вычисляются базовые диагностические характеристики ДЧ, ДС, ДЭ, ППР, ПОР и т.д. В случае же непрерывного диагностического признака (уровень холестерина, число эритроцитов) определение диагностических характеристик усложняется, т.к. теперь «не нормой» и «нормой» являются, как правило, 95%-ые интервалы, построенные для больных и не больных пациентов. Если эти интервалы не пересекаются, то мы можем выбрать любое значение Х0 между этими интервалами и применить правило: принимаем решение «Болен», если Х > Х0;
принимаем решение «Не болен», если Х < Х0,
где Х – значение диагностического признака у пациента. Если интервалы, как правило, в силу случайных причин пересекаются, то определение точки Х0 выполняют по ROC-кривой, которая строится специальным методом. Значение Х0 и называют «порогом нормальности» или «точкой разделения» (см. рисунок). («Точка разделения» служит границей, разделяющей лиц на здоровых и больных. Так, за нормальный уровень АД могут быть приняты значения 140/90 и 130/80 мм рт. ст.).
Вопрос 7. Чувствительность диагностического теста –это доля истинно положительных результатов в группе больных. Формула:
ДЧ= | ИП/(ИП+ЛО)×100% |
ДЧможно трактовать как вероятность того, что тест верно выявит болезнь у больного. При выборе диагностического теста врач должен принимать во внимание его чувствительность. Чувствительный тест (т.е. тест, который при наличии болезни обычно дает положительный результат) следует выбирать, если есть риск пропустить опасную, но излечимую болезнь – туберкулез, лимфогранулематоз. Полагают также, что для врача чувствительный тест особенно информативен в том случае, когда он дает отрицательный результат. Максимальное значение ДЧ – 100%; возможно, если тест по информативности совпадает с «золотым стандартом».
Вопрос 8. Специфичность диагностического теста –это доля истинно отрицательных результатов в группе здоровых. Формула:
ДС= | ИО/(ЛП+ИО)×100% |
ДСможно трактовать как вероятность того, что тест не укажет на наличие болезни у здорового. Специфичные тесты нужны для подтверждения диагноза, предложенного на основании других данных. Высокоспецифичный тест не должен дать положительный результат в отсутствии заболевания. Высокоспецифичные тесты особенно необходимы, если ложноположительный результат может нанести пациенту вред – физический, эмоциональный или финансовый. Например, нельзя назначать больному химиотерапию, если в действительности необходимости в этом нет. Полагают, что для врача специфичный тест наиболее информативен в том случае, когда он дает положительный результат. Максимальное значение ДС – 100%; возможно, если тест по информативности совпадает с «золотым стандартом».
Вопрос 9. Прогностичность положительного результата теста (ППР) –это доля истинно положительных результатов теста среди всех положительных результатов. Формула:
ППР= | ИП/(ИП+ЛП)×100% |
ППР можно трактовать как вероятность того, что у пациента есть данное заболевание, если тест дал положительный результат. Прогностичность положительного результатазависит как от чувствительности и специфичности теста, так и от распространенности заболевания (см. формулу Байеса). При этом, чем специфичнее тест и более распространен, тем выше ППР. Максимальное значение ППР – 100%; принимает при ДЧ и ДС равными 100%.
Вопрос 10. Прогностичность отрицательного результата теста (ПОР) –это доля истинно отрицательных результатов теста среди всех отрицательных результатов. Формула:
ПОР= | ИО/(ЛО+ИО)×100% |
ПОР можно трактовать как вероятность того, что у пациента нет данного заболевания, если тест дал отрицательный результат. Прогностичность отрицательного результатазависит от чувствительности, специфичности теста и от распространенности заболевания (см. формулу Байеса). При этом, чем чувствительнее тест и более распространен, тем выше ПОР. Максимальное значение ПОР – 100%; принимает при ДЧ и ДС равными 100%.
Вопрос 11.Желательно, чтобы диагностический тест одновременно был и высокочувствительным, и высокоспецифичным. К сожалению, этого, как правило, достичь не удается, но возможен компромисс между этими двумя показателями, когда клинические данные принимают значения в некотором интервале, т.е. мы имеем дело с количественным диагностическим тестом. В подобных ситуациях «точка разделения» или «порог нормальности» иногда устанавливается произвольно. При этом если точка разделения сдвигается вправо, то ЛО увеличивается, а ЛП уменьшается (см. рисунок). Но тогда уменьшается чувствительность и увеличивается специфичность. И наоборот.
«Точка разделения» позволяет оценить чувствительность, специфичность и прогностическую ценность диагностического теста. Повышение значений точки разделения снижает чувствительность, но повышает специфичность и прогностическую ценность положительного диагностического результата. Соответственно, при уменьшении значения точки разделения влево повышаются чувствительность и прогностическая ценность отрицательного результата, но снижаются специфичность и прогностическая ценность положительного результата диагностического теста. Для описания изменений результатов исследования в зависимости от выбора точки разделения используют так называемый ROC-анализ (Receiver Operating Characteristic analysis), который позволяет оценить риск ложноположительных результатов.
При диагностике инфаркта миокарда с помощью количественного диагностического теста выбор «точки разделения» целесообразно сделать в сторону увеличения диагностической чувствительности, так как велик риск летального исхода и необходимо срочно установить степень тяжести заболевания.
Сдвиг «точки разделения» в сторону меньших значений целесообразно сделать для подтверждения диагноза. Например, в онкологии, когда велик риск необоснованного хирургического вмешательства.
Вопрос 12. По лекциям
Вопрос 13. По лекциям
Вопрос 14. Нейросетевой модуль. Структура искусственного нейрона. Нервная система и мозг человека состоят из нейронов, соединенных между собой нервными волокнами. Нервные волокна способны передавать электрические импульсы между нейронами. Нейрон (нервная клетка) является особой биологической клеткой, которая обрабатывает информацию. Он состоит из тела и отростков нервных волокон двух типов – дендритов, по которым принимаются импульсы, и единственного аксона, по которому нейрон может передавать импульс (см. рис. 1). Тело нейрона (сома) включает ядро, которое содержит информацию о наследственных свойствах и плазму, обладающую необходимыми средствами для производства необходимых нейрону материалов. Нейрон получает сигналы (импульсы) от аксонов других нейронов через дендриты (приемники) и передает сигналы, сгенерированные телом клетки, вдоль своего аксона (передатчика), который в конце разветвляется на волокна. На окончаниях этих волокон находятся специальные образования – синапсы, которые влияют на силу импульса.
Рис. 1
Синапс является элементарной структурой и функциональным узлом между двумя нейронами (волокно аксона одного нейрона и дендрит другого). Когда импульс достигает синаптического окончания, высвобождаются определенные химические вещества, называемые нейротрансмиттерами. Нейротрансмиттеры диффундируют через синаптическую щель, возбуждая или затормаживая, в зависимости от типа синапса, способность нейроприемника генерировать электрические импульсы. Результативность синапса может настраиваться проходящими через него сигналами, так что синапсы могут обучаться в зависимости от активности процессов, в которых они участвуют. Эта зависимость от предыстории действует как память, которая, возможно, ответственна за память человека. Важно отметить, что веса синапсов могут изменяться со временем, что изменяет и поведение соответствующего нейрона.
Нервные импульсы через синаптические контакты с помощью дендритов достигают тела клетки, где они суммируются с другими сигналами. Если суммарный сигнал в течение короткого промежутка времени достигает определенного порогового значения, то клетка возбуждается и вырабатывает в аксоне импульс, который передается к следующим нейронам.
Итак, биологический нейрон состоит из трех основных элементов: сомы (тела клетки), аксона с синаптичскими разветвлениями и дендритов. Бионейроны в известной степени являются самостоятельными единицами, их протоплазма не переходит из одного нейрона в другой.
Такая, весьма упрощенная, схема функционирования биологического нейрона положена в основу структуры искусственного нейрона. Но она отражает главное в функционировании нервных сетей – процессы возбуждения и процессы торможения, внешне выражающиеся в изменении возбудимости клеток. Искусственный нейрон может рассматриваться как весьма приближенная имитация бионейрона, также содержащая три основных элемента: сумматор с преобразованиями входного сигнала (имитирует функцию тела клетки), синаптические связи с регулируемыми (настраиваемыми ) «весами», передающие входные сигналы сумматору (являются аналогами дендритов с синапсами); выход сумматора с разветвлением сигналов (служит эквивалентом аксона с пресинаптическими окончаниями для связи с дендритами других бионейронов). Отметим ещё одну особенность бионейронов: нервные импульсы в них передаются только в одном, прямом, направлении – от тела клетки через аксон к другим нейронам.
Изложенная содержательная модель искусственного нейрона позволяет построить структурную модель искусственного нейрона (см. рис. 2).
Рис. 2
В этой модели можно выделить три основных элемента:
1. Набор синапсов, каждый их которых характеризуется своим весом (W). Так, сигнал Xi на входе синапса i умножается на вес Wi. В отличие от синапсов мозга синаптический вес искусственного нейрона может иметь как положительные, так и отрицательные значения.
2. Сумматор складывает входные сигналы, взвешенные относительно соответствующих синапсов нейрона. Эту комбинацию можно описать как линейную комбинацию.
3. Функция активации ограничивает амплитуду выходного сигнала нейрона. Эта функция называется также функцией сжатия.
В модель нейрона, показанную на рис. 2, включен пороговый элемент, который обозначен символом В. Эта величина отражает увеличение или уменьшение входного сигнала, подаваемого на функцию активации.
В математическом представлении функционирование нейрона можно описать следующей парой уравнений:
V = W1·X1 + W2·X2 + W3·X3 + … + Wm·Xm + B;
Y = F( V ).
Архитектура искусственных нейронных сетей.Сегодня существует большое число различных конфигураций нейронных сетей с различными принципами функционирования, которые ориентированы на решение самых разных задач. В качестве примера рассмотрим многослойную полносвязанную нейронную сеть прямого распространения (рис. 3), которая широко используется для поиска закономерностей, классификации образов и, в частности, в диагностике. Полносвязанной нейронной сетью называется многослойная структура, в которой каждый нейрон произвольного слоя связан со всеми нейронами предыдущего слоя, а в случае первого слоя — со всеми входами нейронной сети. Прямое распространение сигнала означает, что такая нейронная сеть не содержит петель.
Рис. 3
В таких сетях входы нейронов следующего слоя являются выходами нейронов предыдущего слоя. Выходы нейронов каждого слоя рассчитываются как взвешенная сумма всех его входов с предыдущего слоя, к которым также применена функция активации.
Построенная искусственная нейронная сеть, является упрощенной аналогией биологических нервных сетей.
Обучение (настройка) искусственных нейронных сетей. Способность к обучению является основным свойством мозга. Для искусственных нейронных сетей под обучением понимается процесс настройки архитектуры сети (структуры связей между нейронами) и весов синаптических связей (влияющих на сигналы коэффициентов) для эффективного решения поставленной задачи. Обычно обучение нейронной сети осуществляется на некоторой выборке. По мере процесса обучения, который происходит по соответствующему алгоритму, сеть должна все лучше и лучше (правильнее) реагировать на входные сигналы.
Выделяют три парадигмы обучения: с учителем, самообучение и смешанная. В первом способе известны правильные ответы к каждому входному примеру, а веса подстраиваются так, чтобы минимизировать ошибку. Обучение без учителя позволяет распределить образцы по категориям за счет раскрытия внутренней структуры и природы данных. При смешанном обучении комбинируются два вышеизложенных подхода.
Существует большое число алгоритмов обучения, ориентированных на решение разных задач. Среди них выделяет алгоритм обратного распространения ошибки, который является одним из наиболее успешных современных алгоритмов. Его основная идея заключается в том, что изменение весов синапсов происходит с учетом локального градиента функции ошибки. Разница между реальными и правильными ответами нейронной сети, определяемыми на выходном слое, распространяется в обратном направлении (рис. 4) - навстречу потоку сигналов. В итоге каждый нейрон способен определить вклад каждого своего веса в суммарную ошибку сети. Простейшее правило обучения состоит в том, что изменения синаптических весов берутся пропорционально их вкладу в общую ошибку.
Применение искусственных нейронных сетей в медицине и здравоохранении. Идеальный метод диагностики должен иметь стопроцентные чувствительность и специфичность - во-первых, не пропускать ни одного действительно больного человека и, во-вторых, не пугать здоровых людей. Чтобы застраховаться, можно и нужно стараться прежде всего обеспечить стопроцентную чувствительность метода - нельзя пропускать заболевание. Но это оборачивается, как правило, низкой специфичностью метода - у многих людей врачи подозревают заболевания, которыми на самом деле пациенты не страдают. Нейронные сети представляют собой системы, позволяющие гораздо лучше классифицировать данные, чем обычно используемые методы. В приложении к медицинской диагностике они дают возможность значительно повысить специфичность метода, не снижая его чувствительности.
Искусственные нейронные сети успешно применяются во многих направлениях медицины. Диагностика и лечение онкологических заболеваний, а также разработка новых медикаментозных средств несомненно представляют собой важнейшую область использования нейросетевых технологий. Известны применения нейросетей в обработке медицинских изображений, мониторинге состояния пациента, анализе эффективности лечения, очистке показаний приборов от шумов и т.д.
Вопрос 15. Данные– это отдельные факты, характеризующие объекты, процессы и явления в предметной области, а также их свойства.
Знания– это выявленные закономерности предметной области (принципы, связи, законы), позволяющие решать задачи в этой области.
Экспертная система – это программа для компьютера, оперирующая с формализованными знаниями врачей-специалистов и имитирующая логику человеческого мышления, основанную на опыте и знаниях экспертов с целью выработки рекомендаций или решения проблем. Основные компоненты:
1. База знаний (БЗ) – это совокупность знаний предметной области, записанная на машинный носитель в форме, понятной пользователю и эксперту (является ядром экспертной или интеллектуальной системы).
2. Интерфейс пользователя – это комплекс программ, реализующий интерактивный диалог с ЭС.
3. Блок логического вывода – это программа, моделирующая ход рассуждений эксперта на основании знаний, имеющихся в базе знаний.
4. Подсистема объяснений – программа, позволяющая пользователю получить ответ на вопрос, как и почему было принято или иное решение.
5. Редактор базы знаний – программа, предоставляющая инженеру по знаниям возможность дополнять разработанную БЗ.
Экспертные системы эффективны в медицине, где существует много вариантов проявления заболеваний и часто отсутствуют однозначные критерии диагностики и лечения.\, в связи с чем важен опыт высоко квалифицированных специалистов. По областям применения можно выделить ЭС для диагностики, интерпретации данных, лечения, прогнозирования и мониторинга за состоянием больных.