Системы управления базами данных в медицине
Занятия №5
«Компьютерные данные: типы данных, обработка и управление»
Выделяют четыре основных типа данных:
- целые числа: некоторое дискретное число (напр., число лейкоцитов в образце крови, которые наблюдают под микроскопом);
- действительные числа: некоторая измеренная переменная (напр. температура или давление крови);
- код: условное обозначение некоторой переменной (напр., боль);
- текст: разговорный язык (напр. текст истории болезни или документация событий во время мониторинга).
Одной из основных проблем, связанных с документацией данных в компьютере есть точность и корректность четырех разных видов данных.
Точность - это способность выполнить задачи без погрешностей или ошибок. Данную характеристику можно трактовать еще и так: - это степень соответствия меры к определенному стандарту.
Корректность - это мера частоты появления ошибок в данных. Ошибки могут возникнуть во время сбора данных, наблюдений или же измерениях.
Точность зависит от степени детализации. Примером может быть количество десятичных знаков при измерении той или другой величины. Вес тела, выраженная как 89.12 кг, имеет большую точность, чем вес, выраженному, как 89.1 кг.
Система информационной обработки данных включает в себя: пользователя, введение данных, интерфейс пользователя, обработка данных, представление данных.
Прежде чем компьютер сможет выполнить некоторое действие, ему нужно получить инструкции о том, как управлять данными. Эти инструкции прописаны в компьютерной программе, которая сохраняется в памяти компьютера. Данные также сохраняются в памяти компьютера. Программа "знает", что делать с данными, где найти их и как подать результаты. Программист определяет все это заранее. Это короткое описание показывает, что для обработки данных на компьютере нужны оборудования и программа. Оборудования называют техническим обеспечением, а программы - программным обеспечением. Технические средства и программное обеспечение вместе составляют вычислительную систему.
Вычислительные системы помогают в диагностично-терапевтичному цикле, в особенности на стадии наблюдения. Здесь вычислительные системы используются, для обеспечения пользователя данными, необходимыми, для принятия решения. В этой ситуации мы имеем дело с процессом обработки информации.
В процессе обработки информации различают пользователей и действия операционной системы компьютера:
Пользователь:
- введение данных;
- интерфейс пользователя;
- обработка данных программным обеспечением;
- представление данных.
Введение данных.Пользователь работает с данными. Напомним, что информация происходит от данных. Ошибочные ли даже неточные данные не дают правильной информации. Компьютеры могут обработать данные, но они не могут генерировать информацию, утраченную во время введения, обработки данных в некоторой цепочке соображений.
Интерфейс пользователя.Для диалога системы и пользователя используется определенная часть вычислительной системы - интерфейс пользователя. Его назначение - введение данных, управление работой программы и взаимодействие программы и пользователя.
В основанных на символьных интерфейсах, для общения с пользователем используется лишь клавиатура. Такие интерфейсы, обычно, характерны для традиционного стиля программирования, в котором программа определяет предшествующий и следующий шаг пользователя. Пользователь дает ответ на вопрос прописанный в программе. Эти вопросы могут быть запросами на введение данных или их выбор из ограниченного списка вариантов.
Графические интерфейсы (их еще называют "оконные интерфейсы") быстро вытеснили основанные на символе интерфейс пользователя. Основным элементом графического интерфейса есть окно. Окно - это область на экране компьютера, которая имеет название (заголовок окна) и содержит текстовые поля, картины, кнопки, переключатели, и т.п..
Обработка данных.Процесс обработки данных предусматривает их анализ и преобразование таким образом, что необходимая информация может быть представлена пользователю.
Представление данных.Правильное представление информации пользователю есть важным для понимания правильности выводов. Важным есть тот факт, что пользователи могут конкретизировать вид представления информации (напр., как список или в графической форме). Современная компьютерная технология не ограничена лишь показом данных в таблицах и графах. Данные могут подаваться и в мультимедийном формате.
Сетевая модель данных.
Сетевая модель означает представление данных в виде произвольного графа. Достоинством сетевой и иерархической моделей данных является возможность их эффективной реализации по показателям затрат памяти и оперативности. Недостатком сетевой модели данных является высокая сложность и жесткость схемы БД, построенной на ее основе.
Реляционная модель данных. Понятие реляционный (англ. relation - отношение) связан с разработками известного американского специалиста в области систем баз данных Э.Ф. Кодда. Эти модели характеризуются простотой структуры данных, удобной для пользователя формой представления в виде таблиц и возможностью использования аппарата алгебры отношений и реляционного вычисления для обработки данных.
На языке математики отношение определяется таким образом. Пусть задано n множеств D1,D2, ...,Dn. Тогда R есть отношение над этими множествами, если R есть множеством упорядоченных наборов вида <d1,d2,...,dn>, где d1 - элемент с D1 , d2 - элемент с D2 , ... , dn - элемент с Dn. При этом наборы вида <d1,d2,...,dn> называются кортежами, а множества D1,D2, ...Dn - доменами. Каждый кортеж состоит из элементов, которые выбираются из своих доменов. Эти элементы называются атрибутами, а их значения - значениями атрибутов.
Итак, реляционнная модель ориентирована на организацию данных в виде двумерных таблиц, любая из которых имеет следующие свойства:
- каждый элемент таблицы - это один элемент данных;
- все столбцы в таблицы - однородные, т.е все элементы в столбце имеют одинаковый тип (символьный, числовой и т.п.);
- каждый столбец носит уникальное имя;
- одинаковые строки в таблицы отсутствуют.
Таблицы имеют строки, которые отвечают записям (или кортежам), а столбцы -атрибутам отношений (доменам, полям).
Следующие термины являются эквивалентными:
отношение, таблица, файл (для локальных БД);
кортеж, строка, запись;
атрибут, столбик, поле.
Объектно-ориентированные БД объединяют в себе две модели данных, реляционную и сетевую, и используются для создания крупных БД со сложными структурами данных.
Реляционная БД есть совокупностью отношений, которые содержат всю необходимую информацию и объединенную разными связями.
БД считается нормализованной, если выполняются следующие условия:
- каждая таблица имеет главный ключ;
- все поля каждой таблицы зависят только от главного ключа;
- в таблицах отсутствуют группы повторных значений.
Для успешной работы с многотабличными БД, как правило, надо установить между ними связи. При этом пользуются терминами “базовая таблица» (главная) и “подчиненная таблица». Связь между таблицами получается благодаря двум полям, одно из которых находится в базовой таблице, а второе - в подчиненной. Эти поля могут иметь значение, которое повторяются. Если значение в связанном поле записи базовой таблицы и в поле подчиненной совпадают, то эти записи называются связанными.
Существуют четыре типа отношений между таблицами: один к одному, один ко многим, много к одному, много ко многим.
Отношение один к одномуозначает, что каждая запись в однойтаблице соответствует только одной записи в другой таблице.
Отношение один ко многим означает, что одна запись из первой таблицы может быть связана более чем с однойзаписью из другой таблицы.
Главная таблица – это таблица, которая содержит первичный ключ и составляет часть один в отношении один ко многим.
Внешний ключ – это поле, содержащее такой же тип информации в таблице со стороны много.
Практическая работа
Порядок выполнения:
1. Выполните запуск OpenOfficeBase следующим образом :
Занятия №5
«Компьютерные данные: типы данных, обработка и управление»
Выделяют четыре основных типа данных:
- целые числа: некоторое дискретное число (напр., число лейкоцитов в образце крови, которые наблюдают под микроскопом);
- действительные числа: некоторая измеренная переменная (напр. температура или давление крови);
- код: условное обозначение некоторой переменной (напр., боль);
- текст: разговорный язык (напр. текст истории болезни или документация событий во время мониторинга).
Одной из основных проблем, связанных с документацией данных в компьютере есть точность и корректность четырех разных видов данных.
Точность - это способность выполнить задачи без погрешностей или ошибок. Данную характеристику можно трактовать еще и так: - это степень соответствия меры к определенному стандарту.
Корректность - это мера частоты появления ошибок в данных. Ошибки могут возникнуть во время сбора данных, наблюдений или же измерениях.
Точность зависит от степени детализации. Примером может быть количество десятичных знаков при измерении той или другой величины. Вес тела, выраженная как 89.12 кг, имеет большую точность, чем вес, выраженному, как 89.1 кг.
Система информационной обработки данных включает в себя: пользователя, введение данных, интерфейс пользователя, обработка данных, представление данных.
Прежде чем компьютер сможет выполнить некоторое действие, ему нужно получить инструкции о том, как управлять данными. Эти инструкции прописаны в компьютерной программе, которая сохраняется в памяти компьютера. Данные также сохраняются в памяти компьютера. Программа "знает", что делать с данными, где найти их и как подать результаты. Программист определяет все это заранее. Это короткое описание показывает, что для обработки данных на компьютере нужны оборудования и программа. Оборудования называют техническим обеспечением, а программы - программным обеспечением. Технические средства и программное обеспечение вместе составляют вычислительную систему.
Вычислительные системы помогают в диагностично-терапевтичному цикле, в особенности на стадии наблюдения. Здесь вычислительные системы используются, для обеспечения пользователя данными, необходимыми, для принятия решения. В этой ситуации мы имеем дело с процессом обработки информации.
В процессе обработки информации различают пользователей и действия операционной системы компьютера:
Пользователь:
- введение данных;
- интерфейс пользователя;
- обработка данных программным обеспечением;
- представление данных.
Введение данных.Пользователь работает с данными. Напомним, что информация происходит от данных. Ошибочные ли даже неточные данные не дают правильной информации. Компьютеры могут обработать данные, но они не могут генерировать информацию, утраченную во время введения, обработки данных в некоторой цепочке соображений.
Интерфейс пользователя.Для диалога системы и пользователя используется определенная часть вычислительной системы - интерфейс пользователя. Его назначение - введение данных, управление работой программы и взаимодействие программы и пользователя.
В основанных на символьных интерфейсах, для общения с пользователем используется лишь клавиатура. Такие интерфейсы, обычно, характерны для традиционного стиля программирования, в котором программа определяет предшествующий и следующий шаг пользователя. Пользователь дает ответ на вопрос прописанный в программе. Эти вопросы могут быть запросами на введение данных или их выбор из ограниченного списка вариантов.
Графические интерфейсы (их еще называют "оконные интерфейсы") быстро вытеснили основанные на символе интерфейс пользователя. Основным элементом графического интерфейса есть окно. Окно - это область на экране компьютера, которая имеет название (заголовок окна) и содержит текстовые поля, картины, кнопки, переключатели, и т.п..
Обработка данных.Процесс обработки данных предусматривает их анализ и преобразование таким образом, что необходимая информация может быть представлена пользователю.
Представление данных.Правильное представление информации пользователю есть важным для понимания правильности выводов. Важным есть тот факт, что пользователи могут конкретизировать вид представления информации (напр., как список или в графической форме). Современная компьютерная технология не ограничена лишь показом данных в таблицах и графах. Данные могут подаваться и в мультимедийном формате.
Системы управления базами данных в медицине
Основные идеи, которые лежат в основе концепции базы данных:
- Изолировать любую прикладную программу от влияния изменений в других программах через общие данные путем размежевания логических записей, которые используются прикладными программами, от записей, которые физически запоминаются на магнитных носителях.
- Устранить чрезмерное дублирование данных.
- Централизовать управления данными.
Итак, суть концепции баз данных состоит в интегрированном сохранении и дифференцированном использовании прикладными программами всей информации об объектах предметной области, которые представляют определенный интерес для организации.
Все данные размещаются в едином хранилище. Пользователи автоматизированных информационных систем (АИС) имеют возможность обращаться к любым данным, которые их интересуют. Одни и те же данные могут быть в разных комбинациях и по-разному представленные соответственно потребностям пользователей (прикладных программ). Это обеспечивается за счет системы управление базами данных (СУБД).
БД – это совокупность сведений о конкретных объектах реального мира в какой-либо предметной области. Синоним термина «база данных» – «банк данных».
Под предметной областью (ПрО) принят понимать часть реального мира, который подлежит изучению для организации управления, например, предприятие, ВНЗ и т.п..
БД может быть основана на одной модели или на совокупности нескольких моделей. Любую модель данных можно рассматривать как объект, который характеризуется своими свойствами (параметрами), и над ней, как над объектом, можно производить какие-либо действия.
СУБД называется совокупность языковых и программных средств, предназначенных для создания, управления и совместного использования БД многими пользователями.
Основные требования к базам данных и систем управление базами данных:
- Возможность представления адекватных реальной предметной области структур данных (построение адекватной информационной модели предметной области).
- Простота и малые затраты ресурсов на развитие системы (быстрая и дешевая модификация старых и разработка новых программных приложений в рамках автоматизированной информационной системы).
- Простота и оперативность доступа к данным, возможность поиска информации разными методами.
- Возможность одновременного эффективного обслуживания большого количества пользователей.
- Возможность использования в распределенных вычислительных сетях компьютеров.
- Обеспечение режима разграниченного доступа к данным и программам, исключение возможности их несанкционированного применения.
- Обеспечение представления данных пользователям в удобном виде для их дальнейшего применения.
- Обеспечение необходимой скорости решения задач при ограниченных затратах ресурсов компьютеров.
- Обеспечение защиты информации в БД от сбоев и отказов в работе технических средств и ошибок пользователей.
Основными преимуществами относительно применения БД и СУБД во время реализации на их основе автоматизированных поисково-информационных систем есть:
- Сокращение лишней чрезмерности данных, которые сохраняются. Данные, которые используются несколькими программами, интегрируются и сохраняются в одном месте. Чрезмерность данных есть, но она минимальная и необходимая только для обеспечения взаимосвязи разных данных определенной предметной области.
- Устраняется противоречивость данных, что может возникать, если одни и те же данные, которые используются разными программами, подаются несколько раз и если в случае необходимости их изменения не все копии восстановлены.
- Данные, которые сохраняются, используются совместно. Это предоставляет возможность разрабатывать новые программные приложения над уже существующей базой данных с минимальными затратами.
- Обеспечивается более простое, быстрое и дешевое развитие автоматизированных систем за счет обеспечения логической взаимной независимости программ и данных в БД.
- Упрощается поддержка целостности данных (адекватности и согласованности).
- Обеспечивается возможность быстрого предоставления данных на нестандартные (заранее непредвиденные) запросы пользователей без дополнительной разработки прикладных программ.
- Создается возможность комплексной автоматизации параметров АИС, возможное благодаря централизованному управлению базой данных.
- В случае централизованного управления базой данных упрощается стандартизация и унификация представления данных в АИС.
Основными недостатками, с которыми могут встретиться пользователи и разработчики программного обеспечения во время применения БД и СУБД, есть:
- дополнительные затраты аппаратных ресурсов (например памяти) во время размещения и работы СУБД;
- дополнительные затраты на установление и поддержку СУБД в рабочем состоянии;
- необходимость квалифицированного персонала для централизованного управления базой данных (администрации БД), а и также дополнительные затраты.
Современные СУБД могут поддерживать:
- разные типы представления данных и операции над ними (в том числе фактографических, документальных, карто-графических данных);
- естественное и эффективное представление в БД разных отношений между объектами (например, визуализация данных, которые характеризуются параметрами пространства и времени);
- проверку данных на непротиворечивость;
- дедуктивный вывод (дедуктивные БД);
- управление распределенными БД и интеграцию неоднородных БД;
- централизацию и интеграцию данных в сетях ПК.
Создавая базу данных, пользователь стремится привести в порядок информацию о разных признаках объектов и быстро получить выборку данных с произвольным соединением признаков. Сделать это возможно только если данные структурированные.
Структурирование - это введения соглашений о способах представления данных. Неструктурированными называют данные, записанные, например, в текстовом файле.