Трехуровневое представление данных в ИС. Задание для подготовки к ИГА на 27_09_12

Задание для подготовки к ИГА на 27_09_12

Автоматизированные информационные системы (АИС)

В этот класс систем прикладной информатики входят информационные системы, общая структура которых показана на рисунке.

Трехуровневое представление данных в ИС. Задание для подготовки к ИГА на 27_09_12 - student2.ru

Основу такой системы составляет банк данных, в котором хранится большая по объему информация о какой-либо области человеческих знаний. Территориально этот банк может быть распределенным. Важно, что для пользователя этот банк представляется как единое хранилище информации, куда он может обратиться с запросом

В неавтоматизированных информационных системахзапрос обрабатывается человеком. В АИС запросы обрабатывают с помощью специальных программ, реализуемых на компьютере. Для того чтобы это стало возможным, необходим специальный язык запросов, понимаемый АИС. Для пользователя желательно, чтобы язык запросов был как можно ближе к естественному языку. В этом случае АИС должна обладать системой понимания текстов на естественном языке или языке, близком к нему. В таких АИС используется диалоговая система.

Устройство блока расшифровки запроса зависит от выбранного языка запроса. Оно достаточно просто, если запросы жестко фиксированы. Если же в качестве языка запроса используется подмножество естественного языка, то этот блок может быть достаточно сложным.

После расшифровки запроса по информации, содержащейся в нем, формируется поисковое предписание (или поисковый образ), представляющее задание для процедуры поиска в банке данных. Поиск в банке данных осуществляется блоком поиска. Найденная информация выдается потребителю в удобной для него форме.

Банк данных требует постоянного обновления, пополнения и чистки. Для этого используется специальный входной канал, которым пользуется администратор банка данных.

Частным случаем АИС являются информационно-поисковые системы, предназначенные как для коллективного, так и для индивидуального пользования.

В таких системах хранится информационный массив, из которого по требованиям пользователей выдается нужная информация. Поиск информации по требованию пользователя осуществляется либо автоматически, либо вручную (как в библиотеках, когда с запросом к работнику справочного фонда обращается читатель, а работник пользуется системой каталогов).

Во втором случае используются ЭВМ, снабженные специальными программными средствами, анализирующими процессы запросов, поиска и выдачи нужных документов.

Информационно-поисковые системы делятся на два типа.

1. Документографическая ИПС.В такой ИПС все хранимые документы индексируются некоторым специальным образом. Каждому документу (статье, отчету, протоколу и т.п.) присваивается индивидуальный код, составляющий поисковый образ документа. Поиск идет не по самим документам, а по их поисковым образам, которые содержат информацию (адрес) о местонахождении документа. Именно так ищут книги по заказам читателя в больших библиотеках (в маленьких библиотеках библиотекарь обычно ищет книги сам). По требованию читателя сначала находят карточку в каталоге, а потом по шифру, указанному на ней, отыскивается и сама книга.

Различия документографических ИПС определяются тем, как устроен поисковый образ документа. В простейшем случае это просто его индивидуальное название (например, название, автор, год издания книги). В более сложных случаях нет однозначного соответствия между поисковым образом документа и самим документом. Вполне возможен случай, когда поисковый образ документа соответствует нескольким различным документам и, наоборот, один и тот же документ соответствует не одному, а нескольким поисковым образам.

Такой неоднозначностью обладают, например, поисковые образы документов в дескрипторных системах. Дескриптор - слово или словосочетание, которое тесно связано с содержанием документа. Совокупность дескрипторов определяет группу документов со сходным содержанием. В последнее время журналы, публикующие научные статьи, требуют от своих авторов, чтобы для каждой статьи они указывали список ключевых слов, которые и играют роль дескрипторов.

По набору этих ключевых слов (набору дескрипторов) можно найти статью среди всех статей, введенных в ИПС дескрипторного типа.

Общая блок-схема ИПС дескрипторного типа показана на рисунке.

Трехуровневое представление данных в ИС. Задание для подготовки к ИГА на 27_09_12 - student2.ru

Эта схема имеет два входа. По одному происходит пополнение хранящегося в системе информационного массива документов, а по второму поступают запросы пользователей.

2. Фактографическая ИПС.В отличие от документографических ИПС в ИПС такого типа хранятся не документы, а факты, относящиеся к какой-либо предметной области. Хранимые факты могут быть извлечены из различных документов. В базе фактов они связываются между собой системой разнообразных отношений. Такая сеть в ИПС носит название тезауруса предметной области. Запросы, поступающие в фактографические ИПС, используют тезаурус для поиска ответов на запросы. Поиск осуществляется методом поиска по образцу, широко применяющемуся в базах знаний систем искусственного интеллекта.

ИПС фактографического типа постепенно приближаются по своей организации и функционированию к развитым базам данных и знаний.

Любая ИС включает в себя четыре компонента: информационные средства, программные средства (обеспечение), технические средства, персонал. Информационное обеспечение реализуется в виде файловой системы или в виде базы данных. База данных (БД) -это совокупность описаний объектов предметной области и связей между ними, актуальных для конкретной предметной области.

Структура данных в ИС обычно сложна (сложность определяется не столько объемом, сколько количеством взаимосвязей), задачи по обработке данных однотипны для разных предметных областей (создание, поиск, ввод и вывод, группировка, сортировка). Поэтому все типовые функции по работе с данными выделены в специальную систему. Система управления базой данных(СУБД - это комплекс программных и языковых средств создания, ведения и манипулирования данными).

Программные средства делят на две части: системное программное обеспечение (СПО) и прикладное программное обеспечение (ППО). В состав СПО входит операционная система ЭВМ (ОС) и СУБД. ОС настолько тесно связана с техническими средствами, что их часто объединяют и называют программно-аппаратной платформой, например, ПЭВМ IBM PC используется платформа WINTEL (Windows + Intel).

Персонал- это специалисты, которые обслуживают и сопровождают ИС, их часто включают в состав системы, поскольку без персонала невозможна работы сложной системы.

Трехуровневое представление данных в ИС

Группы пользователей ИС:

— случайный пользователь, взаимодействие которого с ИС не обусловлено служебными
обязанностями;

— конечный пользователь (потребитель информации) - лицо или коллектив, в интересах
которых работает ИС. Он работает с ИС повседневно, связан с жестко ограниченной
областью деятельности и, как правило, не является программистом, например, это может
быть бухгалтер, экономист, руководитель подразделения;

— коллектив специалистов (персонал ИС), включающий администратора банка данных,
системного аналитика, системных и прикладных программистов.

Рассмотрим более подробно состав и функции персонала ИС.

Администратор - это специалист (или группа специалистов), который понимает потребности конечных пользователей, работает с ними в тесном контакте и отвечает за определение, загрузку, защиту и эффективность работы банка данных. Он должен координировать процесс сбора информации, проектирования и эксплуатации БД, учитывать текущие и перспективные потребности пользователей. Системные программистызанимаются разработкой и сопровождением базового математического обеспечения ЭВМ (ОС, СУБД, трансляторов, сервисных программ общего назначения). Прикладные программистыразрабатывают программы для реализации запросов к БД. Аналитикстроит математическую модель предметной области, исходя из информационных потребностей конечных пользователей; ставит задачи для прикладных программистов. На практике персонал небольших ИС часто состоит из одного - двух специалистов, которые выполняют все перечисленные функции.

Для разных классов пользователей можно выделить несколько уровней представлений об информации в ИС.

Трехуровневое представление данных в ИС. Задание для подготовки к ИГА на 27_09_12 - student2.ru

Внешнее представление данных - это описание информационных потребностей конечного пользователя и прикладного программиста. Связь между этими двумя видами внешнего представления осуществляет аналитик.

Концептуальное представление данных - отображение знаний обо всей предметной области ИС. Это наиболее полное представление, отражающее смысл информации, оно может быть только одно и не должно содержать противоречий и двусмысленностей. Концептуальное представление - это сумма всех внешних представлений, которое учитывает перспективы развития ИС, знания о методах обработки информации, знания о структуре самой ИС и др.

Принято различать две формы концептуального представления информации: инфологическую (информационно - логическую) модель которая не привязана к конкретной реализации и ориентирована на пользователя; и даталогическую модель, которая учитывает требования конкретной СУБД.

Внутреннее (физическое) представление - это организация данных на физическом носителе информации. Этот уровень характеризует представления системных программистов и практически используется только тогда, когда СУБД не обеспечивает требуемого быстродействия или специфического режима обработки данных.

Таким образом, многоуровневое представление об информации в ИС обусловлено потребностями различных групп пользователей и уровнем развития инструментальных средств создания ИС. Оно позволяет разделить работу по созданию и обслуживанию ИС на относительно независимые части.

Наши рекомендации