Пример организации простой базы данных
№ п/п | Фамилия | Имя | Отчество | Подразделение | … |
Иванов | Иван | Иванович | ОБЭП | … | |
Петров | Петр | Петрович | УР | … | |
Русаков | Руслан | Романович | МОБ | … | |
… | … | … | … | … | … |
… | Якимов | Ярослав | Яковлевич | УР | … |
Обычно база данных состоит из совокупности связанных по определенным полям таблиц (реляционные базы данных). Например, выше представленная таблица может быть связана по полю «Подразделение» с другой таблицей, где содержаться данные на все подразделения ОВД.
База данных содержит структурированные данные. Основная функция технологии - ввод данных, их обработка, получение сведений по текущим запросам, формирование разнообразных отчетов. Использование технологии позволяет существенно увеличить эффективность управленческой работы на уровне выполнения отдельных операций: формировать ведомости на сдачу экзамена, вести достаточно большие по объему учеты сотрудников, товаров и их перемещений в процессе производства и т.д.
Основным элементом информационной технологии обработки данных является система управления базой данных. СУБД - специальный пакет программ, посредством которого реализуется управление базой данных и обеспечивается доступ к данным. Это сложные программные комплексы, выполняющие всю совокупность функций, связанных с использованием и эксплуатацией баз данных. С помощью СУБД реализуется ввод данных (новых файлов и записей), управление ими (сортировка, формирование и выполнение поисковых запросов, производство вычислений), формирование отчетов. Важнейшим элементом СУБД являются ее языковые средства. Через языковые средства данные становятся доступными пользователю. С их помощью выполняются две основных функции: описание представления базы данных и инициирования выполнения операций манипулирования данными.
Информационная технология управления.Данная технология предназначена для обеспечения информацией на всех уровнях управления. Как правило, технология управления ориентирована на широкий круг пользователей и содержит в себе множество запросов к данным. От технологии обработки данных она отличается детализацией и специализацией функций. Основу технологии составляет база данных, включающая в себя два уровня:
- данные о функционировании организации;
- нормативно-справочную документацию.
Отличительной особенностью технологии управления является возможность подготовки большого количества видов отчетов, характерных для управленческой деятельности. При этом информация представляется в агрегированном виде для того, чтобы были видны тенденции изменения показателей функционирования организации; отклонения от заданных значений и т.д.
Информационная технология поддержки принятия решений.Информационная технология поддержки принятия решений предназначена для того, чтобы помочь лицу в выборе оптимальной стратегии поведения в определенной ситуации или группе ситуаций. Существует большое количество компьютерных систем, использующих данную технологию, разных по своим возможностям и принципам построения, включая системы искусственного интеллекта.
Существенным отличием технологий поддержки принятий решений является использование наряду с базой данных базы моделей. Характерной особенностью технологии является то, что применение математических и логических правил оперирования данными (правил вывода) дает возможность получать новую информацию, иными словами, определенные рекомендации действий. Модели могут быть разнообразны по структуре и функциям. Простейшие модели реализуют лишь элементарные математические операции. Большие и сложные модели могут содержать большое количество ситуаций и правил. Соответственно становится возможным моделирование сложных процессов.
Аналитические информационные технологии. Вбазах данных накоплены огромные массивы информации. Они несут большие потенциальные возможности для анализа, на основе которого можно выявлять внутренние тенденции, делать прогнозы, находить новые решения. Это обстоятельство потребовало реализовать аналитические информационные технологии хранения и использования данных. Рассматриваемые технологии характеризуются рядом особенностей.
Большие массивы данных потребовали новых технологий их хранения, которые получили наименование хранилищ данных. В хранилище данные сформированы в виде гиперкуба или многомерного куба, в ячейках которого и хранятся анализируемые данные. Поскольку структура таких данных достаточно сложна, для их представления используются так называемые витрины данных - часть данных, необходимая для решения поставленной задачи.
Для представления данных пользователю система необходимо иметь развитые инструменты доступа и обработки данных хранилища. Эти функции реализует инструмент оперативной аналитической обработки (OLAP). Инструмент OLAP обеспечивает обобщение и агрегацию данных, работу с агрегированными данными, многомерный анализ гиперкубического представления данных.
Аналитическая технология реализует интеллектуальный анализ данных (ИАД) (Data Mining). Его задачей является поиск функциональных и логических закономерностей в накопленной информации, построение на этой основе моделей и правил, их объясняющих, прогнозирование развития анализируемых процессов.
Интеллектуальный анализ данных - метод, основанный на анализе зависимостей между данными, поиске в данных скрытых закономерностей. Автоматизированный поиск закономерностей выступает отличительной чертой технологии ИАД.
Технологии ИАД реализуются по двум направлениям. В первом случае пользователь сам выдвигает гипотезы относительно зависимостей между данными, во втором - зависимости между данными ищутся автоматически. Это считается наиболее перспективным в настоящее время.
Процессы ИАД подразделяются на три стадии: поиск зависимостей, прогнозирование и анализ аномалий. Поиск зависимостей состоит в автоматическом обнаружении зависимостей в данных. Прогнозирование заключается в том, что система прогнозирует значения, которые может запросить пользователь. Анализ аномалий состоит в обнаружении данных, отличающихся от устойчивых зависимостей.
Аналитические информационные технологии используют большое количество методов: логических и математических, статистических. Применяется и новейший метод нейронных сетей. На практике оперативная аналитическая обработка и интеллектуальный анализ данных выступают как две составные части единого процесса поддержки принятия решений.
Информационные технологии искусственного интеллекта.Под искусственным интеллектом понимается способность системы решать интеллектуальные задачи, свойственные человеческому разуму. Это значит, что эта информационная технология должна раскрывать
взаимосвязи между явлениями, быть способной вырабатывать структуру действия в новой ситуации, уметь обучаться и самообучаться Основными технологиями искусственного интеллекта являются технологии экспертных систем (ЭС) и нейронных сетей.
Отличительной особенностью экспертной системы является то, что полученное с помощью нее решение основывается на эвристических правилах, формируемых на основе практических знаний экспертов. Это решение не может быть получено иначе, поскольку задача не поддается математическому описанию.
Другой особенностью является способность получать с помощью ЭС новое знание, построенное на логическом выводе. Логические вывод основан на знаниях, предварительно сформулированных экспертами - людьми, профессионалами в узкой области. Знания экспертов накапливаются в базе знаний, которая и является основой логического вывода.
Таким образом, технология экспертных систем включает в себя базу знаний с механизмами логического и эвристического манипулирования этими знаниями в целях формирования гипотез. В основе технологии находится модель предметной области. Под моделью предметной области понимаются знания в определенной сфере деятельности, организованные с помощью особых средств их представления.
Экспертная система - программно-аппаратный комплекс, который использует знания специалистов о некоторой конкретной предметной области и в пределах этой области способствует принятию решений на уровне эксперта-профессионала.
Следует отметить, что применение экспертных систем в правоохранительной деятельности, особенно в расследовании преступлений, оказалось весьма перспективным. Практическую реализацию нашли и интеллектуальные консультационные системы. Совет, даваемый экспертной системой, не является обязательным и выступает как одна из возможных альтернатив реальной деятельности по расследованию преступлений, т. е. ЭС обеспечивает, дополняет и увеличивает возможности в сфере выбора и принятия решения в условиях неопределенности ситуации.
В криминалистике следует отметить работы В.В. Крылова, разработавшего систему тактического характера по выбору технических средств, и А.К. Баранова, разработавшего ЭС систему для раскрытия преступных организованных формирований. Представляют интерес ряд экспертных систем по методикам расследования, разработанных А.Ф. Лубиным и Н.Б. Бобрыниным. В целом же ученые признают, что научное направление информационных технологий искусственного интеллекта находится в стации формирования.
Геоинформационные технологии.Геоинформационные системы (ГИС) получили широкое распространение около 10 лет назад, хотя первые системы появились значительно раньше, к 1970-м годам. Причина этого очевидна и заключается в возможностях современной компьютерной техники, позволяющей обрабатывать огромные массивы графической информации, требуемые для ГИС.
Геоинформационные системы могут найти применение в правоохранительных органах для решения следующих задач:
- планирование спасательных операций и охранных мероприятий;
- моделирование чрезвычайных ситуаций;
- навигация служб быстрого реагирования и других служб силовых ведомств.
Основными компонентами геоинформационной технологии являются графические и тематические (атрибутивные) базы данных, обладающие модельными и расчетными функциями для принятия на этой основе разнообразных решений и осуществления контроля. В графических базах данных хранится метрическая основа компьютерной карты. Атрибутивные базы данных содержат в себе описания территории и дополнительную информацию. Для работы с этими данными имеется одна или две системы управления данными. Функции СУБД - поиск, сортировка, добавление и исправление информации в базах данных. Система вывода данных предназначена для визуализации данных на экране в виде карт, таблиц, схем и т. п.
Система ввода отвечает за получение данных, источниками которых могут являться разнообразные электронные устройства (дигитайзер, сканер, электронные теодолиты и другие геодезические приборы). Информация может быть введена с клавиатуры вручную или получена из другой компьютерной системы.
На практике хорошо себя зарекомендовали такие ГИС, как ArcInfo и ArcViev GIS (разработка США) и отечественная система GeoDraw.
Технологии поиска информации.В последние 15 лет наметилась тенденция сбора и обработки неструктурированной информации. Доля структурированных данных (баз данных) в современных архивах составляет не более 20%, остальные же 80% приходятся на долю различных документов, текстов и другой информации, хранящихся в произвольном, чаще текстовом виде. Это обстоятельство существенно обострило проблему поиска и анализа данных. Выделяют три группы методов поиска информации:
- методы индексного поиска;
- статистические методы;
- методы, основанные на базах знаний.
Индексный поиск применяется чаще всего. Он используется при поиске по текстовым полям баз данных и основан на формальном совпадении символов. Такой режим реализован в справочных правовых системах при поиске по тексту документа.
Системы индексного поиска имеют ряд существенных недостатков. Во-первых, они имеют низкую точность поиска. Это связано с тем, что один и тот же смысл может быть выражен различными словами: то слово, поиск которого задал пользователь, может отсутствовать в тексте. Во-вторых, система не может оценить, насколько точно смысл найденного документа соответствует поисковому запросу. Поэтому нужный документ может оказаться в конце списка найденных системой.
Статистические методы отличаются тем, что они исходят из предположения - чем чаще встречается слово в документе, тем в большей степени этот документ соответствует запросу. Документы с часто встречающимся искомым словом выводятся первыми, тем самым происходит ранжирование списка найденных документов, что существенно повышает эффективность работы. Однако остается проблема пропуска нужного документа, если его содержание выражается иными словами, чем введенными в запросе.
Системы, основанные на базе знаний, - такое название получили методы поиска, которые каким-либо образом учитывают смысловое значение искомого слова. Для этого чаще всего ищут не только заданное слово, но и те слова, которые ему близки по смыслу. Это реализуется путем использования словаря синонимов.
Более сложные системы основаны на так называемых лингвистических правилах. В таких системах осуществляются грамматический разбор и анализ исходных документов, что позволяет выявить слова, определяющие основную тему документа. По этим словам и осуществляется поиск, что в итоге позволяет найти документ, близкий к теме запроса.
Наиболее перспективным технологическим методом считается использование семантических сетей. Семантическая сеть отражает значение (смысл) не конкретного слова, а целой фразы. Для этого предметная область отображается в виде совокупности связанных между собой понятий. Понятия задаются не одним словом, а совокупностью слов, близких по значению. Такая базовая семантическая сеть поддерживается многоуровневыми структурами словарей по отдельным отраслям знаний.
При построении семантической сети используются сложные алгоритмы синтаксического, грамматического и морфологического разбора. Учитываются и устойчивые словосочетания, например «подложный документ», которые воспринимаются как единое понятие. Реализуется распознавание разных значений слов.
Подход, основанный на построении семантических сетей, обладает достаточной гибкостью, доступен для расширения и не слишком громоздок при эксплуатации. Наиболее мощная и распространенная система данного типа – Convera компании Excalibur Technologies.