Информационные технологии на базе концепции искусственного интеллекта

В чем различие, между "четкой" (Crisp Logic) и "нечеткой" (Fuzzy Logic) логикой"? В четкой логике ожидаемое следствие всегда однозначно следует заявленной посылке, если заданы четкие правила выполнения условия — например, "если А, то Б", или, "если А и Б, то В". Когда логика нечеткая, границы выполнения условия не определены или определены нечётко: "если А, то в промежутке времени [Т1, Т2] Б может быть много больше В, а может быть почти равно В" — всё зависит от начальных и текущих условий, которые могут быстро измениться даже внутри зафиксированного промежутка времени [Т1, Т2].

Алгоритмы для анализа таких ситуаций реализуют, как правило, сценарные варианты развития ситуации с оценкой риска каждого варианта. Соответственно, ИС в таком случае, помимо стандартных функций сбора, хранения и передачи данных, должна содержать модули, реализующие обработку и многовариантный анализ информации. Поскольку развитие бизнес-ситуации может определяться несколькими параметрами, и модели, описывающие такие ситуации, редко бывают линейными, то реальная задача чаще всего сводится к задачам многофакторного оценивания и нелинейной оптимизации.

В связи с этим, аналитические модули ИС поддержки принятия решения (Decision Support System — DSS), экспертных систем (Expert Information System — EIS), систем поддержки исполнения решения (Executive Support System — ESS), диагностических систем (Diagnostic Information System — DIS), систем распознавания изображений (Image Recognition System — IRS), а также поисковых систем (Searching System) обычно строятся с использованием принципов, называемых "принципами искусственного интеллекта".

Искусственный интеллект (Artificial Intelligence) можно определить, как "совокупность теоретических методов и физических вычислительных устройств, задача которых состоит в воссоздание разумных рассуждений и действий, имеющих целью достижение ожидаемого или нового результата".

В настоящее время в области исследования искусственного интеллекта сложились два основных направления:

· семиотическое (символьное) — моделирование высокоуровневых процессов мышления человека, основанное на представлении знаковых систем и использовании знаний;

· нейрокибернетическое (нейросетевое) — моделировании отдельных низкоуровневых структур мозга (нейронов) и алгоритмов их работы.

Отсюда следует, что научный аспект проблемы искусственного интеллекта касается попыток объяснения его работы и исследует возможность построения общих алгоритмов его функционирования. Прикладной аспект ИИ включает компьютерное решение разнообразных задач, не имеющих явного алгоритмического решения, или многовариантных задач типа "А что если…", то есть задачи с нечеткими целями и нечеткой логикой. При этом используются "человеческие" способы решения таких задач, то есть имитирование ситуации, когда такую задачу решает человек.

В 50-х годах ХХ века появились работы Винера, Ньюэлла, Саймана и Шоу, исследовавших суть процессов решения различных задач. Результатами явились алгоритмы и компьютерные программы "Логик-теоретик", предназначенная для доказательства теорем в исчислении высказываний, и "Общий решатель задач". Эти работы положили начало первому этапу исследований в области искусственного интеллекта, связанному с разработкой алгоритмов и программ для решения задач на основе применения разнообразных эвристических методов. В отличие от алгоритмических методов, позволяющих проводить формальную верификацию правильности, эвристические методы решения задачи рассматриваются как свойственные человеческому мышлению вообще, для которого характерно возникновение интуитивных догадок о пути решения задачи.

Таким образом, общей задачей использования искусственного интеллекта является построение компьютерной интеллектуальной системы, которая обладала бы уровнем эффективности решений неформализованных задач, сравнимым с человеческим или превосходящим его. На Рис.41 показана функциональная структура такой системы.

В качестве высокоуровневого критерия интеллектуальности систем, разрабатываемых на основе технологии искуственного интеллекта, предложен мысленный эксперимент, известный как "тест Тьюринга", предложенный Аланом Тьюрингом в 1950 г. в статье "Вычислительные машины и разум" для проверки, является ли компьютер "разумным" в человеческом смысле слова.

Области применения методов искусственного интеллекта чрезвычайно широки:

· доказательства неформальных теорем и решение задач с нечеткой логикой;

· теория игр, исследование игровых ситуаций и возможности синтеза решений (теория и практика компьютерных шахмат);

· распознавание образов (символов, текстов, речи, изображений и т. д.) с целью поиска, обработки и адаптации;

· адаптивное программирование;

· имитация творческой деятельности — сочинение литературных текстов, стихов, музыки;

· обработка и трансформация данных на естественных языках, машинный перевод;

· машинное зрение, построение виртуальной реальности;

· обучающие и обучающиеся системы на базе нейросетей;

· управляющие системы и робототехника (автомобилестроение, авиация, космонавтика, человекоподобные многофункциональные роботы и многое другое);

· построение специализированных ИС для поддержки принятия решений в бизнесе.

Информационные технологии на базе концепции искусственного интеллекта - student2.ru

Рис. 41. Функциональная структура использования системы искусственного интеллекта

Класс технологий и систем, созданных на базе таких принципов и предназначенных для поддержки принятия делового решения в условиях развивающейся неопределенности, стал широко применяться в бизнесе и получил название "системы интеллектуального анализа данных" (Business Intelligence — BI).

Впервые термин "Business Intelligence" был введен в обращение аналитиками Gartner в конце 1980-х годов, как "пользователецентрический процесс, который включает доступ к информации и её исследование, анализ, выработку интуиции и понимания, которые ведут к улучшенному и неформальному принятию решений". Позже, в 1996 году появилось уточнение — это инструменты для анализа данных, построения отчетов и запросов, которые могут помочь бизнес-пользователям преодолеть сложности с обработкой, интерпретацией и представлением данных для того, чтобы синтезировать из них значимую информацию. Эти инструменты в совокупности попадают в категорию, называемую "инструменты бизнес-интеллекта" (Business Intelligence Toolware) .

Сегодня категории BI-продуктов включают: BI-инструменты и BI-приложения. BI-инструменты можно разделить на следующие виды:

· генераторы запросов и отчетов (Query/Report Generator — QRG);

· развитые BI-инструменты — прежде всего, инструменты оперативной аналитической обработки данных (Online Analytical Processing — OLAP);

· корпоративные BI-наборы (Enterprise BI Suites — EBIS) различной конфигурации, встраиваемые в ERP-системы;

· BI-платформы.

Многомерные OLAP-серверы, а также реляционные OLAP-механизмы являются BI-инструментами и инфраструктурой для BI-платформ, на базе которых разрабатываются разнообразные приложения с "заказными" пользовательскими интерфейсами. Указанные инструменты применяются для доступа к данным, их многомерного и многофакторного анализа и генерации отчетов по данным, которые чаще всего располагаются в различных витринах (оперативных складах), базах или хранилищах данных. В качестве примера BI-приложения можно указать ИС (подсистему) поддержки деятельности руководителя (Executive Support System — ESS).

BI-приложения обычно ориентированы на конкретные важные функции организации, такие как анализ тенденций рынка, анализ рисков, анализ и прогноз продаж, планирование бюджета и т.п. Они могут применяться и более широко — для построения систем сбалансированных показателей (Balanced Scorecard System) или для управления эффективностью предприятия в целом (Enterprise Perfomance Management). На рисунке 42 показан пример общей корпоративной архитектуры BI-архитектуры.

Информационные технологии на базе концепции искусственного интеллекта - student2.ru

Рис.42. Пример общей корпоративной BI-архитектуры

Методы и системы интеллектуального анализа данных, построенные на базе нейронных самообучающихся сетей, находят разнообразное применение при создании современных ИС. Это большой класс систем, архитектура которых имеет некоторую аналогию с построением нервной ткани из нейронов. В одной из наиболее распространенных архитектур — многослойном персептроне с обратным распространением ошибки — имитируется работа нейронов в составе иерархической сети, где каждый нейрон более высокого уровня соединен своими входами с выходами нейронов нижележащего слоя.

На нейроны самого нижнего слоя подаются значения входных параметров, на основе которых нужно принимать какие-то решения, прогнозировать развитие ситуации и т. д. Эти значения рассматриваются как сигналы, передающиеся в следующий слой, ослабляясь или усиливаясь в зависимости от числовых значений (весов), приписываемых межнейронным связям. В результате на выходе нейрона самого верхнего слоя вырабатывается некоторое значение, которое рассматривается как ответ — реакция всей сети на введенные значения входных параметров.

Для того чтобы сеть можно было применять в дальнейшем, ее прежде надо "натренировать" на полученных ранее данных, для которых известны и значения входных параметров, и правильные ответы на них. "Тренировка" состоит в подборе весов межнейронных связей, обеспечивающих наибольшую близость ответов сети к известным правильным ответам. На рисунке 43 приведена схема "интеллектуальной самообучающейся подсистемы", которая может быть использована в составе экспертной, диагностической, поисковой и прочих подобных систем.

Программа работы "запускает" набор начальных данных, граничных условий и приблизительное условие выхода из итерационной цепи. Эти параметры связаны с наборами известных ситуаций и известными решениями. Нейронная сеть анализирует данные, выявляет корреляции, а затем выбирает наборы наиболее вероятных решений. Этот набор образует начальную модель. Далее параметры варьируются и добавляются новые данные и правила, генерируемые с помощью бока эвристики. Когда перебор вероятных значений не приводит к улучшению модели, срабатывает условие выдачи окончательного прогноза.

В последнее время активно развиваются эволюционные алгоритмы, которые предполагают создание некоторые популяции программ, их обучение, мутации, скрещивание (обмен частями программ) и тестирование на выполнении целевой задачи. Программы, работающие лучше всего, выживают — и после множества поколений получается наиболее эффективная программа. Весьма эффективны методы создания интеллектуальных поисковых и ИС с использованием технологий активных агентов (Multi Agent System), которые действуют в информационном пространстве, интерпретируя поставленную задачу в зависимости от условий и результатов поиска. Под агентом понимается программная или программо-аппаратная сущность, способная действовать в интересах достижения целей, поставленных перед ним пользователем.

Информационные технологии на базе концепции искусственного интеллекта - student2.ru

Рис.43. Схема интеллектуальной самообучающейся подсистемы

Уровень интеллектуальности агента можно оценить как его способность использовать "старые" и строить "новые" знания для выполнения поставленной задачи в заранее неизвестных ему ситуациях и проблемных областях, где оцениваемый агент применяется как активный решатель задач. На рисунке 44 представлена схема система интеллектуальной поддержки принятия решения на основе технологии мультиагентных систем.

Информационные технологии на базе концепции искусственного интеллекта - student2.ru

Рис.44. Схема интеллектуальной системы поддержки принятия решения (DSS) на основе технологии мультиагентных систем (начало)

Информационные технологии на базе концепции искусственного интеллекта - student2.ru

Рис.45. Схема интеллектуальной системы поддержки принятия решения (DSS) на основе технологии мультиагентных систем (продолжение)

Первые проекты по моделированию на компьютере реалий человеческого мозга отчетливо показали перспективы этого направления. Так, амбициозная цель проекта "IBM Blue Brain" — научиться к 2012 году модельно симулировать работу той части мозга, которая отвечает за восприятие, моторные функции, пространственное воображение, язык и сознание. По количеству элементов и скорости вычислений человеческий мозг пока ещё впереди, но если и дальше будет действовать закон Мура, то недолго осталось до того времени, когда способности искусственного интеллекта сравняются с возможностями человеческого мозга (подробнее про теорию и технологии мультиагентых систем будет рассказано в следующей главе).

Мультимедийные ИТ-системы

Современные информационные системы отличаются большим разнообразием форматов и аппаратных устройств для ввода, обработки, представления и хранения информации и данных. Это — текст, таблицы, диаграммы, звук, плоская и 3D-графика, анимация, видео. Развитие цифровых технологий представления и хранения данных обязано, прежде всего, тому, что во второй половине ХХ века информация стала массовым продуктом, товаром для продажи. А это означает необходимость тиражируемости этого продукта и доставки конечному потребителю.

Взаимодействие с информацией перестало быть пассивным — достижения в области компьютерных и коммуникационных технологий сделало этот процесс интерактивным. Технологии хранения и тиражирования данных на твердых (Hard Disk Drive — HDD, Compact Disk — CD, Digital Video Disk — DVD), электронных (Flash Memory) и виртуальных (Virtual Media) носителях, технологии записи, преобразования и считывания информации (Data Recording/Conversion/ Playback), обилие форматов, а также программные средства с удобными интерфейсами в совокупности образуют среду, которая позволяют непрофессиональному пользователю работать с именно информацией, а не с компьютерной техникой. Такая среда носит название мультимедийной, а технологиии программно-аппаратные средства для их интеграции и реализации — мультимедийными технологиями (Рис.46).

Информационные технологии на базе концепции искусственного интеллекта - student2.ru

Рис.46. Мультимедийная среда

Мультимедийный «документ» (MM File) не является простой суммой текстовых, звуковых графических, видео и анимационных фрагментов — это специально подготовленная сущность, воздействующая на пользователя как целостная система. При этом пользователь погружается в предметную среду, с которой он прямо взаимодействует, фактически являясь не только участником, но соавтором и режиссером взаимодействия. Следовательно, мультимедиа интегрирует в одном или нескольких программных приложениях и продуктах разнообразные виды традиционных и оригинальных видов представления и передачи информации.

К тому же работа мультимедийных приложений происходит, как правило, в реальном времени, и это позволяет выйти на новый уровень интерактивного общения «человек — приложение — компьютер — среда (реальная или виртуальная)».

Например, в основу мультимедиа-средств, создаваемых на базе Web-технологий (Hypermedia), положена общая объектно-ориентированная методология ассоциативных связей и концепция гипертекста. Широкая распространенность такого вида средств объясняется тем, что абсолютное большинство пользователей в настоящее время имеют доступ к сети и средствам создания элементов Web-приложений, а описания языков программирования, разметки текста, техническая документация и стандарты легко доступны на сайтах производителей.

Быстрое увеличение мощности вычислительных средств и объемов оперативной памяти, совершенствование технологий всячески стимулирует развитие мультимедиа и способствует появлению новых направлений и технических решений. Это, прежде всего, отражается в их интерактивности, создании средств виртуальной реальности (Virtual Reality — VR) и виртуальных миров, объёмного и интерактивного цифрового телевидения (Interactive Television — ITV), мультимедийных клиент-серверных сетей. К примеру, можно упомянуть такие новые решения, как IP/TV-сервер и IP/TV-клиент для Windows, созданные компанией Cisco на базе продуктов для Internet-телевидения.

Технологии мультимедиа поддерживаются специальными аппаратными и программными средствами, а также общими и специализированными форматами данных.

К аппаратным средствам можно отнести:

· основные средства: компьютер с высокопроизводительным процессором и памятью большого объема, манипуляторами (мышь, джойстик) и мультимедиа-монитором с встроенными стереодинамиками;

· специальные средства: CD и DVD приводы для воспроизведения и записи, TV-тюнеры и фрейм-грабберы (устройства, которые позволяют дискретизировать видеосигнал, сохранять отдельные кадры изображения в буфере с последующей записью на диск либо выводить их непосредственно в текущее или выделенное окно на мониторе компьютера), графические ускорители, звуковые и видео платы (адаптеры/контроллеры), поддержка акустических систем и др.

Распространенные программные средства, реализующие мультимедиа продукты или являющиеся их составной частью:

· звуковые (Adobe Audition), анимационные (Alias Maya) и графические редакторы (Adobe Photoshop, Corel Draw), средства компьютерной верстки документов (Page Maker, Venture), сканирования и распознавания текстов (Fine Reader), подготовки презентаций (Power Point);

· кодирующие и декодирующие пакеты — кодеки (Coding/ Decoding);

· пакеты для создания музыкальных дисков, просмотра цифровых фотографий, создания альбомов и галерей изображений с музыкальным сопровождением и т. д.

Ниже приводятся основные форматы для обработки и сжатия мультимедийных данных.

Текстовые — txt, doc, docx, rtf, pdf, html. Практически все мультимедийные устройства по умолчанию настроены на чтение этих распространенных текстовых форматов и на работу с ними.

Графические — JPEG, GIF, BMP, TIF (статические) и MJPEG, DVI, Wavelete (динамические, для создания анимаций). Сетевая графика представлена преимущественно двумя форматами — JPEG (Joint Photographics Experts Group) и GIF (Graphics Interchange Format). Оба этих формата являются компрессионными, то есть данные в них уже находятся в сжатом виде. Каждый из этих форматов, имеет ряд настраиваемых параметров (в том числе и параметр сжатия), позволяющих управлять соотношением "качество-размер файла".

За счет сознательного снижения качества изображения, практически не влияющего на восприятие, можно добиться уменьшения объема графического файла чуть ли не в 25 раз. GIF поддерживает 24-битный цвет, реализованный в виде палитры содержащей до 256 цветов, JPG — 24-битный цвет в палитре 16,8 миллионов цветов (True Color). Эти форматы широко используются в таких известных графических пакетах, как Adobe Photoshop, Adobe Illustrated, Paint Brash, Corel Draw и многих других.

Форматы сжатия звуковых данных — AIF, ASF, AU, AVI, BUN, MID, MP2, MP3, MPEG, SND, WAV, WRK. Наиболее известными форматами в настоящее время являются формат AU (Sun Microsystems) и WAVE (Microsoft). Наиболее приемлемым для передачи аудио данных через Internet является формат MP3. Он позволяет получать звуковые файлы с таким же качеством, как и качество Audio CD, но с уменьшением объёма от 4 до 20 раз.

Форматы сжатия видеоинформации — форматы, реализуемые семейством международных стандартов, созданных под эгидой подкомитета JTC1 — экспертной группы MPEG (Moving Picture Experts Group). Официальное название группы — ISO/IEC JTC1 SC29 WG11, её задача — разработка единых норм кодирования аудио и видеосигналов. Стандарты MPEG используются в технологиях CD-i и CD-Video, являются частью стандарта DVD, активно применяются в цифровом радиовещании, кабельном и спутниковом ТВ, Интернет-радио, мультимедийных компьютерных продуктах, коммуникациях по каналам ISDN и во многих других электронных ИТ и системах.

Семейство стандартов быстро растет: в 2001 году появился стандарт MPEG-21 (Multimedia Framework), описывающий структуры мультимедиа, в 2006 году — группа исключительно важных стандартов: MPEG-A (Multimedia Application Format), MPEG-B (Multimedia System Technologies), MPEG-C (Multimedia Video Technologies), MPEG- D (Multimedia Audio Technologies), MPEG-E (Multimedia Midllware) и MPEG-U3D (Multimedia Universal 3D File Format).

На сегодняшний день непрофессиональным пользователям известны наиболее применяемые для массовых мультимедиа продуктов форматы MPEG-1.2,3,4. MPEG-1 был создан для кодирования и сжатия движущихся изображений и связанных с ними звуковых потоков со скоростью передачи данных до 1.5 Мбит/сек. MPEG-2 предназначен для обработки видеоизображений при пропускной способности в пределах от 3 до 15 Мбит/сек. На стандарт MPEG-2 переходят многие телеканалы — сигнал, сжатый в соответствии с этим стандартом, транслируется через телевизионные спутники, используется для архивации больших объёмов видеоматериала. MPEG-3 вначале предназначался для использования в системах телевидения высокой чёткости (High Defenition Television — HDTV) со скоростью потока данных 20-40 Мбит/сек, но позже стал частью стандарта MPEG-2. MPEG-4 задает принципы работы с цифровым представлением медиаданных для трех областей: интерактивного мультимедиа, графических приложений и цифрового телевидения.

Рынок чрезвычайно быстро отреагировал на факт появления и популярности мультимедиа-систем — все крупнейшие производители компьютерной техники и программного обеспечения стали участниками мультимедиа-индустрии. В свое время с подачи американской компании Sun Microsystems появился термин "системы управления мультимедиа" (Digital Media Management — DMM). Системы DMM должны обладать следующими свойствами:

· доступность: мультимедиа-документы должны быть доступны любому пользователю, имеющему настольный компьютер, ноутбук или мобильное устройство (см. п. 5 настоящего параграфа), снабженные надлежащим клиентским ПО;

· извлекаемость: документ должен быть легко найден по его характеристикам или ссылкам и загружен для считывания;

· интеграция: все типы данных необходимо хранить в едином логическом пространстве, форматы данных должны быть описаны в библиотеке метаданных;

· автоматизация накопления: ручной труд по каталогизации и индексации сводится к минимуму

· совместимость со смежными технологиями: необходимо, чтобы клиентское ПО гладко стыковалось с популярными средствами обработки и создания содержания документов;

· многоцелевое использование: документы следует хранить в цифровом разрешении, максимально доступном на данном устройстве — чтобы их можно было легко преобразовать в различные форматы без потери качества;

· защита: единицы хранения должны быть открыты для преобразования только для лиц с надлежащими правами доступа, а там, где это необходимо, следует обеспечить защиту интеллектуальных прав собственности.

На рис.47 показана общая архитектура системы DMM, отвечающая приведенным требованиям и рассчитанная на тонкого клиента. Это трехуровневая архитектура «клиент-сервер». На первом уровне находятся средства хранения медиа-данных, на втором — интерфейс клиент-серверной системы (доставка данных, обработка запросов), на третий уровень вынесены клиентские средства загрузки и доступа к документам.

Информационные технологии на базе концепции искусственного интеллекта - student2.ru

Рис.47. Трехуровневая DDM-архитектура

В такой архитектуре система DMM содержит следующие компоненты:

· хранилище: сервер БД хранит документы и поддерживает различные способы хранения, доступа и обновления документов;

· загрузчик: реализует процессы автоматизирующие загрузку содержания в систему, включая запись, каталогизацию и индексацию;

· сервер доставки документов: доставляет документ пользователю в виде файлов либо в виде битового потока для последующей конвертации в нужный формат;

· браузер: по минимуму — это тонкий клиент, создающий среду для составления запросов, поиска и просмотра/проигрывания медиа-документов; расширения браузера для "толстых" клиентов реализуются через соответствующие сервисы;

· клиентские сервисы: являются средством расширения функциональных возможностей браузера;

· набор сервисов определяется требованиями пользователя и возможностями сервера.

Особое место в системе DMM занимает браузер. Браузер DMM представляет собой интерфейс пользователя для доступа и просмотра медиа-документов. Отделение браузера от уровня клиентских сервисов подчеркивает тот факт, что он может быть реализован с помощью любого стандартного Web-браузера. Это дает ряд преимуществ — например, независимость программного решения браузера от используемой платформы. Наращивание функциональных возможностей может происходить далее путем добавления сервисов в рамках общей организации системы.

Браузер создает интерфейс с сервисом запросов, который должен обеспечивать следующие функции:

· навигацию по связям между документами;

· иерархический доступ "каталог/файл", аналогичный обычному менеджеру файлов;

· интерфейсы для поиска по атрибутам и по полному тексту (желательно, чтобы они составляли единое целое);

· просмотр списка ответа, в том числе включающего идентифицирующие миниатюры (иконки).

Второй главный компонент браузера — проигрыватель (Player) для документов. Желательно, чтобы медиа-документы были представлены в распространенных стандартных форматах, либо легко преобразовывались в них — однако, современные браузеры в DMM, способны получать документы в их "родных" форматах и активизировать соответствующие приложения обработки, чтобы пользователь мог, например, сам редактировать документы.

Наши рекомендации