Этапы развития искусственного интеллекта
ОСНОВНЫЕ ПОНЯТИЯ И ОПРЕДЕЛЕНИЯ
Искусственный интеллект (ИИ) – быстро развивающееся направление современной информатики. Основной целью исследований, выполняемых в ИИ, является разработка компьютерных систем, способных выполнять функции, которые свойственны интеллекту человека. Попытки создания таких систем начали предприниматься с конца 40-х годов предыдущего столетия, когда были разработаны первые ЭВМ. Поэтому ИИ – относительно молодое научное направление, которое лежит на стыке разнообразных дисциплин, таких, как дискретная математика, лингвистика, психология, программирование, математическая статистика и др.
Диапазон исследований, выполняемых в рамках ИИ, весьма широкий. Он включает решение как общих проблем, например, представление знаний и логический вывод, так и специальных – игра в шахматы, доказательство теорем, сочинение стихов и т.п.
В главе рассматриваются наиболее распространенные определения понятия “искусственный интеллект”, описываются этапы развития ИИ, анализируются основные направления исследований.
1.1. Понятие "искусственный интеллект"
Несмотря на все попытки дать точное определение понятию "искусственный интеллект", строгого определения не существует. Поэтому будет полезным, по крайней мере, обозначить границы этого понятия. С этой целью рассмотрим наиболее распространенные определения. Так, И. Рич полагает, что ИИ – это область исследований, направленная на создание компьютеров, которые выполняют такие функции, которые в настоящий момент человек выполняет лучше [84]. Речь идет о функциях, связанных с умением воспринимать, анализировать, рассуждать, использовать знания, планировать свои действия и т.д., в которых естественно проявление интеллекта. Характерной особенностью этого определения является указание на то, что эти функции, в настоящий момент времени, хорошо выполняются человеком и плохо компьютером. Это означает, что проблематика ИИ меняется со временем. В этом смысле, близким к рассмотренному определению является определение, предложенное Дж. Аленом: "ИИ – это наука о создании машин, решающих задачи, которые могут решать люди..."[57]. Можно отметить, что данное определение охватывает многие исследования, выполняемые в области компьютерных наук. Например, сложение чисел – задача, которую могут решать люди. Тем не менее, мы сейчас вряд ли назовем эту задачу интеллектуальной. Однако если суммирующее устройство было бы предъявлено человечеству в средние века, то оно, безусловно, было бы отнесено к разряду интеллектуальных. Это говорит о том, что наши представления о "думающей машине" эволюционируют во времени. Поэтому в фокусе искусственного интеллекта оказываются те задачи, которые успешно решаются человеком и плохо – компьютером. Сегодня к проблематике ИИ относятся задачи, связанные со зрительным восприятием, пониманием изображений, пониманием естественного языка (текста или речи), умением рассуждать, выявлением закономерностей, планированием действий и др.
Введенные выше определения ИИ являются сравнительными. Они сопоставляют возможности человека и машин. В 1950 году был предложен эмпирический тест А. Тьюринга для определения уровня интеллектуальности машин. В соответствии с тестом эксперт с помощью телетайпа мог вступать в диалог либо с компьютером, либо с человеком. Тьюринг предложил считать поведение компьютера интеллектуальным, если в диалоге участвовал компьютер, а эксперт был не в состоянии определить, с кем он ведет диалог. Тест Тьюринга не рассматривает механизмы формирования ответов на вопросы эксперта, и, следовательно, позволяет исключить все вопросы об "истинной" природе интеллекта. Несмотря на ряд недостатков, тест Тьюринга создал основу для оценки многих современных систем ИИ. Например, качество функционирования экспертных систем определяется по сравнению с решениями, предлагаемыми человеком. Такая оценка является простой разновидностью теста Тьюринга. Часто тест Тьюринга критикуют за антропоморфизм (уподобление человеку, наделение человеческими свойствами предметов неживой природы), так как он предписывает машине имитировать поведение человека. В то же время машинный интеллект отличается от интеллекта человека, и, вероятно, попытка уподобления его естественному интеллекту ошибочна. Например, нежелательно, чтобы машины выполняли вычисления подобно человеку, т.е. слишком медленно и неточно. Поэтому многие исследователи полагают, что тест Тьюринга отвлекает силы от решения основной задачи ИИ – разработки общей теории машинного интеллекта, и использования этой теории для разработки интеллектуальных систем, решающих практические задачи. Тем не менее, отметим важность теста Тьюринга для оценивания качества современных программ ИИ.
Под воздействием указанной критики были предложены иные определения ИИ, например:
· ИИ – ветвь информатики, которая связана с автоматизацией интеллектуального поведения [77];
· ИИ – это наука о вычислениях, которые делают возможными восприятие, логический вывод и действие[95];
· ИИ – это информационная технология, связанная с процессами логического вывода, обучения и восприятия[91].
Синтезируя подобные определения из различных источников, введем следующее рабочее определение.
Искусственный интеллект – это одно из направлений информатики, целью которого является разработка компьютерных систем, способных выполнять функции, традиционно считающиеся интеллектуальными, - понимание языка, логический вывод, использование накопленных знаний, обучение, планирование действий и т.д.
Работы в области ИИ в значительной степени имеют эмпирическую и инженерную ориентацию. Создаваемые системы искусственного интеллекта (СИИ) совершенствуются в экспериментальных условиях. В результате разрабатываются некоторые универсальные процедуры, применимые к широкому классу задач. Именно такие процедуры, составляющие основу большинства СИИ, и рассматриваются в следующих главах книги.
ИИ прошел в своем развитии несколько этапов. Каждый из этапов можно охарактеризовать господствующей научной идеей (парадигмой). Чтобы глубже понять предмет ИИ полезно рассмотреть смену парадигм ИИ на разных этапах его развития. Если на предшествующих этапах развития ИИ создавались сосредоточенные, централизованные интеллектуальные системы, то нынешний этап развития ИИ характеризуется переходом к коллективистским представлениям о природе интеллекта. В этой связи основными тенденциями развития ИИ на нынешнем этапе является интеграция и децентрализация.
Рассмотрим подробнее этапы развития ИИ.
Доказательство теорем
Доказательство теорем является чрезвычайно важной областью ИИ. Рождение этого направления началось с создания программы "Логик-теоретик", которая доказала ряд теорем математической логики. Однако ранние подходы к автоматизации доказательства теорем были не эффективны. Связано это было с экспоненциальным ростом числа логических выражений в процессе доказательства. Для ограничения количества выражений предлагались различные методы, но наиболее эффективным оказался метод резолюций, предложенный Робинсоном.
К доказательству теорем могут быть сведены многие практические задачи. В случае представления задачи в форме доказательства теорем возможные состояния задачи, включая начальные и целевые, рассматриваются как правильно построенные формулы исчисления предикатов. Операторы, отображающие одно состояние в другое, рассматриваются как правила, которые выводят одно правильно построенное выражение из другого. Процесс поиска решения заключается в переписывании формул с помощью правил, пока не будет получены целевые утверждения. Основные процедуры логического вывода рассматриваются в главе 4.
Представление знаний
Это один из центральных вопросов ИИ. В системах искусственного интеллекта знания не могут быть представлены непосредственно в том виде, в котором они используются человеком. Необходим поиск таких форм отображения знаний, которые были бы подходящими для хранения в памяти компьютера. Эти формы знаний, которые называют моделями представления знаний, должны обладать достаточной выразительностью, удобством использования, эффективностью манипулирования. Выразительность означает способность модели одинаково хорошо представлять как обобщенные, так и конкретные знания, как из универсальных, так и из специальных предметных областей. Она также предполагает способность модели отражать неполные знания. Удобство использования означает, что модель представления знаний должна базироваться на понятиях, которые используют эксперты и пользователи. Это упрощает приобретение знаний и оценку их корректности. Эффективность манипулирования связана с возможностью быстрого извлечения необходимых порций знаний и выполнения на их основе соответствующих выводов. Поэтому под знаниями в СИИ понимают формализованные сведения, данные, на которые ссылаются в процессе логического вывода [37].
Знания, представляемые в СИИ в виде самостоятельных информационных компонент, хранятся в базе знаний.
Имеются четыре основные модели представления знаний:
· логическая модель;
· продукционная модель (модель, основанная на правилах);
· модель семантической сети;
· фреймовая модель.
Языки, используемые для разработки систем ИИ на основе указанных моделей, называют языками представления знаний (ЯПЗ). Наибольшее распространение получила продукционная модель представления знаний. При использовании продукционной модели база знаний состоит из набора правил, а программа, управляющая перебором правил, называетсямашиной вывода.
В настоящее время основные усилия исследователей, работающих в области представления знаний, направлены на разработку языков представления знаний, поддерживающих модели рассуждений, характерные для псевдофизических логик (временная логика, пространственная логика, каузальная логика), а также нечеткие и немонотонные рассуждения (см. главы 3 и 4)
Экспертные системы
Уже при разработке первых программ, осуществляющих поиск решений в пространстве состояний, исследователи осознали важность проблемно-ориентированных знаний. Так, врач успешно выполняет свои функции, поскольку он обладает большим запасом медицинских знаний. Геолог открывает новые месторождения тех или иных природных ресурсов, руководствуясь теоретическими и экспериментальными знаниями из области геологии. Экспертные знания представляют собой комбинацию теоретико-аналитических методов и эвристических правил решения задач, которые показали свою эффективность на практике. Программные системы, которые аккумулируют знания эксперта в определенной области и способны вырабатывать решения и рекомендации на уровне эксперта, называютэкспертными системами (ЭС). ЭС – наиболее широко применяемые на практике интеллектуальные системы. ЭС создаются в процессе непрерывного взаимодействия эксперта в той или иной области со специалистами в области информационных технологий. В ходе этого процесса осуществляется извлечение знаний эксперта и перенос их в базу знаний системы. Специалисты, осуществляющие структурирование базы знаний и ее заполнение, называются инженерами по знаниям иликогнитологами.
Перечень типовых задач, решаемых ЭС, включает: интерпретацию, диагностику, прогнозирование, мониторинг и др.
Узким местом в разработке ЭС является получение знаний. Направление ИИ, занимающееся проблемами получения и структурирования знания специалистов с целью последующей разработки баз знаний, называется инженерией знаний. Подробнее проблемы разработки ЭС рассмотрены в главе 7.
Распознавание образов
В рамках этого направления ИИ ведутся исследования по восприятию зрительной, слуховой и других видов информации, методам ее обработки с целью выделения существенных признаков воспринимаемых объектов и осуществления их классификации. Примерами задач распознавания образов могут служить: автоматическое чтение рукописных текстов, распознавание речи, анализ изображений, диагностика болезней, дистанционная идентификация объектов и др. Если множество признаков, разделяющих объекты на классы заранее не известно, то возникает задача обучения распознаванию образов или самообучения распознаванию образов. Поэтому данное направление ИИ близко к машинному обучению и неразрывно связано с нейросетями.
Решение задачи распознавания образов сводится к построению решающей функции, которая по значениям наблюдаемых признаков позволяет отнести объект к тому или иному классу. При построении решающей функции часто используют статистический подход. Однако его применение требует задания многомерных плотностей распределения вероятностей, определение которых может составлять самостоятельную задачу. Часто применяют иной подход, основанный на обучении распознаванию образов. Предложено много алгоритмов обучения распознаванию образов. Одним из наиболее простых является алгоритм обучения персептрона, который представляет собой простейшую нейронную сеть. Возможности простого персептрона по распознаванию образов весьма ограничены. Поэтому при решении многих практических задач применяют более сложные модели. Детально вопросы распознавания образов и обучения нейронных сетей рассматриваются в главе 8.
Компьютерное зрение
Более 85% информации человек получает с помощью зрения. Для современного компьютера этот канал ввода информации также играет важную роль. Но ввести изображение в память ЭВМ нетрудно. Для машины намного сложнее понять изображение. Поэтому главная задача, которую приходится решать при построении систем машинного зрения, – это не создание устройств ввода изображений, а разработка методов и алгоритмов анализа визуальной информации. Проблема создания систем компьютерного зрения тесно связана с такими направлениями ИИ, как представление знаний, обучение, распознавание образов (см. главу 10).
Содержание
[убрать]
· 1 Виды интеллектуальных систем
· 2 Литература
· 3 Ссылки
· 4 Примечания
Виды интеллектуальных систем[править | править исходный текст]
· Интеллектуальная информационная система
· Экспертная система
· Расчётно-логические системы
· Гибридная интеллектуальная система
· Рефлекторная интеллектуальная система
К расчётно-логическим системам относят системы, способные решать управленческие и проектные задачи по декларативным описаниями условий. При этом пользователь имеет возможность контролировать в режиме диалога все стадии вычислительного процесса. Данные системы способны автоматически строить математическую модель задачи и автоматически синтезировать вычислительные алгоритмы по формулировке задачи. Эти свойства реализуются благодаря наличию базы знаний в виде функциональной семантической сети и компонентов дедуктивного вывода и планирования.
Рефлекторная система — это система, которая формирует вырабатываемые специальными алгоритмами ответные реакции на различные комбинации входных воздействий. Алгоритм обеспечивает выбор наиболее вероятной реакции интеллектуальной системы на множество входных воздействий, при известных вероятностяхвыбора реакции на каждое входное воздействие, а также на некоторые комбинации входных воздействий. Данная задача подобна той, которую реализуютнейросети[3].
По комбинации воздействий на рецепторы формируются числовые характеристики рефлекторов через промежуточный слой. Связи между слоями обеспечивают передачу некоторой величины (импульса), от элементов одного слоя, к элементам другого. Если суммарная величина (суммарный импульс) на входе некоторого элемента превосходит его пороговое значение, то он передает свое значение (свой импульс) на элементы следующего слоя. По сути, каждый из элементов является моделью нейрона[уточнить].
В отличие от перцептронов рефлекторный алгоритм напрямую рассчитывает адекватную входным воздействиям реакцию интеллектуальной системы. Адекватность реакции базируется на предположении, что законы несилового взаимодействия одинаковы на любых уровнях представления взаимодействующих систем: будь то живые или неживые объекты.
Рефлекторные программные системы применяются к следующим задачам: естественно-языковой доступ к базам данных; оценки инвестиционных предложений; оценки и прогнозирования влияния вредных веществ на здоровье населения; прогнозирования результатов спортивных игр[4].
Модели представления знаний
Важное место в теории искусственного интеллекта занимает проблема представления знаний, являющаяся, по мнению многих исследователей, ключевой. В общем виде модели представления знаний могут быть условно разделены на следующие классы:
1. Концептуальные модели используют эвристический метод, что позволяет при распознавании проблемы уменьшать время для ее предварительного анализа. Концептуальное описание не дает гарантии того, что метод может быть применен во всех соответствующих практических ситуациях. Практическое использование концептуальной модели влечет за собой необходимость преобразования ее в эмпирическую модель.
2. Эмпирические модели – это модели, как правило, описательного характера. Они могут варьировать от простого набора правил до полного описания.
3. Декларативные модели представления знаний основываются на предположении, что проблема представления некоей предметной области решается независимо от того, как эти знания потом будут использоваться. Поэтому модель как бы состоит из двух частей: статических описательных структур знаний и механизма вывода, оперирующего этими структурами и практически независимого от их содержательного наполнения. При этом в какой-то степени оказываются раздельными синтаксические и семантические аспекты знания, что является определенным достоинством указанных форм представления из-за возможности достижения их определенной универсальности. Эти модели представляют собой обычно множество утверждений. Предметная область представляется в виде синтаксического описания ее состояния. Вывод решений основывается в основном на процедурах поиска в пространстве состояний.
4. Процедурные модели представляют собой модели, в которых знания содержатся в процедурах небольших программ, которые определяют, как выполнять характерные действия. При этом можно не описывать все возможные состояния среды или объекта для реализации вывода. Достаточно хранить некоторые начальные состояния и процедуры, генерирующие необходимые описания ситуаций и действий.
При процедурном представлении знаний семантика заложена в описание элементов базы знаний, за счет чего повышается эффективность поиска решений. Статическая база знаний содержит только утверждения, приемлемые в данный момент, которые могут быть изменены или удалены. Общие знания и правила вывода представлены в виде специальных целенаправленных процедур, активизирующихся по мере надобности. Для повышения эффективности генерации вывода в систему добавляются знания о том, каким образом использовать накопленные знания для решения конкретной задачи.
Преимущества процедурных моделей: имеют большую эффективность механизмов вывода за счет введения дополнительных знаний, способны смоделировать практически любую модель представления знаний, имеют большую выразительную силу, которая проявляется в расширенной системе выводов.
Представление знаний в экспертных системах производится с помощью специально разработанных моделей.
1. Логические модели. Классическим механизмом представления знаний в системах является исчисление предикатов. Предикатом или логической функцией называется функция от любого числа аргументов, принимающая истинные значения 1 и 0. В исследованиях по искусственному интеллекту данная модель стала использоваться начиная с 50-х годов.
В системах, основанных на исчислении предикатов, знания представляются с помощью перевода утверждений об объектах некоторой предметной области в формулы логики предикатов и добавления их как аксиом в систему. Знания отображаются совокупностью таких формул, а получение новых знаний сводится к реализации процедур логического вывода. Однако действительность не укладывается в рамки классической логики, потому что человеческая логика, применяемая при работе с неструктурированными знаниями – это интеллектуальная модель с нечеткой структурой. При использовании нечеткой логики часто применяются два метода логического вывода: прямой и обратный метод.
Достоинство логических моделей:
– модель базируется на классическом аппарате математической логики, методы которой хорошо изучены и обоснованы;
– имеются достаточно эффективные процедуры вывода;
– база знаний предназначена для хранения большого количества аксиом, из которых по правилам вывода можно получать другие знания.
Основной недостаток: логики, адекватно отражающей человеческое мышление, еще не создано
2. Продукционные модели. Впервые были предложены Постом в 1943 г., применены в системах искусственного интеллекта в 1972 г. При исследовании процессов рассуждения и принятия решений человеком пришли к выводу, что человек в процессе работы использует продукционные правила. Правило продукций (англ. Production) – это правило вывода, порождающее правило.
Суть правила продукции для представления знаний состоит в том, что в левой части ставится в соответствие некоторое условие, а в правой части действие: если <перечень условия>[90], то <перечень действий>. Если это действие соответствует значению «истина», то выполняется действие, заданное в правой части продукции. В общем случае под условием понимается некоторое предложение, по которому осуществляется поиск в базе знаний, а под действием – действия, выполняемые при успешном исходе поиска.
Продукционные модели – это набор, правил вида «условия – действие», где условиями являются утверждения о содержимом некой базы данных, а действия представляют собой процедуры, которые могут изменять содержимое базы данных. Например: Если коэффициент соотношения заемных и собственных средств превышает единицу при низкой оборачиваемости, то финансовая автономность и устойчивость критическая.
Правила (в них выражены знания) и факты (их оценивают с помощью правил) являются основным структурным элементом систем искусственного интеллекта. Часто в практики управления правила выводятся эмпирически из совокупности фактов, а не путем математического анализа или алгоритмического решения. Такие правила называют эвристиками.
В продукционной модели база знаний состоит из набора правил. Программа, управляющая перебором правил – машина вывода, связывает знание воедино и выводит из последовательности знаний заключение.
В процессе обработки информации часто применяются два метода: прямой и обратный. В случае прямого подхода – метода сопоставления для поиска решений образцом служит левая часть продукционного правила – условие и задача решается в направлении от исходного состояния к целевому. В случае обратного подхода обработка информации осуществляется по методу генерации или выдвижения гипотезы[91] и ее проверки. Проверяются правые части продукционных правил с целью обнаружения в них искомого утверждения. Если такие продукционные правила существуют, то проверяется, удовлетворяет ли левая часть продукционного правила. Если да, то гипотеза подтверждается, если нет – отвергается.
В продукционных системах выделяют три основные компоненты:
– неструктурированная или структурированная БД;
– набор продукционных правил или продукций, каждая продукция состоит из двух частей:
a) условий (антецендент); в этой части определяются некоторые условия, которые должны выполняться в БД для того, чтобы были выполнены соответствующие действия;
b) действий (консеквент); эта часть содержит описание действий, которые должны быть совершены над БД в случае выполнения соответствующих условий. В простейших продукционных системах они только определяют, какие элементы следует добавить (или иногда удалить) в БД.
– интерпретатор, который последовательно определяет, какие продукции могут быть активированы в зависимости от условий, в них содержащихся; выбирает одно из применимых в данной ситуации правил продукций; выполняет действие из выбранной процедуры.
Продукционные модели близки к логическим моделям, но более наглядно отражают знания, поэтому являются наиболее распространенными средствами представления знаний. Чаще всего они применяются в промышленных экспертных системах, в качестве решателей или механизмов выводов.
Достоинства продукционных моделей:
– наглядность;
– высокая модульность – отдельные логические правила могут быть добавлены в базу знаний, удалены или изменены независимо от других, модульный принцип разработки систем позволяет автоматизировать их проектирование;
– легкость внесения дополнений и изменений;
– простота логического вывода.
Недостатки продукционных моделей:
– при большом количестве продукционных правил в базе знаний, изменение старого правила или добавления нового приводит к непредсказуемым побочным эффектам;
– затруднительна оценка целостного образа знаний, содержащего в системе.
3. Семантические сети[92]. Способ представления знаний с помощью сетевых моделей наиболее близок к тому, как они представлены в текстах на естественном языке. В его основе лежит идея о том, что вся необходимая информация может быть описана как совокупность троек: объекты или понятия и бинарное отношение между ними.
Наиболее общей сетевой моделью представления знаний являются семантические сети, в которых узлы и связи представляют собой объекты или понятия и их отношения, таким образом, что можно выяснить их значение. Это связано с тем, что в данной модели имеются средства реализации всех характерных для знаний свойств: внутренней интерпретации, стуктурированности, семантической метрики[93] и активности. Впервые понятие семантических сетей было введено в 60-х годах для представления семантических связей между концепциями слов.
Семантические сети применительно к задачам проектирования структуры баз данных экспертных систем используются в сравнительно узком диапазоне – для отражения структуры понятий и структуры событий. Они представляют собой модель, основой которой является формализация знаний в виде ориентированных графов с помеченными дугами, которая позволяют структурировать имеющуюся информацию и знания. Вершины графа соответствуют конкретным объектам, а дуги, их соединяющие, отражают имеющиеся между ними отношения. Построение сети способствует осмыслению информации и знаний, поскольку позволяет установить противоречивые ситуации, недостаточность имеющейся информации и т.п.
В семантических сетях, используются следующие отношения:
– лингвистические, включающие в себя отношения типа «объект», «агент», «условие», «место», «инструмент», «цель», «время» и др.;
– атрибутивные, к которым относят форму, размер, цвет и т.д.;
– характеризации глаголов, т. е. род, время, наклонение, залог, число;
– логические, обеспечивающие выполнение операций для исчисления высказываний (дизъюнкция, конъюнкция, импликация, отрицание);
– квантифицированные, т. е. использующие кванторы общности и существования;
– теоретико-множественные, включающие понятия «элемент множества», «подмножество», «супермножество» и др.
Различают:
– интенсиональную семантическую сеть, которая описывает предметную область на обобщенном, концептуальном уровне;
– экстенсиональную семантическую сеть, в которой производится конкретизация и наполнение фактическими данными.
Статические базы знаний, представленные с помощью семантических сетей, могут быть объектом действий, производимых активными процессами. Стандартные операции включают в себя процессы поиска и сопоставления, с помощью которых определяется, представлена ли в семантической модели (и где именно) специфическая информация.
Достоинство семантической сети:
– описание объектов и событий производится на уровне очень близком к естественному языку;
– обеспечивается возможность соединения различных фрагментов сети;
– отношения между понятиями и событиями образуют небольшое, хорошо организованное множество;
– для каждой операции над данными или знаниями можно выделить некоторый участок сети, который охватывает необходимые в данном запросе характеристики;
– обеспечивается наглядность системы знаний, представленной графически:
– близость структуры сети, представляющей знания, семантической структуре фраз на естественном языке;
– соответствие сети современным представлениям об организации долговременной памяти человека.
Недостатки семантической сети:
– сетевая модель не дает ясного представления о структуре предметной области, поэтому формирование и модификация такой модели затруднительны;
– сетевые модели представляют собой пассивные структуры, для обработки которых необходим специальный аппарат формального вывода и планирования.
Семантические сети нашли применение в основном в системах обработки естественного языка, частично в вопросно-ответных системах, а также в системах искусственного видения. В последних семантические сети используются для хранения знаний о структуре, форме и свойствах физических объектов. В области обработки естественного языка с помощью семантических сетей представляют семантические знания, знания о мире, эпизодические знания (т.е. знания о пространственно-временных событиях и состояниях).
Пример: Поставщик отгрузил товар из склада автотранспортом. На рис. 3.14. представлена интенсиональная семантическая модель, а на рис. 3.15. – экстенсиональная семантическая сеть. Факты обозначены овалом, понятия и объекты прямоугольником.
4. Фреймовые модели. Фреймы были впервые предложены в качестве аппарата для представления знаний М. Минским в 1975 г. Фреймовые модели представляют собой систематизированную в виде единой теории технологическую модель памяти человека и его сознания. Под фреймом понимают минимальные структуры информации, необходимые для представления класса объектов, явлений или процессов.
Фрейм можно представить в виде сети, состоящей из вершин и дуг (отношений), в которых нижние уровни фрейма заканчиваются слотами (переменными), которые заполняются конкретной информацией при вызове фрейма. Значением слота может быть любая информация: текст, числа, математические соотношения, программы, ссылки на другие фреймы. На заполнение слотов могут быть наложены ограничения, например цена не может быть отрицательной. Ниже приведены основные свойства фреймов.
– Наследование свойств. Все фреймы взаимосвязаны и образуют единую фреймовую структуру, поэтому достаточно просто производить композицию и декомпозицию информационных структур. Например: слот более низкого уровня указывает на слот более высокого уровня иерархии, откуда неявно наследуются (переносятся) значения аналогичных слотов, причем наследование свойств может быть частичным.
– Базовый тип. При эффективном использовании фреймовой системы, можно добиться быстрого понимания сущности данного предмета и его состояния, однако для запоминания различных позиций в виде фреймов необходимы большие объемы памяти. Поэтому только наиболее важные объекты данного предмета запоминаются в виде базовых фреймов, на основании которых строятся фреймы для новых состояний. При этом каждый фрейм содержит слот, оснащенный указателем подструктуры, который позволяет различным фреймам совместно использовать одинаковые части.
– Процесс сопоставления – процесс, в ходе которого проверяется правильность выбора фрейма, осуществляется в соответствии с текущей целью и информацией, содержащийся в данном фрейме. Фрейм содержит условия, ограничивающие значения слота, а цель используется для определения, какое из этих условий, имея отношение к данной ситуации, является существенным.
– Иерархическая структура, особенность которой заключается в том, что информация об атрибутах, которую содержит фрейм верхнего уровня, совместно используются всеми связанными с ним фреймами нижних уровней.
– Сети фреймов. Поиск фрейма, подобного предыдущему, осуществляется с использованием указателей различия. Поиск возможен благодаря соединению фреймов, описывающих объекты с небольшими различиями, с данными указателями и образованию сети подобных фреймов.
– Отношения «абстрактное – конкретное» и «целое – часть». Иерархическая структура фреймов основывается на отношениях «абстрактное – конкретное». На верхних уровнях расположены абстрактные объекты, на нижних уровнях – конкретные объекты. Объекты нижних уровней наследуют атрибуты объектов верхних уровней. Отношение «целое – часть» касается структурированных объектов и показывает, что объект нижнего уровня является частью объекта верхнего уровня. Наибольшее практическое применение получили отношения «абстрактное – конкретное».
Схема фрейма приведена на рис. 3.16. Теория фреймов послужила толчком к разработке языков представления знаний. Например, концепция объектно-ориентированного программирования в традиционных языках программирования использует понятия, близкие к фрейму. Модели фреймов имеют следующие достоинства:
– способность отображать концептуальную основу организации памяти человека;
– естественность и наглядность представления, модульность;
– поддержку возможности использования значений слотов по умолчанию.
– универсальность, так как позволяют отобразить все многообразие знаний.
В отличие от моделей других типов во фреймовых моделях более жесткая структура, которая называется протофреймом. Основной недостаток: отсутствие механизмов управления выводом, который частично устраняется при помощи присоединенных процедур, реализуемый силами пользователя системы.
В системах искусственного интеллекта могут использоваться одновременно несколько моделей представления знаний. Например, фрейм можно рассматривать как фрагмент семантической сети, предназначенной для описания объекта (ситуации) проблемной области со всей совокупностью присущих ему свойств. Значением некоторых слотов фрейма может быть продукция. В продукционных моделях используются некоторые элементы логических и сетевых моделей. Поэтому появляется возможность организовывать эффективные процедуры вывода и наглядное отображение знаний в виде сетей; отсутствие жестких ограничений позволяет изменять интерпретацию элементов продукции.
5. Нейронные сети. В настоящее время сформировалось новое научно-практическое направление – создание нейрокомпьютера, ЭВМ нового поколения, который способен к самоорганизации, обучению и имитирует некоторые способности человеческого мозга по обработке информации. Результатами явились представления знаний, основанные на массированной параллельной обработке, быстром поиске больших объемов информации и способности распознавать образцы. Технологии, направленные на достижение этих результатов относятся к нейронным вычислениямили искусственным нейрон