Общение на естественном языке
Одним из основных направлений исследований в области ИИ является разработка программно-аппаратных средств, обеспечивающих общение с компьютером на естественном языке. Решение данной задачи предусматривает как разработку подсистем понимания естественно-языковых (ЕЯ) высказываний, так и генерацию текстов на естественном языке. К обработке естественного языка относится и задача машинного перевода.
Сложность проблемы ЕЯ–общения можно проиллюстрировать на задаче машинного перевода. Первые программы машинного перевода, базирующиеся на использовании словарей и грамматик, оказались неэффективными. Обусловлено это было, прежде всего, многозначностью естественного языка – одни и те же слова в предложении имеют разный смысл в зависимости от контекста и знаний о предмете общения. Такие знания выходят за рамки знаний морфологии и синтаксиса языка. Для правильной интерпретации ЕЯ–высказываний компьютер должен обладать теми же знаниями, что и пользователь. Это требует создания больших баз знаний, что, само по себе, является сложной задачей. Проблема здесь состоит не столько в том, как разместить эти знания в памяти компьютера, а в том, как их получить. Поэтому в настоящее время общение пользователя с компьютером выполняется на проблемно-ориентированных подмножествах естественного языка.
Традиционно в системах, допускающих общение на естественном языке, выполняется несколько фаз анализа входных сообщений:
· морфологический анализ – поиск основ слов с отнесением их к определенным грамматическим категориям, обнаружение и исправление орфографических ошибок;
· синтаксический анализ – грамматический разбор предложений и определение их лингвистической структуры;
· семантический анализ – формирование смысла предложений на внутреннем языке системы;
· прагматический анализ – выявление взаимосвязи между предложениями текста.
В последнее время в задачах обработки ЕЯ все чаще применяют эмпирический подход, базирующийся на использовании методов статистики и машинного обучения. В этом случае подсистема понимания высказываний обучается на больших объемах реальных языковых данных. Это позволяет автоматизировать процесс формирования необходимых баз знаний (см. главу 9).
Распознавание образов
В рамках этого направления ИИ ведутся исследования по восприятию зрительной, слуховой и других видов информации, методам ее обработки с целью выделения существенных признаков воспринимаемых объектов и осуществления их классификации. Примерами задач распознавания образов могут служить: автоматическое чтение рукописных текстов, распознавание речи, анализ изображений, диагностика болезней, дистанционная идентификация объектов и др. Если множество признаков, разделяющих объекты на классы заранее не известно, то возникает задача обучения распознаванию образов или самообучения распознаванию образов. Поэтому данное направление ИИ близко к машинному обучению и неразрывно связано с нейросетями.
Решение задачи распознавания образов сводится к построению решающей функции, которая по значениям наблюдаемых признаков позволяет отнести объект к тому или иному классу. При построении решающей функции часто используют статистический подход. Однако его применение требует задания многомерных плотностей распределения вероятностей, определение которых может составлять самостоятельную задачу. Часто применяют иной подход, основанный на обучении распознаванию образов. Предложено много алгоритмов обучения распознаванию образов. Одним из наиболее простых является алгоритм обучения персептрона, который представляет собой простейшую нейронную сеть. Возможности простого персептрона по распознаванию образов весьма ограничены. Поэтому при решении многих практических задач применяют более сложные модели. Детально вопросы распознавания образов и обучения нейронных сетей рассматриваются в главе 8.
Компьютерное зрение
Более 85% информации человек получает с помощью зрения. Для современного компьютера этот канал ввода информации также играет важную роль. Но ввести изображение в память ЭВМ нетрудно. Для машины намного сложнее понять изображение. Поэтому главная задача, которую приходится решать при построении систем машинного зрения, – это не создание устройств ввода изображений, а разработка методов и алгоритмов анализа визуальной информации. Проблема создания систем компьютерного зрения тесно связана с такими направлениями ИИ, как представление знаний, обучение, распознавание образов (см. главу 10).