Количественные и качественные методы системного анализа.

По степени формализованности процедур, реализующих перечисленные этапы методологии СА, можно выделить количественные и качественные методы СА. В качественных методах основное внимание уделяется постановке задачи, формированию вариантов, выбору подходов к оценке вариантов. Количественные методы связаны с анализом вариантов с их количественными характеристиками корректности и точности. Количественные методы связаны:

1) с оценкой показателей, характеризующих различные свойства систем;

2) с выбором оптимальной структуры системы;

3) с выбором оптимальных значений её параметров.

К количественным методам относятся следующие группы методов:

1 группа – аналитические методы – полная формализация схемы; эта группа в большей мере может быть отнесена к области Исследования операций;

2 группа –математические методы, когда в значительной степени используются формальные приемы анализа и эпизодически – возможности человека;

3 группа – семиотические методы, в которых широко используется эвристики и логика: математическая и (или) неформальная (нечеткая);

4 группа – имитационное моделирование, когда процесс выполнения этапов неотделим от процессов разработки моделей и получения информации по модели на основе формальных и эвристических процедур.

Качественные методы СА – группа методов экспертного оценивания и принятия решений.

Количественные методы системного анализа

Рассмотрим некоторые методы СА в качестве типичных примеров методов этой группы.

Энтропия – это количественная мера неопределённости случайного объекта или системы.

Генетические алгоритмы.

Генетические алгоритмы – перспективное и динамично развивающееся направление интеллектуальной обработки данных, связанное с решением задач поиска и оптимизации.

Область применения генетических алгоритмов достаточно обширна. Финансовые компании используют их для прогнозирования развития финансовых рынков при управлении пакетами ценных бумаг. Генетические алгоритмы применяются для решения комбинаторных задач, для оценки значений непрерывных параметров моделей большой размерности, для оптимизации моделей, включающих одновременно непрерывные и дискретные параметры. Другая область применения – использование в системах извлечения новых знаний из больших баз данных, обучение нейронных сетей, оценка параметров в задачах многомерного статистического анализа.

Сейчас при решении очень сложных задач основной целью является поиск уже не оптимального, а более «хорошего» решения по сравнению с решением, полученным ранее или заданным в качестве начального. Именно для этих целей и применяются генетические алгоритмы. Они не гарантируют обнаружения глобального экстремума целевой функции (или оптимального решения) за определенное время. Основное их преимущество в том, что они позволяют найти более “хорошие” решения очень трудных задач за меньшее время, чем другие методы. Генетические алгоритмы оказались достаточно эффектив­ными для решения ряда реальных задач инженерного проектирования, планирования, маршрутизации и размещения, управления портфелями ценных бумаг, прогнозирования, а также во многих других областях.

Отрицательной чертой генетических алгоритмов является то, что они представляют собой скорее подход к решению задач оптимизации, чем алгоритм. И вследствие этого требуют адаптации к каждому конкретному классу задач путем выбора определенных характеристик и параметров.

Основные определения и свойства

Генетические алгоритмы имеют целью нахождение не оптимального, а лучшего решения по сравнению с имеющимся решением задачи. Это связано с тем, что для сложной задачи часто требуется найти хоть какое-нибудь удовлетво­рительное решение, а проблема достижения оптимума отходит на второй план. При этом другие методы, ориентированные на поиск именно опти­мального решения, вследствие чрезвычайной сложности задачи становят­ся вообще неприменимыми.

Основные отличия генетических алгоритмов от традиционных методов:

1. Генетические алгоритмы работают с кодами, в которых пред­ставлен набор параметров, напрямую зависящих от аргументов целевой функции. Причем интерпретация этих кодов происходит только перед на­чалом работы алгоритма и после завершения его работы для получения результата. Впроцессе работы манипуляции с кодами происходят независимо от их интерпретации, код рассматривается просто как битовая строка.

2. Для поиска генетический алгоритм использует несколько то­чек поискового пространства одновременно, а не переходит от точки к точке, как это делается в традиционных методах. Это позволяет преодо­леть один из их недостатков – опасность попадания в локальный экстре­мум целевой функции, если она не является унимодальной, т. е. имеет несколько таких экстремумов.

3. Генетические алгоритмы в процессе работы не используют ни­какой дополнительной информации, что повышает скорость работы. Един­ственной используемой информацией может быть область допустимых значений параметров и целевой функции в произвольной точке.

4. Генетический алгоритм использует как вероятностные пра­вила для порождения новых точек, так и детерминированные пра­вила для перехода от одних точек к другим. Одновременное использование элементов случайности и детерминирован­ности дает значительно больший эффект, чем раздельное.

Прежде чем рассматривать непосредственно работу генетического ал­горитма, введем ряд терминов, которые широко используются в данной области.

Выше было показано, что генетический алгоритм работает с кодами безотносительно их смысловой интерпретации. Поэтому сам код и его структура описываются понятием генотип, а его интерпретация, с точки зрения решаемой задачи, – понятием фенотип. Каждый код представляет, по сути, точку пространства поиска. С целью максимально приблизиться к биологическим терминам, экземпляр кода называют хромосомой, особью или индивидуумом.

На каждом шаге работы генетический алгоритм использует несколько точек поиска одновременно. Совокупность этих точек является набором осо­бей, который называется популяцией. Количество особей в популяции назы­вают размером популяции. Размер попу­ляции является фиксированным и представляет одну из характеристик гене­тического алгоритма. На каждом шаге работы генетический алгоритм обнов­ляет популяцию путем создания новых особей и уничтожения ненужных. Чтобы отличать популяции на каждом из шагов и сами эти шаги, их называют поколениями и обычно идентифицируют по номеру. Например, популяция, полученная из исходной популяции после первого шага работы алгоритма, является первым поколением, после следующего шага – вторым и т. д.

В процессе работы алгоритма генерация новых особей происходит на основе моделирования процесса размножения. При этом, естественно, по­рождающие особи называются родителями, а порожденные – потомками. Родительская пара порождает пару потомков. Непосредствен­ная генерация новых кодовых строк из двух выбранных происходит за счет работы оператора скрещивания. При порождении новой популяции оператор скрещи­вания может применяться не ко всем парам родителей. Часть этих пар мо­жет переходить в популяцию следующего поколения непосредственно. Насколько часто будет возникать такая ситуация, зависит от значения ве­роятности применения оператора скрещивания, которая является одним из параметров генетического алгоритма.

Моделирование процесса мутации новых особей осуществляется за счет работы оператора мутации. Основным параметром оператора мутации также является вероятность мутации.

Поскольку размер популяции фиксирован, то порождение потомков должно сопровождаться уничтожением других особей. Выбор пар родите­лей из популяции для порождения потомков производит оператор отбо­ра, а выбор особей для уничтожения – оператор редукции. Основным пара­метром их работы является качество особи, которое опреде­ляется значением целевой функции в точке пространства поиска, описыва­емой этой особью.

Таким образом, можно перечислить основные понятия и термины, ис­пользуемые в области генетических алгоритмов:

• генотип и фенотип;

• особь и качество особи;

• популяция и размер популяции;

• поколение;

• родители и потомки.

К характеристикам генетического алгоритма относятся:

• размер популяции;

• оператор скрещивания и вероятность его использования;

• оператор мутации и вероятность мутации;

• оператор отбора;

• оператор редукции;

• критерий останова.

Операторы отбора, скрещивания, мутации и редукции называют еще генетическими операторами.

Критерием останова работы генетического алгоритма может быть одно из трех событий:

1. Сформировано заданное пользователем число поколений.

2. Популяция достигла заданного пользователем качества (например, значение качества всех особей превысило заданный порог).

3. Достигнут некоторый уровень сходимости, т. е. особи в популя­ции стали настолько подобными, что дальнейшее их улучшение происходит чрезвычайно медленно.

Характеристики генетического алгоритма выбираются таким образом, чтобы обеспечить малое время работы, с одной стороны, и поиск как мож­но лучшего решения, с другой.

24.Классификация интеллектуальных информационных систем

Для интеллектуальных информационных систем характерны следующие признаки:

- развитые коммуникативные способности;

- умение решать сложные плохо формализуемые задачи;

- способность к самообучению;

- адаптивность.

Коммуникативные способности определяют способ взаимодействия пользователя с системой.

Решение сложных плохо формализуемых задач требует построения оригинальных алгоритмов решения в зависимости от конкретной ситуации, характеризующейся неопределенностью и динамичностью данных и знаний.

Способность к самообучению – умение системы автоматически извлекать знания из накопленного опыта и применять их для решения задач.

Адаптивность – способность системы к развитию в соответствии с изменениями области знаний.

Каждому из перечисленных признаков соответствует свой класс интеллектуальных систем. Различные системы могут обладать одним или несколькими признаками интеллектуальности с разной степенью проявления.

На рис 1 приведена классификация ИИС на основе указанных признаков.

Интеллектуальные ИС
Системы с интеллектуальным интерфейсом (коммутативные способности)
Экспертные системы (решение сложных плохо формализуемых задач)
Самообучающиеся системы (способность к самообучению)
Адаптивные информационные системы (адаптивность)
Классифицирующие
Доопределяющие
Трансформирующие
Мультиагентные
Индуктивные системы
Системы, основанные на прецедентах
Информационные хранилища
CASE – технологии
Компонентные технологии
Интеллектуальные БД
Естественно-языковой интерфейс
Когнитивная графика
Нейронные сети

Системы с интеллектуальным интерфейсом

Системы с интеллектуальным интерфейсом делят на три разновидности.

Интеллектуальные базы данных позволяют в отличие от традиционных БД выполнять выборку информации, не присутствующей в явном виде, а выводи-

мой из совокупности хранимых данных.

Естественно-языковой интерфейс применяется для доступа к интеллектуальным базам данных, голосового ввода команд в системах управления, в системах машинного перевода с иностранных языков. Для реализации естественно-языкового интерфейса необходимо решить проблемы морфологического, синтаксического и семантического анализа, а также задачу синтеза высказываний на естественном языке. При морфологическом анализе осуществляется распознавание слов. В результате синтаксического анализа определяется структура предложения. Семантический анализ обеспечивает установление смысла синтаксических конструкций. Синтез высказываний заключается в преобразовании цифрового представления информации в представление на естественном языке.

Системы когнитивной графики ориентированы на общение с пользователем посредством графических образов, которые генерируются в соответствии с изменением параметров моделируемых или наблюдаемых процессов. Когнитивная графика позволяет в наглядном виде представить множество параметров, характеризующих изучаемое явление; применяется в системах мониторинга и оперативного управления, в обучающих и тренажерных системах.

Экспертные системы

Экспертные системы (ЭС) предназначены для решения трудных прикладных задач, требующих привлечения знаний и опыта экспертов, т.е. для решения неформализованных проблем, к которым относят задачи, обладающие одной (или несколькими) из следующих характеристик:

- задача не может быть представлена в числовой форме;

- исходные данные и знания предметной области обладают неточностью, неоднозначностью, противоречивостью;

- не существует однозначного алгоритма решения задачи;

- алгоритм решения существует, но его нельзя использовать из-за большой размерности пространства решений и ограничений на ресурсы времени и памяти.

Одним из важных свойств ЭС является способность объяснить ход своих рассуждений понятным для пользователя образом.

ЭС применяются в разных предметных областях – в бизнесе, производстве, медицине, проектировании и системах управления.

ЭС является инструментом, усиливающим интеллектуальные способности эксперта. Экспертная система может выступать в роли:

- консультанта для непрофессиональных пользователей;

- ассистента эксперта – человека в процессе анализа вариантов решений;

- партнера эксперта в процессе решения задач, требующих привлечения знаний из разных предметных областей.

Выделяют четыре класса экспертных систем.

Классифицирующие ЭС решают задачи распознавания ситуаций. Основным методом решения является дедуктивный логический вывод.

Доопределяющие ЭС используются для решения задач с не полностью определенными данными и знаниями. В качестве методов обработки неопределенных знаний используются вероятностный подход, коэффициенты уверенности, нечеткая логика.

Трансформирующие ЭС относятся к синтезирующим динамическим экспертным системам. В таких системах используются следующие способы обработки знаний:

- генерация и проверка гипотез;

- логика предположений и умолчаний, когда по неполным данным формируются представления об объектах определенного класса, которые затем адаптируются к условиям конкретных ситуаций;

- использование метазнаний (более общих закономерностей) для устранения неопределенностей ситуаций.

Мультиагентные системы – это динамические ЭС, основанные на объединении нескольких различных источников знаний. Эти источники обмениваются

между собой получаемыми результатами в ходе решения задач. Системы данного класса имеют следующие возможности:

- реализация альтернативных рассуждений на основе использования различных источников знаний и механизма устранения противоречий;

- распределенное решение задач, декомпозируемых на параллельно решаемые подзадачи с самостоятельными источниками знаний;

- применение различных стратегий вывода заключений в зависимости от типа решаемой задачи;

- обработка больших массивов информации из баз данных.

Самообучающиеся системы

Самообучающиеся системыоснованы на методах автоматической классификации ситуаций из реальной практики или на методах обучения на примерах. Примеры реальных ситуаций составляют так называемую обучающую выборку. Элементы обучающей выборки описываются множеством классификационных признаков. Используются стратегии обучения «с учителем» и «без учителя».

При обучении «с учителем» для каждого примера задаются значения признаков, показывающие его принадлежность к определенному классу ситуаций.

При обучении «без учителя» система сама выделяет классы ситуаций по степени близости значений классификационных признаков.

Самообучающиеся системы, построенные на этих принципах, имеют следующие недостатки:

- относительно низкую адекватность баз знаний реальным проблемам из-за неполноты и/или зашумленности обучающей выборки;

- низкую степень объяснимости полученных результатов;

- поверхностное описание предметной области и узкую направленность применения из-за ограничений размерности пространства признаков.

Индуктивные системы позволяют обобщать примеры на основе принципа индукции «от частного к общему». Обобщение сводится к классификации примеров по значимым признакам.

Нейронные сети представляют собой группу алгоритмов, обладающих способностью обучаться на примерах. Нейронные сети используются при решении задач обработки сигналов и изображений, распознавания образов, прогнозирования.

Нейронная сеть – это кибернетическая модель нервной системы, представляющая собой совокупность сравнительно простых элементов - нейронов. Способ соединения нейронов зависит от типа сети. Чтобы ее построить нейронную сеть для решения какой-либо конкретной задачи, следует выбрать способ соединения нейронов друг с другом и подобрать значения параметров межнейронных соединений.

В системах, основанных на прецедентах, база знаний содержит описания конкретных ситуаций (прецеденты). Прецеденты описываются множеством признаков. Поиск решения осуществляется на основе аналогий и включает сопоставление информации о текущей проблеме со значениями признаков прецедентов из базы знаний, выбор прецедента, наиболее близкого к рассматриваемой проблеме, адаптацию выбранного прецедента к текущей проблеме, проверку корректности полученного решения и занесение информации о полученном решении в базу знаний.

Информационные хранилища представляют собой хранилища информации, регулярно извлекаемой из оперативных баз данных. В отличие от оперативных баз данных, где данные постоянно меняются и присутствуют только в последней версии, хранилище данных – это предметно-ориентированное, привязанное ко времени, неизменяемое собрание данных, применяемых для поддержки процессов принятия управленческих решений. Технологии обработки информации в хранилище ориентированы на поиск закономерностей и отношений, скрытых в совокупности данных. Эти закономерности могут использоваться для оптимизации деятельности предприятия. Для извлечения информации из хранилищ данных используются специальные методы анализа данных, основанные на применении математической статистики, нейронных сетей, построении деревьев решений и др.Адаптивные информационные системы

Адаптивные информационные системыиспользуются в тех случаях, когда поддерживаемые ими предметные области постоянно развиваются. В связи с этим адаптивные системы должны удовлетворять следующим требованиям:

- адекватно отражать знания предметной области в каждый момент времени;

- быть пригодными для легкой и быстрой реконструкции при изменении предметной области.

В процессе разработки адаптивных систем применяется оригинальное или типовое проектирование. Оригинальное проектирование предполагает разработку информационной системы с нуля, на основе сформулированных требований. При этом используются системы автоматизированного проектирования или CASE – технологии.

При типовом проектировании осуществляется адаптация типовых разработок к особенностям предметной области. При этом применяются

средства компонентного (сборочного) проектирования информационных систем.

Наши рекомендации