Проблема разделения в самообучаемых экспертных системах
Допустим, мы имеем N категорий объектов, описанных замерами на определенном наборе переменных. Затем предъявляется еще один объект, заданный совокупностью М замеров на том же наборе переменных. Следует определить, к какой из N категорий принадлежит объект.
Если сформулировать эту проблему применительно к задаче технического диагностирования состояния АСУ ТП, то проблема будет выглядеть следующим образом. В системе АСУ ТП имеются датчики, исполнительные механизмы, управляющие узлы и т.д.
Для каждого отдельно взятого узла АСУ ТП определены: замеры параметров системы (напряжение, расход, давление, температура, влажность и т.д.), при которых этот узел находится в категории S1 (например, полностью исправен); замеры параметров системы, при которых этот узел находится в категории S2 (например, для датчика погрешность превышает оптимальную, но остается допустимой); ... ; замеры параметров системы, при которых этот узел находится в категории SN (полной неработоспособности).
Требуется по замеру параметров системы в произвольный момент времени определить, в какую из N категорий попадает данный узел системы.
Если N = 2, то требуется просто определить, исправен данный узел или неисправен.
Вообще говоря, поставленная проблема решается только в том случае, если указанные категории линейно сепарабельны. Это значит, что между каждой из категорий можно поместить разделяющую поверхность или ряд поверхностей. Поверхность определяется в терминах, которые легко измерить для данных объектов.
Если категории являются взаимоисключаемыми, т.е. объект в состоянии попасть только в одну из них (например, исправен – неисправен), то объект по результатам замеров помещают в наиболее вероятную категорию. Другими словами, помещают его в такую категорию, для которой значение вероятности р (Н: E) максимально. Здесь гипотеза Н соответствует одной из N категорий, а событие Е – все замеры, которые позволяют отнести объект к этой категории.
Заметим, что математически р (Н: E) является уравнением поверхности, которое в общем виде выглядит следующим образом:
, (4.7)
где bi – константы; xi – переменные. Это та поверхность, которая «указывает» в направлении конкретной гипотезы Н.
Проблему разделения можно решать двумя способами. Если xi – переменная, которая определяет текущее состояние системы – является дискретной и принимает значение 0 и 1 («да» или «нет»), то можно воспользоваться системой, принимающей решения по максимальной вероятности. Если xi является непрерывной величиной, то можно воспользоваться системой, принимающей решения по наименьшему расстоянию.