Критерии оценки эффективности систем распознавания
ЭКЗАМЕНАЦИОННЫЙ БИЛЕТ № 1
ЭКЗАМЕНАЦИОННЫй БИЛЕТ № 1
1. Основные компоненты алгоритма распознавания как формальной системы. Принципы и методические подходы к распознаванию образов.
2.Основные этапы обучения статистических классификаторов, методы проверки качества обучения.
1.Принципы построения систем распознавания образов. В отличие от рассмотренной выше абстрактной системы, реальная система распознавания – это функционально взаимосвязанная совокупность методов и технических средств, осуществляющая процесс синтеза и анализа образов. Прежде чем приступать к построению системы распознавания, необходимо проанализировать всю доступную информацию об объектах исследования и решить следующие вопросы.
Какими общими характеристиками и свойствами обладают объекты исследования и чем они различаются. 2. Если необходимые характеристики могут быть получены в результате измерений, какова точность этих измерений. 3. Существует ли подходящая модель (модели) для формального описания и анализа данных характеристик. На основании проведенных исследований определяется тип и структура системы распознавания. По физической природе характеристик-признаков образов системы распознавания подразделяются на простые и сложные. Примером простой системы распознавания в задачах обработки данных ДЗ является классификация пикселов многозональных сканерных или оцифрованных спектрозональных изображений. В этом случае признаками являются спектральные отражательные свойства объектов земной поверхности. Как только в процесс классификации привлекаются другие типы данных, система становится сложной. Сложные системы распознавания могут быть одноуровневыми и многоуровневыми. В одноуровневых системах распознавание осуществляется на основе одного словаря признаков одним алгоритмом распознавания. В многоуровневых системах результаты распознавания, полученные на одном этапе, используются в качестве исходных данных на следующем. Большая часть технологий тематической обработки данных ДЗ при решении прикладных задач реализуется сложными многоуровневыми системами распознавания. Разбиение схемы решения задачи на уровни называется декомпозицией. Способ декомпозиции системы распознавания обычно связан с моментами включения в процесс распознавания специалиста-аналитика данных, то есть с интерактивным режимом обработки. Необходимость в интерактивном режиме чаще всего возникает на этапе синтеза образов из-за неполноты исходной информации или трудностей ее формального описания. В многоуровневых системах важной функцией аналитика данных является оценка качества распознавания на текущем этапе и возникающей из-за этого потери информации на следующем. По полноте исходной информации системы распознавания подразделяются на системы с обучением, без обучения и самообучающиеся системы.
В системах без обучения предполагается, что имеющаяся информация и выбранный принцип распознавания позволяют безошибочно разделить все необходимые классы. Типичным примером систем без обучения являются системы, основанные на принципе сравнения с эталоном (принципе перечисления). Системы без обучения могут быть построены и на принципе кластеризации, когда векторы-образы каждого класса образуют неперекрывающиеся компактные группы. Если имеющихся данных об объектах исследования недостаточно для их точного разделения, распознавание без обучения приводит к большим ошибкам. И наоборот, количество информации об объектах может быть настолько большим, что для выделения нужных классов нет необходимости использовать ее в полном объеме. В этих случаях применяют системы распознавания с обучением. Системы с обучением широко используются при тематической обработке данных ДЗ. Процедура обучения обычно выполняется специалистом-аналитиком данных в интерактивном режиме. Следует отметить, что любые процедуры классификации с обучением более трудоемки и качество распознавания иногда больше зависит от личного опыта аналитика данных и понимания им сути поставленной задачи, чем от эффективности самого алгоритма распознавания. Чаще всего системы с обучением основываются так или иначе на принципе общности свойств. При этом образы не обязательно должны быть представлены какой-то структурой. Это может быть просто множество параметров-измерений, подчиняющихся в каждом классе определенному закону статистического распределения, или множество каких-то атомарных (неделимых) элементов, присутствующих в каждом классе в определенной комбинации. Такие множества в обобщенной теории образов называют свободной конфигурацией [7,8]. Задача обучения заключается в выявлении типичных для каждого класса свойств образов или взаимосвязей между ними. Обучение в системах, использующих принцип кластеризации, заключается в поиске такого разбиения всего множества вектор-образов на кластеры, которое обеспечивало бы минимальные ошибки в процессе распознавания. В самообучающихся системах процедура обучения выполняется в самом процессе распознавания специальным алгоритмом. Для оценки качества распознавания используется некоторый функционал, связанный с ошибками распознавания, который в процессе обучения максимизируется или минимизируется. Одним из широко известных типов такого функционала является сумма квадратов ошибок (НСКО- критерии) * . * В некоторых современных работах [19,31] этот функционал, связанный со средней величиной ошибки классификации, называют функцией потерь, обобщая таким образом понятие, возникшее из игровой постановки задачи распознавания. Для каждой подсистемы распознавания Оценка эффективности системы распознавания Оптимизация процесса распознавания Построение алгоритмов распознавания (правил принятия решений P) Описание классов на языке признаков Составление словаря признаков {Sj}, j=1,...,n Формирование алфавита классов {Ak}, k=1,...,K Анализ задачи , решаемой системой Анализ исходной информации Анализ точностных требований Декомпозиция задачи Рис. 2.1. Общая схема построения системы распознавания. 12 Большое значение при декомпозиции сложных систем имеют требования к точности распознавания, то есть к допустимой вероятности ошибок. Если в одном алгоритме распознавания используются признаки различной физической природы или полученные из принципиально различных моделей, то величина ошибки может оказаться непредсказуемой. Поэтому декомпозиция системы должна осуществляться так, чтобы можно было надежно оценить точность распознавания на отдельных этапах решения задачи и скорректировать, при необходимости, всю схему решения. После декомпозиции сложной системы каждый уровень можно рассматривать как отдельную подсистему распознавания R со своим списком классов, словарем признаков и правилами классификации. Общая схема построения системы распознавания показана на рис. 2.1. Оценка эффективности системы распознавания выполняется для всей системы в целом, поскольку она может существенно зависеть от способа декомпозиции задачи. Ее можно оценивать по следующим показателям. 1. Итоговая точность распознавания. 2. Общее время распознавания. 3. Стоимость разработки и эксплуатации системы. При построении интерактивных систем распознавания, в частности, обработки данных ДЗ, в оценку эффективности системы могут быть включены затраты на подготовку специалистов-аналитиков, участвующих в процессе распознавания, поскольку от их квалификации часто зависит итоговая точность и общее время решения задачи.
2.образ - это описание объекта или процесса, позволяющее выделять его из окружающей среды и группировать с другими объектами или процессами для принятия необходимых решений. Те категории объектов, которые мы хотим выделить или на которые хотим разделить все множество образов в процессе распознавания, обычно называют классами. Понятие класса в распознавании появилось существенно раньше, чем в объектных информационных моделях. И способ задания классов здесь определяется не столько сущностью предмета исследования, сколько особенностями имеющейся информации об объектах и способами ее представления. Для системы обработки информации образ - это совокупность данных об объекте или явлении, включающая параметры и связи. Параметры представляют собой количественные характеристики, полученные с помощью измерительных систем или математических моделей. Связи могут 6 описывать как внутреннюю структуру образа, так и особенности его поведения, если мы имеем дело с динамическим объектом или процессом. Любой алгоритм распознавания можно представить как абстрактную функциональную систему R, состоящую из трех компонент: R={A,S,P}, (1.1) где A={Ak }, k=1,...,K – алфавит классов – множество категорий, по которым мы должны распределить наши образы, S={Sj}, j=1,...,n - словарь признаков - множество характеристик, из которых составляется описание образа, P={Pl}, l=1,...,L - множество правил принятия решения. Функционирование этой системы сводится к следующему: на вход подается образ – некоторая конфигурация из элементов множества S, к ней применяется определенная последовательность правил из Р, в результате конфигурации присваевается индекс, соответствующий одному из элементов множества A. Качество функционирования системы определяется тем, насколько часто присвоенный образу индекс совпадает с ожидаемым нами результатом. Компоненты A,S представляют собой информационную часть системы, а P – методологическую. Ясно, что смысл понятия класс для различных способов описания образов будет различным. В свою очередь, способ описания образа зависит от физической природы объектов распознавания и возможностей формализации соответствующих им понятий. Методы принятия решений, естественно, взаимосвязаны со способом представления объектов распознавания. Поэтому любая система распознавания включает и процесс синтеза образов, то есть формирования описаний объектов распознавания и их классов, и анализа образов, то есть сам процесс принятия решений. В зависимости от особенностей информационных компонент системы R, выделяют три подхода к задаче распознавания образов: 1) принцип сравнения с эталоном; 2) принцип кластеризации; 3) принцип общности свойств.
Принцип сравнения с эталоном применяется в тех случаях, когда каждому классу Ak можно сопоставить конечный набор эталонных образов Wk={wm, m=1,...,Mk }. Поэтому принцип сравнения с эталоном иначе называют принципом перечисления. В этом случае процесс распознавания заключается в простом сопоставлении образов, поступающих на вход распознающего устройства или алгоритма, с эталонами Wk классов Ak , на основе выбранной меры сходства. Принцип сравнения с эталоном - один из первых подходов, возникших при построении технических систем распознавания, когда возможности 7 вычислительных устройств были весьма ограничены. Тем не менее, он и сейчас применяется, в частности, в аналоговых и аналогово-цифровых системах распознавания. Распространенным примером применения такого подхода является распознавание печатных шрифтов. В тематической обработке изображений он может применяться при распознавании текстур и выделении объектов определенной формы. Принцип кластеризации. Если признаки представляют собой наборы измерений (параметров) без каких-либо явным образом заданных взаимосвязей, то образ можно представить как n-мерный вектор в признаковом пространстве Х: r x M x xn =æèçççöø÷÷÷ 1 Каждому классу Ak сопоставляется некоторое множество векторов в пространстве Х. В результате признаковое пространство разбивается на области, соответствующие классам Аk, которые называют кластерами или таксонами. Одному классу может соответствовать любое количество областей пространства X. Эти области могут перекрываться, но методология принятия решения должна в конечном итоге обеспечивать однозначное отнесение точки пространства к определенному классу. Принцип кластеризации (таксономии) широко применяется в различных прикладных направлениях при обработке количественных данных, в том числе и в системах компьютерного анализа многозональных и спектрозональных аэрокосмических изображений (классификация по спектральным признакам).
Принцип общности свойств существенно использует связи между элементами образа. Как правило, он применяется в тех случаях, когда множество образов каждого класса слишком велико, чтобы получить надежное описание конечного числа эталонов, но можно выявить достаточное количество отличительных особенностей классов по конечным выборкам образов. Выявленные свойства кодируются на основе подходящей модели и хранятся в памяти в виде некоторых структур, функций или отношений. В процессе распознавания производится анализ образа по схеме, позволяющей выявить необходимые свойства образа; затем они сопоставляются со свойствами классов Ak. Обобщающим свойством может быть сам алгоритм порождения образов; в этом случае классы образов задаются алгоритмами порождения структур определенного вида. Перечисленные подходы к распознаванию относятся в основном к процессу синтеза образов, то есть к способу представления информации - компонент A и S системы R. Методы анализа образов, то есть правила принятия решений, в большинстве случаев взаимосвязаны со способом 8 синтеза образов, хотя довольно часто тот или иной аппарат принятия решений, например, статистический, может применяться при различных способах синтеза. В методологии принятия решений при распознавании образов также выделяют три основных направления: 1) эвристические методы; 2) математические методы; 3) лингвистические (синтаксические) методы.
Эвристические методы основываются на опыте и интуиции разработчика системы распознавания. Как правило, эти методы ориентированы на решение конкретного типа задач распознавания и непосредственно привязаны к способу синтеза образов. Наиболее часто применяются при использовании принципа сравнения с эталоном и принципа общности свойств. Математические методы опираются на использование классического математического аппарата: методов линейного программирования, корреляционного анализа, теории статистических решений и т.п. Применяются в тех случаях, когда признаки представлены измерениями (параметрами), а их связи могут быть описаны в виде аналитических зависимостей. В той или иной степени математические методы используются во всех трех подходах к распознаванию.
Математические методы обычно подразделяют на детерминистские и статистические. В задачах анализа данных ДЗ наиболее часто применяют статистические методы. Это обусловлено высокой степенью изменчивости условий наблюдения и самих объектов исследования, а также потерей информации на разных этапах проведения ДЗ.
Лингвистические (синтаксические, структурные) методы применяются в тех случаях, когда образ представляет собой некоторую структуру, состоящую из так называемых непроизводных (первичных) элементов и признаков, описывающих связи между ними. В этих методах широко используется аппарат алгебры логики и теории формальных языков. При обработке данных ДЗ и в геоинформационных технологиях эти методы могут использоваться при анализе пространственных структур, некоторые из них применяются также в экспертных системах. Современный уровень развития вычислительных средств позволяет комбинировать в системах распознавания как различные подходы к описанию образов, так и методы, использующиеся в процессе распознавания. Рациональное использование этих подходов является главной залачей разработчика системы распознавания.
ЭКЗАМЕНАЦИОННЫЙ БИЛЕТ № 2
ЭКЗАМЕНАЦИОННЫй БИЛЕТ № 2
1.Этапы проектирования систем распознавания.
2. Влияние нарушения гипотезы о нормальном законе распределения признаков в классе на результат классификации по расстоянию Махаланобиса.
1.Основные этапы автоматизированной тематической обработки цифровых видеоданных. Применение аэрокосмической видеоинформации в различных направлениях тематического картографирования имеет свои особенности и ограничения. Соответственно, технологии обработки и анализа космических изображений для решения разных задач могут сильно отличаться даже в одной предметной области. Тем не менее, многие этапы существующих технологий могут быть полностью или частично автоматизированы с использованием уже известных алгоритмов обработки изображений и методов тематической классификации. Именно эти общие принципы организации технологий легли в основу конфигураций современных инструментально-программных средств обработки и анализа данных аэрокосмических изображений. В современной методологии тематического анализа аэрокосмической информации можно условно выделить два основных подхода: 1) количественный; 2) визуально-интерактивный. Количественный подход [4] был изначально нацелен на цифровую (компьютерную) обработку видеоданных для получения точных и объективных количественных характеристик изучаемых объектов или процессов. Анализ в этой методологии применяется к каждому отдельному пикселю изображения, что обеспечивает более точный и объективный результат решения задачи. Некоторые из таких задач базируются на расчетных физических моделях и комплексных синхронных измерениях необходимых параметров, либо в процессе проведения подспутниковых экспериментов, либо с использованием бортовой аппаратуры соответствующего назначения. Одной из таких задач является, например, мониторинг лесных пожаров. Визуально-интерактивные технологии используют традиционную методологию визуально-инструментального дешифрирования. Она основывается на анализе изобразительных характеристик территории, которые чаще всего являются косвенными признаками (индикаторами) изучаемых процессов и явлений. Появление специализированных инструментально-программных пакетов для обработки аэрокосмической информации позволило автоматизировать отдельные этапы визуального дешифрирования, но выделение объектов исследования по-прежнему выполняется в интерактивном режиме специалистом в конкретной предметной области. В ряде направлений тематического картографирования используются оба подхода, комплексно или параллельно. В любом случае автоматические методы обработки видеоданных позволяют получать более объективные, а при надежных дешифровочных признаках – и более достоверные результаты тематического анализа изображений. Независимо от того, какой подход преобладает в конкретном прикладном направлении, процесс тематической обработки видеоинформации можно разбить на ряд этапов, общих для всех современных автоматизированных технологий.
1. Радиометрические процедуры. Сюда относятся процедуры исправления искажений, обусловленных особенностями съемочной аппаратуры и внешними условиями съемки. Устранение шумов, внесенных системами получения, записи и передачи данных; преобразование значений данных в физические единицы – это радиометрическая коррекция (учет внутренних факторов). Внесение поправок на изменения освещенности, топографии, атмосферных условий – это радиационная коррекция (учет внешних факторов). Основная часть радиометрических преобразований выполняется в центрах приема и сбора информации (так называемая межотраслевая обработка). Но специалисты по прикладному дешифрированию в некоторых случаях выполняют ее сами. Иногда это обусловлено экономическими соображениями, иногда – специфическими требованиями к предобработке в конкретной прикладной задаче. Во многих пакетах тематической обработки имеются процедуры радиометрической коррекции изображений с наиболее распространенных типов аппаратуры.
2. Геометрические преобразования. К данной группе процедур относятся два типа преобразований: 1) устранение систематических искажений, обусловленных характеристиками датчика или бортовой платформы; 2) геометрические преобразования, обеспечивающие приведение видеоданных к требуемой системе координат. Первый тип геометрических преобразований можно также отнести к процедурам предварительной обработки. Чаще всего необходимость таких преобразований обусловлена изменением пространственного разрешения или смещением пикселей по строке или по направлению полета. Второй тип геометрических преобразований необходим, например, при составлении мозаик изображений или при визуально-инструментальном дешифрировании больших участков территории. Если же в процессе тематического дешифрирования используется классификация по спектральным признакам, то геометрические преобразования лучше выполнять после тематической обработки изображения. При трансформировании изображения пересчет значений пикселей к узлам прямоугольной сетки в новой системе координат может привести к непредсказуемому искажению спектральных характеристик объектов. Такая последовательность процедур обычно применяется во всех задачах, решаемых на основе уже упомянутого количественного подхода. Но если в процессе анализа используются данные наземных обследований или материалы разновременной съемки, приведение видеоданных к требуемой системе координат выполняется до начала тематической обработки для точной пространственной привязки этих данных к изображению.
3. Визуально-интерактивный анализ данных. Основной задачей визуально- интерактивного анализа является выделение дешифровочных признаков объектов и оценка информативности данных конкретного типа для поставленной задачи. При обработке многозональной информации этот процесс включает: 1) представление изображения в псевдоцветах с использованием RGB- композиций различных каналов; 2) исследование корреляции между каналами и выбор наиболее информативных каналов для решения поставленной задачи; 3) анализ главных компонент (ортогональное преобразование исходного набора каналов); выбор комбинаций каналов, в которых объекты исследования наиболее контрастны или же наиболее полно описывают физические взаимосвязи спектральных отражательных свойств объектов с исследуемыми параметрами. При визуально-интерактивном дешифрировании в процессе анализа видеоданных дополнительно используются процедуры препарирования изображений, улучшающие их изобразительные характеристики и подчеркивающие интересующие дешифровщика детали. Для этих целей выполняются поднятие контраста, различные виды высокочастотной и низкочастотной фильтрации. При количественном подходе к процедурам предварительного визуально- интерактивного анализа можно также отнести: 1) исследование спектральных отражательных свойств объектов, их изменчивости в зависимости от радиационных, метеорологических и других внешних условий получения видеоданных; 2) построение комбинаций каналов (индексов), инвариантных к условиям освещенности или функционально взаимосвязанных с физической моделью изучаемого объекта (процесса); здесь чаще всего используются отношения и/или разности каналов. Кроме того, в зависимости от цели тематического анализа аэрокосмических изображений могут потребоваться дополнительные процедуры обработки исходных изображений. Например, для ряда задач ресурсно- экологического мониторинга на этапе визуально-интерактивного анализа выполняется ландшафтно-геоботаническое районирование территории – выделение природно-территориальных комплексов, в пределах которых определенные дешифровочные признаки надежно отражают особенности изучаемой территории. Обычно для этой цели используются обзорные космические снимки масштаба 1 : 1 000 000 и мельче. Для обзорного анализа создаются композиции (мозаики) из нескольких изображений на обследуемую территорию. Конечным результатом предварительного визуального анализа является формирование общей схемы тематического дешифрирования видеоданных. Здесь определяется возможность полной или частичной автоматизации процесса обработки, перечень исходных данных и автоматических процедур, необходимых для ее выполнения.
4. Статистический анализ данных. Наибольшее значение статистический анализ видеоданных имеет в количественном подходе. На его основе формируется технология тематической классификации, определяется перечень классов, надежно разделяющихся автоматическими методами, и выбираются методы автоматической классификации, обеспечивающие наиболее качественный итоговый результат. К процедурам статистического анализа относятся: - анализ гистограмм изображения по каналам; - при работе с многозональными изображениями анализ диаграмм рассеяния значений пикселей в многомерном пространстве яркостей, изучение 24 взаимного положения образов исследуемых объектов в отдельных динамических диапазонах и многомерном пространстве яркостей.
5. Тематическая классификация. Под тематической классификацией подразумевается преобразование исходного изображения в тематический слой, где каждому пикселю исходного изображения сопоставлен индекс, соответствующий определенной категории объектов земной поверхности. Это тематический слой путем последующего редактирования и сегментации может быть доведен до тематической карты. Составление тематической карты в визуально-интерактивном режиме состоит в прослеживании линейных и оконтуривании площадных объектов, после чего каждому пикселю в пределах линии или контура приписывается соответствующий индекс. Однако такой процесс очень трудоемок и при выполнении любых количественных (например, площадных) оценок, не гарантирует необходимой точности и, главное, объективности результата. У каждого дешифровщика свое индивидуальное восприятие цвета, тона и, возможно, своя система описательных признаков. Поэтому даже в традиционных методологиях дешифрирования все чаще используются автоматические методы классификации изображений, хотя бы в качестве промежуточных или вспомогательных средств анализа. При тематической обработке на основе количественного подхода автоматическая классификация изображений является основным способом получения тематической карты. Сложившаяся методология автоматической классификации, представленная во всех современных пакетах обработки данных дистанционного зондирования, включает неконтролируемую классификацию (без обучения) и контролируемую классификацию (с обучением). Неконтролируемая классификация часто используется на этапе предварительного визуально-интерактивного анализа. Данная процедура автоматически разбивает изображение по яркостным признакам на заданное пользователем количество классов. При этом, однако, классы никак не связаны с конкретными объектами на изображении. Но по тому, как полученные классы легли на реальные объекты, можно оценить количество тематических классов, разделяющихся на изображении по спектральным яркостным признакам, и определить пространственную локализацию этих классов на изображении. Если на территорию отсутствуют данные наземных обследований или достоверные картографические материалы, интерпретация и группировка выделенных классов по их отражательным свойствам и характеру пространственной локализации – практически единственный способ получения тематической карты. На основе такой карты-гипотезы в дальнейшем могут планироваться необходимые наземные или дополнительные дистанционные обследования изучаемой территории. Контролируемая классификация выполняется при наличии эталонов, достоверно характеризующих дешифровочные признаки тематических классов. При выполнении классификации с обучением точность классификации (то есть 25 надежность отнесения пикселей к нужным категориям) во многом зависит от качества подготовки обучающих данных. Это усложняет интерактивный режим и предъявляет более высокие требования к подготовке самого аналитика данных. Тем не менее, решение целого ряда задач ресурсно-экологического картографирования может быть обеспечено только методами классификации с обучением.
6. Интерпретация и представление результатов тематической классификации. В современных технологиях для представления результатов тематической обработки космических изображений используются средства топологического пространственного анализа, который называют ГИС-анализом. К топологическим отношениям между объектами, которые используются при ГИС-анализе, относятся примыкание, вложенность, пересечение и некоторые другие. При решении задач локального характера (например, при мониторинге лесных пожаров), результаты обычно отображаются на уже существующей электронной карте. В этом случае единственной промежуточной процедурой является трансформирование обработанного изображения в необходимую картографическую проекцию. При сплошной классификации пикселей изображения процесс перехода от начального результата классификации к тематической карте может включать несколько этапов, в том числе: - интерактивную локальную переиндексацию пикселей с целью устранения ошибок классификации; - локальную или общую группировку некоторых исходных классов, если требуемая тематическая категория описывается комплексом индикационных признаков; - сегментацию изображения по индексам тематических классов, то есть выделение связных областей, соответствующих определенным тематическим категориям. В задачах расчета пространственно распределенных количественных характеристик объектов интерпретация включает преобразование результата классификации к тематической карте по требуемым показателям. Это осуществляется либо путем непосредственного расчета значений по формулам соответствующей модели, либо с использованием оверлейного ГИС-анализа - совместного анализа нескольких пространственно совмещенных тематических слоев. Предварительно выполняется приведение всех анализируемых видеоданных к единой системе координат. Объединение слоев в единое многослойное изображение осуществляется в пакете ERDAS Imagine функцией Utilities->Layer Stack блока Interpreter.
2.Классификация по расстоянию Махаланобиса. Эллипсоиды рассеяния для разных классов объектов земной поверхности чаще всего имеют разные размеры и ориентацию в пространстве признаков. В такой ситуации как раз и удобно 68 использовать расстояние Махаланобиса. Точка x будет относиться к тому классу, в котором она окажется ближе к его центру m в долях s для сечения функции плотности распределения, проходящего через точку m и точку х. Различие между классификацией по евклидову расстоянию и расстоянию Махаланобиса иллюстрирует рис. 25.
Рис.25. Иллюстрация различий между классификацией по евклидову расстоянию и расстоянию Махаланобиса. Если эллипсоиды рассеяния для классов с центрами m1, m2, m3 соответствуют уровню 3s, то все точки, принадлежащие данным классам, попадают внутрь этих эллипсоидов и по расстоянию Махаланобиса будут расклассифицированы корректно. Границы классов для классификации по евклидову расстоянию показаны пунктиром. В этом случае точки из заштрихованных областей попадут в чужой класс. На практических результатах классификации ошибки, показанные на рис.25, при нормальном распределении сигнатур пикселей внутри классов, могут отразиться незначительно, поскольку доля пикселей на краях диаграммы рассеяния в случае нормального распределения крайне мала (см. раздел 5). Но когда эллипсоиды рассеяния классов хотя бы сколько-то перекрываются, ошибки при использовании евклидова расстояния могут возрасти существенно. И в этом случае расстояние Махаланобиса будет иметь явное преимущество. Проблемы с методами классификации, в которых используются ковариационные матрицы сигнатур классов, возникают в тех случаях, когда один из классов в каком-то канале имеет дисперсию, близкую к нулю. Это приводит к вырождению ковариационной матрицы и, соответственно, к делению на ноль в выражении (22). Поэтому, если модуль статистической классификации отказывается работать или работает некорректно, необходимо проверить, нет ли среди эталонов классов «идеально однородного» класса в каком-то из каналов. Аналогичная ситуация может возникнуть, если для какого-то класса корреляция между одной из пар каналов близка к единице. 69 Во всех таких случаях имеет смысл использовать классификацию по минимуму евклидова расстояния. Для изображений, где преобладают однородные по яркости объекты (вода, почва, травянистая растительность), она оказывается значительно эффективнее статистических методов. Пример такого изображения приведен на рис. 26. Для изображения, на котором представлены менее однородные по яркости объекты, ошибки классификации по евклидову расстоянию могут оказаться совершенно неприемлемыми. Если оценка ожидаемой ошибки классификации этим методом на эталонах (см. далее раздел 7.7) не дает удовлетворительного результата, то можно попробовать исключить из обработки один из пары слишком сильно коррелированных каналов. Если же это существенно ухудшит разделимость остальных классов, лучше заменить выборки наиболее однородных объектов на менее однородные.
ЭКЗАМЕНАЦИОННЫЙ БИЛЕТ № 3
ЭКЗАМЕНАЦИОННЫЙ БИЛЕТ № 3
Взято из учебного пособия 2004года (2 параграф, начиная с 9 страницы)
ЭКЗАМЕНАЦИОННЫЙ БИЛЕТ № 4
1. Понятие разделяющей и решающей функции при распознавании образов, представленных наборами (векторами) параметров
2. Обоснование применения логических методов распознавания, описание образов и классов в логических методах.
Взято из учебного пособия 2013года( 57страница)
Вопрос 2
ЛОГИЧЕСКИЕ МЕТОДЫ
Логические методы распознавания образов базируются на аппарате алгебры логики и позволяют оперировать информацией, заключенной не только в отдельных признаках, но и в сочетаниях значений признаков. В этих методах значения какого-либо признака рассматриваются как элементарные события [46].
В самом общем виде логические методы можно охарактеризовать как разновидность поиска по обучающей выборке логических закономерностей и формирование некоторой системы логических решающих правил (например, в виде конъюнкций элементарных событий), каждое из которых имеет собственный вес. Группа логических методов разнообразна и включает методы различной сложности и глубины анализа. Для дихотомических (булевых) признаков популярными являются так называемые древообразные классификаторы, метод тупиковых тестов, алгоритм “Кора” и другие. Более сложные методы основываются на формализации индуктивных методов Д.С.Милля. Формализация осуществляется путем построения квазиаксиоматической теории и базируется на многосортной многозначной логике с кванторами по кортежам переменной длины [46].
Алгоритм “Кора”, как и другие логические методы распознавания образов, является достаточно трудоемким, поскольку при отборе конъюнкций необходим полный перебор. Поэтому при применении логических методов предъявляются высокие требования к эффективной организации вычислительного процесса, и эти методы хорошо работают при сравнительно небольших размерностях пространства признаков и только на мощных компьютерах.
Логические системы.
а) Метод решения задачи распознавания: логический, основанный на дискретном анализе и исчислении высказываний;
б) Метод априорного описания классов: логические связи, выражаемые через систему булевых уравнений, где признаки - переменные, классы - неизвестные величины.
Структурные (лингвистические) системы.
а) Метод решения задачи распознавания: грамматический разбор предложения,описывающего объект на языке непроизводных структурных элементов с целью определения его правильности.