Базовые алгоритмы обработки изображения
Сущность обработки изображения заключается в приведении исходного изображения сцены к виду, позволяющему решить задачу распознавания ее объектов.
Конечной целью обработки изображения в СТЗ является подготовка объектов сцены к распознаванию, т. с. отнесению их изображений к некоторым заранее заданным классам. Несмотря на многообразие представленных процедур преобразования информации, в СТЗ обычно выделяют три основных этапа обработки:
1) предварительная обработка изображения;
2) сегментация;
3) описание.
Предварительная обработка, в свою очередь, имеет две базовые стадии: формирование изображения и его кодирование (сжатие). Последовательность этапов не является жесткой и зависит от конкретной задачи.
Предварительная обработка изображения
Все методы предварительной обработки изображения в СТЗ подразделяют на пространственные и частотные. Пространственные методы являются процедурами, оперирующими непосредственно с пикселями изображения. В качестве характеристики изображения используется яркость У(х, у). Частотные методы связаны с переводом изображения в комплексную плоскость с помощью преобразования Фурье.
При рассмотрении процедур предварительной обработки ограничимся только пространственными методами, а исходное изображение будем считать полутоновым.
На первом этапе предварительной обработки происходит формирование изображения. Формированием изображения называется процедура непосредственного получения изображения в виде расположенного в памяти видеопроцессора массива дискретных элементов — пикселей, образующих матрицу или контур.
В СТЗ на этапе формирования изображения выбирают порог яркости путем регулирования освещения и проводят фильтрацию изображения.
Фильтрация изображения является наиболее длительной и сложной стадией предварительной обработки. В общем случае фильтрация решает следующие основные задачи:
· сглаживание (подавление высокочастотной помехи типа «снег»);
· повышение контрастности;
· выделение контура.
Процедура сглаживания реализуется сразу после выбора порога яркости. Ее смысл заключается в усреднении по определенному правилу значений функции яркости Y(X, у) внутри анализируемого фрагмента изображения.
Для устранения высокочастотной помехи типа «снег» служит фильтр нижних частот. Недостатком низкочастотной фильтрации является ухудшение контрастности изображения.
Сегментация
В результате предварительной обработки изображение содержит одно или несколько контурных представлений объектов. Процедура разделения этих контуров и соотнесения их с определенными объектами называется сегментацией.
Если априорно известно, что изображение содержит несколько объектов, процедура сегментации проводится после выделения контуров перед этапом кодирования изображения.
Алгоритмы сегментации, как правило, основываются на поиске разрывности в контуре и подобии областей. В первом случае находится контур и осуществляется его программный обход по установленному правилу. Если контур оказывается замкнутым, считается, что он принадлежит объекту. Во втором случае определяются области изображения, обладающие общими свойствами (например, одинаковой яркостью пикселей). При нахождении таких областей проводится их отнесение либо к фону, либо к объекту.
Кодирование изображения
Для систем, обрабатывающих полутоновые изображения пространственными методами, различают два основных метода кодирования:
· кодирование собственно изображения методом кодов длин серий;
· кодирование контура изображения цепным кодом Фримана.
В обоих случаях при кодировании происходит значительное уменьшение объема данных, характеризующих изображение. Эффективность кодирования определяется степенью сжатия изображения.
Сущность кодирования методом кодов длин серий, реализуемого с помощью алгоритма RLE, заключается в представлении изображения однородными отрезками строки развертки, где яркости и цвета пикселей одинаковы. При этом каждая серия характеризуется соответствующим значением и длиной серии (числом пикселей).
Для кодирования непосредственно контура изображения чаще всего применяют цепной код Фримана (рис. 6.22, б). В этом случае контур объекта начиная с некоторой точки задается последовательностью векторов, принимающих дискретные значения, с углом наклона модуля, кратным 45. Значение модуля равно 2, если угол наклона вектора составляет 45 , и 1 при вертикальном или горизонтальном его положении. Изменение направления вектора при переходе от одной точки кривой к другой отражает характер изменения моделируемой кривой.
Описание изображения
Под описаниемпонимается определение характерных параметров объекта — признаков (дискримторов), необходимых для его выделения из числа всех, образующих сцену.
По своей физической сущности признаки разделяются на глобальные и локальные. Глобальный признак изображения — это признак, который можно вычислить для любого изображения объекта.
Локальные признаки используют реже; они характеризуют не все изображение, а только часть его. К ним относятся угол между двумя контурными линиями, число и параметры отверстий на изображении объекта и т. п.
Распознавание изображения
Распознаванием называется процесс, при котором на основании набора признаков некоторого изображения объекта определяется его принадлежность к определенному классу.
Распознавание реализует функцию анализа визуального образа.
Условно все методы распознавания можно разделить на две группы: теоретические и структурные. Наиболее распространенные теоретические методы распознавания используют принципы теории принятия решений.
Определить реальное значение признаков объекта невозможно, так как значения различаются при каждом измерении. Поэтому задача распознавания ставится так: определить вероятность того, что объект принадлежит к заданному классу.
Одно из наиболее интересных направлений распознавания образов в СТЗ связано с разработкой алгоритмов распознавания лиц. Алгоритм распознавания (верификации) близок к алгоритму регистрации. Выделенные из текущего изображения признаки объединяются в вектор признаков, компоненты которого сравниваются с соответствующими компонентами всех векторов, содержащихся в базе данных.