Голографическое распознавание образов

Одним из путей создания ЭВМ следующего поколения является переход на оптическое излучение как носитель информации. Уже сейчас создаются отдельные блоки будущих оптических компьютеров, и проверяется эффективность заложенных в них принципов. Некоторые из них функционируют на основе голографических методов записи, обработки и считывания информации. В этом разделе мы познакомимся с одним из таких перспективных методов – методом голографического корреляционного распознавания изображений.

Проблема распознавания изображений является весьма актуальной в системах промышленных роботов, в аэрокосмических системах ориентации, наведения и обнаружения, в медицинских приборах и др. В настоящее время основным методом распознавания является структурно-лингвистический метод, устанавливающий соответствие образа с эталоном по набору характерных признаков – деталей изображения. Метод является сложным и длительным, так как требует последовательного перебора всех элементов разложения в анализируемом изображении. Корреляционный метод распознавания, реализуемый с помощью голографии и когерентной оптики, позволяет производить параллельный анализ больших массивов информации с высокой производительностью и осуществлять распознавание объектов с указанием их координат практически в реальном времени.

В общем случае постановка задачи распознавания сводится к следующему.

Объект, подлежащий распознаванию, (будем в дальнейшем называть его образ) включен в какой-то контекст, то есть находится в среде иных изображений (например, в качестве образа выступает конкретная буква в тексте). Этот образ и все изображение, в которое он включен, будем рассматривать как оптические сигналы. Тогда они могут быть представлены в виде двумерных функций распределения волнового поля. Алгоритм корреляционного распознавания образов основан на вычислении корреляционной функции образа, представленного функцией fo и всего изображения, представленного функцией fi. Обозначим корреляционную функцию образа и изображения как φoi. Согласно определению корреляционной функции (см. формулу (26) в разделе 2, части I настоящего курса)

Голографическое распознавание образов - student2.ru , где символ * обозначает комплексное сопряжение. В краткой операторной форме:
Голографическое распознавание образов - student2.ru ; (28)
(6)

Если анализируемое изображение содержит искомый образ, то корреляционная функция имеет выраженный корреляционный максимум (корреляционный пик), по положению которого можно установить локализацию образа в поле изображения.

С использованием известных свойств корреляционных функций и свойств Фурье преобразования, описанных в разделе 2 части I настоящего курса, вычисление корреляционной функции можно свести к более простым операциям с Фурье образами, поскольку Фурье преобразованием функции корреляции является произведение Фурье образа одной из функций на комплексно сопряженный Фурье образ другой. Это утверждение доказано теоремой Винера – Хинчина. Если воспользоваться введенными выше обозначениями, то это свойство можно выразить следующим образом:

F Голографическое распознавание образов - student2.ru (7)

Где Fo и Fi – Фурье образы функций fo и fi соответственно, оператор Fобозначает операцию Фурье преобразования.

Такой алгоритм может быть реализован методом голографической сопряженной фильтрации, предложенным Вандер-Люгтом.

9.1. Коррелятор Вандер-Люгта

В этом методе оптическими средствами последовательно выполняются три операции.

1. Фурье преобразование от распределения света на входном транспаранте, содержащем анализируемое изображение.

2. Умножение его на комплексно-сопряженный спектр искомого образа.

3. Обратное Фурье преобразование, формирующее корреляционную функцию образа и изображения.

 
  Голографическое распознавание образов - student2.ru

В упрощенном виде оптическая схема голографического фильтра Вандер-Люгта представлена на рис. 32.

Рис. 32

Она представляет собой систему из двух софокусных линз, последовательно выполняющих прямое и обратное преобразование Фурье. В передней фокальной плоскости линзы Л1 расположен непрозрачный экран Э с двумя окнами. Одно из них расположено по центру на оптической оси системы, другое – в стороне от оси. Плоскость этого экрана является входной плоскостью системы. Задняя фокальная плоскость Ф линзы Л1 является Фурье плоскостью.

Предварительно изготовляют голографический сопряженный фильтр образа. С этой целью транспарант, содержащий изображение отдельно взятого образа, устанавливают в центральное окно входной плоскости. Перед другим окном устанавливают дополнительную линзу Л0, задний фокус которой совпадает с входной плоскостью. Линзу Л0­­ вместе с транспарантом освещают плоской волной, распространяющейся вдоль оптической оси. При этом линза Л0 формирует в верхнем окне точечный источник сферической волны, описываемый δ-функцией вида δ(х-х0), где х0 – координата источника сферической волны в плоскости экрана. После преломления в линзе Л1 эта волна превращается в плоскую волну, падающую наклонно на Фурье плоскость. Эта волна играет роль опорной волны R. Распределение поля этой волны в Фурье плоскости имеет вид Голографическое распознавание образов - student2.ru , где Н – амплитуда волны, ω – Фурье координата.

Волна, прошедшая через центральное окно входной плоскости, оказывается промодулированной функцией пропускания t транспаранта и формирует в задней фокальной плоскости Ф линзы Л1 Фурье образ Т транспаранта. Эта волна играет роль предметной волны. В Фурье плоскости устанавливают фотопластинку и регистрируют Фурье голограмму. Она представляет собой картину интерференции опорной и предметной волн. Распределение интенсивности I(x,y) в этой картине имеет вид:

I = |T + R|2 = T2 + R2 + TR* + T*R = T2 + H2 + T Голографическое распознавание образов - student2.ru + T* Голографическое распознавание образов - student2.ru (8)

Следует обратить внимание, что последнее слагаемое содержит комплексно-сопряженный спектр Т* записанного на голограмму образа.

После проявления фотопластинку устанавливают на прежнее место и теперь освещают одной лишь предметной волной (верхнее окно во входной плоскости перекрывают). Тогда в Фурье плоскости Ф, где расположена голограмма, при прохождении через нее предметной волны произойдет перемножение поля Т этой волны на пропускание I голограммы, выражаемое формулой (8). В результате сразу за голограммой поле I1 прошедшей волны можно представить следующим образом.

I1 = TI = T3 + TH2 + T2 Голографическое распознавание образов - student2.ru + TT* Голографическое распознавание образов - student2.ru (9)

Видно, что последнее слагаемое содержит произведение ТТ*. Это произведение в результате обратного Фурье преобразования, осуществляемого линзой Л2, в соответствии с формулой (7) сформирует в задней фокальной плоскости В поле, описываемое автокорреляционной функцией исходного образа t.

С физической точки зрения формирование этой автокорреляционной функции можно объяснить следующим образом. На стадии восстановления наша голограмма работает для падающей на нее предметной волны как комплексный фильтр, который оказывает влияние не только на амплитуду, но и на фазу волны. Этот фильтр, комплексно-сопряженный по отношению к предметной волне, представлен последним слагаемым в (8). Факт комплексной сопряженности физически означает, что фильтр имеет такое же фазовое распределение, как и предметная волна, но только с противоположным знаком фазы. Другими словами, падающая на фильтр волна, содержащая локальные искривления волнового фронта, подвергается со стороны фильтра искривлению в обратную сторону, и в итоге на выходе из фильтра волна оказывается плоской. Эта плоская волна фокусируется линзой Л2 в небольшое пятно, являющееся автокорреляционным пиком входного образа t. В последнем слагаемом выражения (9) помимо ТТ* содержится сомножитель Голографическое распознавание образов - student2.ru , описывающий линейное изменение фазы вдоль координаты х. Такое распределение имеет плоская волна распространяющаяся под некоторым углом к оптической оси системы. Точно такой же фазовый сомножитель содержится и в опорном волновом поле R. Таким образом, можно заключить, что слагаемое TT* Голографическое распознавание образов - student2.ru описывает вышедшую из нашего комплексного фильтра волну с плоским фронтом, распространяющуюся в том же направлении, что и опорная волна. Поскольку эта волна формирует автокорреляционный пик, то его положение в выходной плоскости системы совпадет с точкой, в которую должен был бы сфокусироваться опорный пучок, если бы он не был перекрыт на стадии восстановления голограммы.

В описанном опыте на стадии восстановления голограммы мы устанавливали образ в то же самое место входного окна, что и при ее записи. Если образ будет занимать при восстановлении иное положение, например, будет смещен куда-либо от оси системы, то нетрудно показать, что на выходе системы соответствующее смещение получит автокорреляционный пик образа. Таким образом, положение автокорреляционного пика отображает положение введенного во входную плоскость образа.

Пусть теперь мы восстанавливаем голограмму, установив на вход системы транспарант с иным изображением S, отличным от нашего образа. Тогда, проводя рассуждения как и в первом случае, мы можем видеть, что сразу за голограммой восстановленное поле будет содержать слагаемое ST* Голографическое распознавание образов - student2.ru , которое после обратного Фурье преобразования, осуществляемого линзой Л­2, сформирует функцию корреляции образа t с изображением s. Поскольку функции t и s существенно различны, то их корреляционная функция не будет содержать выраженного максимума. Этот факт можно трактовать как отсутствие отклика на текущий входной сигнал.

Теперь предъявим на вход системы наш исходный образ t в контексте какого-либо иного изображения s, то есть пусть входной сигнал представлен суммой t + s. Поскольку наша оптическая система линейна, то на сумму двух сигналов она реагирует суммой двух соответствующих откликов. То есть на выходе системы будет сформирована сумма из двух функций: автокорреляционной функции образа t и взаимно корреляционной функции от функций t и s. Автокорреляционная функция образа t будет содержать автокорреляционный пик, выделяющийся на фоне «размазанной» функции взаимной корреляции t и s. Положение этого пика будет отображать положение образа t во входной плоскости. Таким образом, описанная система позволяет не только выделить определенный сигнал из контекста (то есть среди других сигналов), но и указать его локализацию в пространстве.

К достоинствам метода голографической сопряженной фильтрации Вандер-Люгта следует отнести высокое быстродействие. Когда голографический фильтр изготовлен, то распознавание можно проводить практически в реальном времени. Однако метод имеет и серьезные недостатки. Наиболее существенный из них заключается в слишком высокой чувствительности коррелятора Вандер-Люгта к изменению входной информации. В частности, поворот изображения на угол 50 или изменение масштаба изображения на 5% приводят к исчезновению автокорреляционного пика и к невозможности различения образа. В связи с этим был разработан другой метод фильтрации, названный методом совместного Фурье преобразования.

9.2. Коррелятор совместного Фурье преобразования

 
  Голографическое распознавание образов - student2.ru

Метод реализуют с помощью коррелятора совместного преобразования. В отличие от коррелятора Вандер-Люгта здесь на вход одновременно поступают два сигнала: исходный образ и анализируемое изображение. Принципиальная схема коррелятора совместного преобразования представлена на рис. 33.

Рис. 33

Она также как и коррелятор Вандер-Люгта состоит их двух софокусных линз 1 и 3, осуществляющих прямое и обратное преобразование Фурье. Во входной плоскости Р1 расположены два окна отстоящие друг от друга на расстояние 2b. В одном из окон располагают транспарант с исходным образом t, а в другом – транспарант с анализируемым изображением f. Входную плоскость освещают плоской волной, распространяющейся по оси системы. В Фурье плоскости Р2 волны, прошедшие через окна, накладываются под углом друг к другу и интерферируют. Распределение интенсивности I в картине интерференции будет иметь вид

I = |T + F|2 = T2 + F2 + TF* + T*F (10)

Интерференционную картину регистрируют на расположенную в этой плоскости светочувствительную среду, которую в дальнейшем мы будем называть совместным голографическим фильтром. После записи информацию с голографического фильтра считывают плоской волной, которая распространяется по оси системы. Ее вводят с помощью полупрозрачного зеркала 2. Сразу за фильтром волновое поле окажется промодулированным пропусканием фильтра (10). В нем содержатся слагаемые TF* + T*F. После обратного Фурье преобразования, осуществляемого линзой 3, каждое из этих слагаемых сформирует в выходной плоскости Р3 корреляционную функцию образа t с анализируемым изображением f. Центры этих корреляционных функций будут располагаться по обе стороны от оптической оси на расстоянии 2b[1]. В выходной плоскости Р3 располагают матричный фотоприемник, воспринимающий корреляционную функцию. Если в составе анализируемой функции f содержится образ t, то корреляционная функция на выходе будет содержать корреляционный пик. Таким образом, коррелятор совместного преобразования также как и коррелятор Вандер-Люгта позволяет выделять нужный сигнал из контекста.

На первый взгляд может показаться, что коррелятор совместного преобразования менее удобен в задачах распознавания одного и того же образа среди разных картин. Действительно, для этого требуется последовательно записывать совместные голографические фильтры для каждой новой картины, в то время как в корреляторе Вандер-Люгта для всех входных изображений используется один и тот же фильтр. Тем не менее, оказалось, что при современном уровне развития оптоэлектронных средств регистрации световых полей, этот недостаток оборачивается достоинством.

В настоящее время разработаны оптически управляемые пространственные модуляторы света (ПМС) на основе структур металл – диэлектрик – полупроводник – жидкий кристалл. Такой пространственный модулятор выполнен в виде многослойной пластины, оптические свойства которой изменяются под воздействием излучения с определенной длиной волны. Это излучение используют для записи информации в виде пространственного распределения интенсивности. Считывание этой информации с пространственного модулятора производят излучением с другой длиной волны, которая лежит вне диапазона чувствительности модулятора. В результате запись и считывание могут быть совмещены во времени.

Такой пространственный модулятор света использован для оперативной записи совместных голографических фильтров в корреляторе совместного преобразования. В нем запись фильтра и воспроизведение корреляционный функции осуществляются почти мгновенно. Оптическая схема подобного динамического коррелятора совместного преобразования приведена на рис. 34.

 
  Голографическое распознавание образов - student2.ru

Рис. 34

Пучок света от лазера 1 расширяется коллиматором 2 и с помощью све­тоделителя 3 и зеркала 4 разделяется на эталонный пучок 5 и объектный пу­чок 6. В эталонном пучке помещен эталонный транспарант 7, а в объектном пучке — анализируемый транспарант 8. В качестве транспарантов 7 и 8 используют жидкокристаллические модуляторы света, управляемые компьютером.Фурье-объектив 9 формирует взаимномодулированные Фурье-образы эталонного и объектного изображений на ПМС 11. Считывающий пучок 14, полученный с помощью светоделителя 12, направляется зеркалом 13 на ПМС 11 и отражается в направлении еще одного Фурье-объектива 10, создающего изображение корреляционного поля в выходной плоскости коррелятора. Считывание корреляционного поля осуществляется видеокамерой 15.

Таким образом, на ПМС падают одновременно три световых пучка, два из которых представляют собой Фурье-образы волн эталонного и анализируемого изображений. Пучки F и S распространяются под углом φ друг к другу и используются для динамической записи голографического фильтра на ПМС. Третий пучок R представляет собой считываю­щую плоскую волну света, которая после отражения от ПМС фор­мирует две корреляционные волны, которые, в свою очередь, отделяются от остальных отраженных волн выбором соответствующих значений углов φ. При R - const распределение комплексных амплитуд света в одном из пер­вых порядков дифракции соответствует двумерной функции корреляции сравниваемых изображений, как это было показано выше.

Динамический характер записи фильтров и считывания корреляционных функций легко позволяет обеспечить процесс распознавания образов в реальном времени. Это позволяет преодолеть трудности, связанные с излишней чувствительностью коррелятора к вариациям масштаба и углового расположения образа. С этой целью осуществляют последовательный перебор функций корреляции анализируемого изображения с массивом образов различного масштаба и ориентации.

Наши рекомендации