Объекты зрительного восприятия
Ограничим класс рассматриваемых объектов зрительного восприятия ограниченными, двумерными, ахроматическими полиградационными (или двуградационными) изображениями целостных объектов на нейтральном фоне без шумов. Внутри этого класса можно провести более детальную классификацию, например, выделить контурные и силуэтные изображения и т. д. В настоящее время предложены различные методы для описания объектов такого типа. Отметим, что эти методы носят преимущественно аналитический характер.
В качестве объектов для математического описания обычно берутся не любые объекты зрительного восприятия, а лишь некоторые их достаточно простые изображения. Это ограничение обусловлено желанием получить простые описания, пригодные для теоретического анализа или технической реализации. В рамках уже введенных ограничений обычно рассматривается более узкие классы: двуградационные и многоградационные изображения, а среди двуградационных — силуэтные и контурные.
Большая информативность контуров показана в многочисленных психологических экспериментах и хорошо объясняется информационной теорией. Контур может быть описан характеристической контурной функцией, полученной с помощью радиально-круговой или следящей развертки. Признаки контура в этих случаях суть некоторые функционалы от характеристической контурной функции. Эти способы описания могут быть названы аналитическими.
Другую группу способов составляют методы лингвистического или структурного анализа. Сущность этих методов состоит в следующем: система различных геометрических особенностей контурных изображений и множество правил их перечисления в описаниях образуют специальный язык на котором можно выразить сходства и отличия рассматриваемых изображений. Множество геометрических особенностей изображений образует словарь этого языка — словарь признаков. Множество правил построения описания из признаков образует порождающую грамматику этого языка. Структурный подход к описанию контуров дает возможность свести задачу описания сложного контура к совокупности задач локального анализа. Задача локального анализа контура заключается в том, чтобы обнаружить структурные элементы, измерить для них значение параметров и определить способ их соединения в структуру или их взаимное расположение. Основные типы операторов локального анализа можно условно разделить на следующие три категории: сглаживания, дифференцирования и выделения структурных элементов, оценки их формы и измерения параметров.
Кроме аналитических и структурных способов описания контурных изображений существуют еще статистические способы, используемые для оценки их сложности. Имеется целый ряд статистических характеристик, которые могут рассматриваться в качестве критерия сложности контура. К ним относятся, например, энтропия контура или средняя длина непрерывной последовательности точек, имеющих одинаковую яркость. Далее, такими характеристиками могут быть распределение узловых точек на контурных линиях, распределение расстояний между параллельными отрезками контуров и др. Для классификации контуров по их сложности могут быть использованы также моменты распределения яркости 1-го, 2-го и более высоких порядков.
Теперь рассмотрим способы математического описания ахроматических изображений, функция распределения яркости которых имеет более двух градаций. К ним относятся, прежде всего, запись изображения в виде прямоугольной числовой матрицы. Величина числа, являющегося элементом матрицы, пропорциональна значению функции яркости на данном изображения. Увеличение числа элементов этой матрицы позволяет сколь угодно точно воспроизвести любое изображение. Кроме того, можно дать описание ахроматического изображения при помощи составления радиально-круговых характеристических функций. Плоское ахроматическое изображение может быть представлено также в виде системы уравнений и неравенств, описывающих их составные части. Один из способов такого описания состоит в использовании обычных представлений о плоских геометрических объектах, взятых из аналитической геометрии и дополненной системой модифицированных операций алгебры логики (дизъюнкции, конъюнкции и отрицания), обладающих рядом специфических свойств. Уравнению удовлетворяют координаты точек, лежащих не контуре изображения, а его область описывается неравенством. Распределение яркости на изображении может быть представлено в виде функционала, заданного на области, ограниченной уравнением контура.
Изложенное выше дает некоторое представление о разнообразии существующих математических моделей плоских ахроматических объектов зрительного восприятия, пригодных в той или иной степени для технической реализации. Однако для рассмотрения возможности их использования в качестве моделей зрительного восприятия человека, а также для выяснения роли, которую играют отдельные части изображения (область и контур) в зрительном восприятии, необходимы дополнительные знания о структуре и особенностях этого процесса.
Модель изображения должна соответствовать задачам исследования, удовлетворять условиям целостности и современным представлениям о процессе и механизмах восприятия. В качестве модели рассмотрим класс двумерных ахроматических полиградационных изображений.
Декомпозиция, алфавиты и состав изображения. В опубликованных нами ранее работах [66] был сформулирован общий принцип квантования непрерывных стимулов и реакций. Сущность его состоит в следующем. Любой стимул и реакция многомерны, причем по одним измерениям их свойства во времени и пространстве непрерывны, по другим — имеют разрывы непрерывности или большие значения градиентов в отдельных точках. Здесь речь идет о таких свойствах объекта, которые фиксируются отображающей системой: интенсивность, кривизна линии, высота тона, размерность пространства и другие переменные. Точки разрывов непрерывности и являются точками естественного квантования стимулов и реакций. Этот принцип согласуется и с информационными представлениями. Свойства реального мира таковы, что вероятность непрерывности значительно выше вероятности разрывов или больших перепадов свойств. Разрывы маловероятны, и, вследствие этого, наиболее информативны.
Квантование сигнала всегда связано с искажениями. Поэтому весьма важно правильно выбрать число и расположение уровней квантования. Квантование с использованием свойств получателя сообщений позволяет значительно снизить величину искажений. В силу первичности топологических свойств именно они должны быть основой выделения элементов. Действительно, элемент по определению неразложим и, следовательно, обладает свойством связности (или квазисвязности). Но этим же свойством обладает и целое. Значит, это свойство целого повторяется во всех его элементах. Таким образом, элемент изображения есть связное, ограниченное или почти ограниченное множество точек плоскости ху, на котором функция яркости В(х, у) непрерывна. Все изображения есть совокупность таких элементов. Границами элементов является некоторое конечное число замкнутых или почти замкнутых линий разрыва непрерывности функции В(х, у). Каждая из таких линий (контуров) в свою очередь является связным множеством точек и может быть разложена на элементы, границами которых являются точки, в которых кривизна линии контура терпит разрыв. Следовательно, изображение разлагается на элементы трех типов: части плоскости, отрезки линии и точки (элементы 2-го, 1-го и 0-го порядка). Этот процесс разложения изображения на элементы можно представить в виде дерева. Как целое, так и злементы каждого уровня связаны. Таким образом, множество точек изображения может быть разложено на непересекающиеся подмножества — части плоскости (области), части границ областей (отрезки прямых и кривых) и точки (границы отрезков линий). Теперь появляется возможность говорить об алфавите изображения.
Алфавитом изображения являются точки, отрезки линий и ограниченные части плоскости, обладающие различными наборами признаков. Единственным признаком точки является ее положение в пространстве. Признаками отрезка линии помимо положения в пространстве являются ориентация, величина, кривизна. Признаки ограниченной части плоскости более многочисленны: положение, ориентация, величина, светлота и др. Если упорядочить признаки, характеризующие элементы всех типов, то каждому элементу можно поставить в соответствие вектор значений признаков, включая пустое значение для тех значений признаков, которыми данный элемент не обладает. Тогда объект может быть представлен в виде дерева, в узлах которого будут векторы элементов.
Элементы-области и элементы-границы качественно различны и образуют два различных алфавита. Элементы-области соответствуют сохранению, элементы-границы — изменению свойств объекта.
С помощью описанного способа можно произвести декомпозицию изображения на элементы, определить алфавит и статистические характеристики множества элементов. На основе такой декомпозиции определяется и состав изображения как целого. В отличие от элементов, части целого могут быть функциями элементов, могут пересекаться и должны иметь большее сходство с целым (§ 1, гл. II). Учет семантики накладывает дополнительные ограничения на определение частей целого.
Множества элементов и частей целого не совпадают. Так, для фигуры, изображенной на рис. 3, ж, элементами являются три внутренние области прямоугольников (1, 2 и 3), стороны этих прямоугольников (прямоугольные отрезки) и вершины углов прямоугольника. Составом этой фигуры являются прямоугольники 1, 2, 3, (1 + 2), (2 + 3), (1 + 2 + 3).
Этот же принцип декомпозиции (разбиения объекта восприятия на элементы) может быть применен в несколько измененном варианте. Известно, что любая физическая система, в том числе и отражающая система человека, обладает следующими принципиальными ограничениями: разрешающей способностью, чувствительностью, и полосой пропускания, что соответствует у человека пространственным, интенсивностным и временным дифференциальным порогам. Так, ограничение, накладываемое разрешающей способностью, приводит к тому, что две точки, близко расположенные друг к другу, воспринимаются как одна. Эти пороги определяют минимальные пространственно-временные и энергетические «размеры» элемента объекта восприятия, например, элементов телевизионного изображения. В этом случае речь идет также о реакции на изменение, на перепад, на разрыв непрерывности на уровне нижних порогов. Если ранее рассмотренный способ квантования объекта может быть соотнесен с перцептивным уровнем восприятия, то здесь можно говорить о сенсорном квантовании. Отличие его от перцептивного квантования только в параметре, претерпевающем изменение.
Структура изображения. Выше были рассмотрены вопросы декомпозиции, разложения изображения на части и элементы, адекватные восприятию человека. Но процессы анализа и синтеза непрерывно связаны между собой. Перейдем теперь к исследованию тех свойств объектов зрительного восприятия, которые обеспечивают объединение элементов в единое целое и являются объективной основой формирования целостного образа или впечатления. Ранее уже отмечалось (§ 1, гл. II), что при объединении элементов в систему в последней появляются свойства, которыми не обладали отдельные элементы. В значительной степени эти свойства обусловлены отношениями между элементами, частями и целым. При восприятии системы элементов воспринимаются не только сами элементы, их признаки и интегральные характеристики множества элементов и частей, но и отношения между элементами, их признаками и интегральными характеристиками. Поэтому отношения, наряду с такими факторами, как связность и ограниченность, играют решающую роль в объединении элементов в целостную, единую систему. Это обстоятельство делает необходимым детальное исследование отношений в объектах зрительного восприятия. Можно выделить следующие задачи объективного анализа отношений в объекте восприятия: 1) изучение свойств отношений отдельных классов; 2) исследование свойств особых отношений; 3) исследование свойств множества отношений в целом объекте; 4) введение интегральных оценок множества отношений; 5) исследование взаимосвязи интегральных оценок множества элементов и множества отношений; 6) построение алгебры отношений (для соответствующей модальности).
Множество, на котором определены отношения объекта восприятия, состоит из его элементов и самого объекта. Все отношения можно разделить на качественные и количественные. Первые в свою очередь делятся на отношения эквивалентности, сходства (толерантности) и порядка, вторые — на метрические и групповые.
Среди метрических отношений следует отметить ряд особых отношений. Наиболее важным является золотое отношение, являющееся иррациональным числом 0,618... Это отношение единственно в том смысле, что оно обладает одновременно и аддитивными и мультипликативными свойствами. Отношения, меньшие 0,618, мультипликативны с недостатком, а большие — с избытком.
Особыми являются также отношения первых чисел натурального ряда: ½, ⅔ и ¾. Так, в музыке отношение тем более консонантно, чем проще отношение: октава — ½, квинта — ⅔, кварта — ¾. В архитектуре весьма употребительны отношения √2 = 1,41, √3 = 1,73.
Классы отношений как вид связи играют неодинаковую роль. Одним из основных факторов при этом является число элементов: при малом числе элементов большую роль играют количественные отношения, при большом — качественные.
Какие отношения из числа тех, которые могут быть определены на множестве элементов изображения, определяют структуру последнего? Это группа отношений порядка по признакам пространственного положения (пространственная структура) и значимости (функциональная структура). Структура определяется способом декомпозиции и типом отношений. В ряде случаев декомпозиция изображения может быть выполнена не единственным образом. Для разных декомпозиций при одном и том же типе отношений может быть определено соответствующее число различных структур, каждая из которых может восприниматься. Возникает задача синтеза более сложной структуры (полиструктуры) из этих частных структур.
Интегральные характеристики изображений. Одним из результатов деятельности воспринимающих систем организма является глобальная оценка свойств изображений. Будем называть такие свойства интегральными. Среди них выделим интегралы по составу и интегралы по структуре. Интегралы по составу делятся на интегралы областей, интегралы границ и интегралы соотношения областей и границ. В результате такой интеграции получим признаки изображения как целого. Признаки могут быть получены двумя принципиально разными путями: интеграцией после декомпозиции и интеграцией без предварительной декомпозиции путем ряда параллельных преобразований. Рассмотрим вначале второй путь.
Введем понятие об эффективной площади целостного изображения. Любое изображение может быть вписано в круг, эллипс или прямоугольник некоторой минимальной величины. Выбор одной из этих фигур зависит от очертаний изображения. Величину площади этой фигуры (эллипса или прямоугольника) и будем называть эффективной площадью изображения Q.
Двуградационное изображение полностью описывается заданием яркости B в каждой точке его поверхности ху. Будем считать, что яркость может принимать одно из двух значений: 0 или 1 (белое или черное). Учитывая ограничения физических систем, можно допустить, что граница между черными и белыми областями изображения является гладкой линией, не имеет точек излома. Введем две количественные характеристики таких изображений. Первая из них — σ есть отношение площади, занимаемой черной областью Sч, к эффективной площади изображения Q:
σ = Sч / Q.
Для получения второй характеристики путем суммирования (или интегрирования) определим длину границы между черными и белыми областями изображения. Это будет суммарная длина линий всех контуров черно-белого изображения Р. Тогда отношение
λ = P / Q,
будет иметь смысл средней длины линии контура изображения, приходящейся на единицу эффективной площади изображения. Величина σ изменяется в пределах 0 ≤ σ ≤ 1, а λ — в пределах 0 ≤ λ ≤ λmax, λmax зависит от ширины переходной зоны между черными и белыми областями.
Величины σ и λ, не являются независимыми. Приведем пример такой зависимости для частного случая. Пусть изображение имеет форму квадрата и образовано из маленьких квадратных элементов (рис. 4). Площадь всего изображения (большого квадрата) примем за единицу. Тогда величина σ будет изменяться от нуля до единицы. Ее значения отложены по оси абсцисс (рис. 4, а). Задавшись величиной элемента изображения (в данном примере — малого квадратика), можно определить максимальное назначение
величины λ для изображений такого типа. Величина λ будет изменяться от нуля до λmax. На том же рисунке значения величины λ (в условных единицах) отложены по оси ординат. Своего наибольшего значения величина λ достигает при σ = 0,5. Изображение в этом случае имеет вид шахматной доски.
Заштрихованная область на рис. 4, а, есть область допустимых значений для пары чисел σ, λ. На рис. 4, б приведены изображения, соответствующие точкам А, Б, В и Г из упомянутой области допустимых значений. (Часть контура изображения, совпадавшая с границами всего изображения, при определении λ не учитывалась.)
Интегральные характеристики σ и λ могут быть определены без предварительного разложения на элементы. Назовем их характеристиками первого рода. Определим величины σ и λ для изображений двух классов: 1) букв русского алфавита, выполненных прямоугольным брусковым шрифтом; 2) товарных знаков [67]. Образцы объектов первого класса приведены на рис. 5 , второго — на рис. 6. В выборках было: 31 буква алфавита и 25 товарных знаков.
На рис 7, а и б приведены гистограммы значений σ для этих двух классов объектов, на рис. 7, в и г — соответственные гистограммы для величины λ. Сравнение гистограмм показывает, что хотя объекты этих двух классов изображений заметно отличаются по сложности и разнообразию свооих элементов, положения максимумов на гистограммах либо совпадают, либо близки.
Интегральные характеристики второго рода могут быть определены после декомпозиции изображения на элементы. Рассмотрим примеры таких характеристик, определенных для контуров изображения. В линии контура имеются точки, в которых кривизна линии контура изменяется скачком: это точки сопряжения прямолинейного отрезка и дуги, двух дуг с разными знаками кривизны и точки сопряжения двух дуг с кривизной одного знака, но сильно отличающихся по величине кривизны. Назовем эти точки разбивающими (в соответствии с принципом декомпозиции непрерывного стимула и реакции). Этими точками контур будет разбит на конечное число прямолинейных отрезков и дуг (острые углы контура — тоже дуги большой кривизны).
Учитывая высокую информативность криволинейных отрезков, введем теперь интегральные характеристики на множестве криволинейных отрезков контура. В качестве первой характеристики примем кардинальное число этого множества N, в качестве второй — сумму абсолютных приращений угла наклона касательной, или, иначе, сумму абсолютных величин дуг контура
φ = ∑i |Δφi|
где Δφi — величина i-той дуги в угловых единицах. На рис. 7, д, е приведены гистограммы величины φ для уже рассматривавшихся двух классов объектов: русского алфавита и набора товарных знаков.
Важнейшей интегральной характеристикой объекта является разнообразие. Это понятие оказывается довольно емким и многогранным. Оно тесно связано также с другими интегральными характеристиками — регулярностью, сложностью и т. д. Поэтому содержательный и количественный анализ этого понятия представляет большой интерес.
Выделим в понятии разнообразия в качестве компонентов разнообразие состава и разнообразие структуры. Разнообразие состава будет определяться алфавитом и его распределением (относительными частотами букв). Разнообразие состава, в свою очередь, можно разделить на разнообразие элементов и частей.
Однако к анализу разнообразия в целом возможен и другой подход со стороны анализа ограничений, накладываемых на возможное разнообразие различными факторами: условием связности, заданием точки отсчета, физическими ограничениями, принципами гармоничности. Кроме этого, имеется ряд характеристик изображения, тесно связанных и, в известной степени, производных от разнообразия и регулярности: упорядоченность, сложность, однородность, неопределенность. Характеристики (меры) сложности и разнообразия не совпадают между собой. Сложность в большей степени, чем разнообразие, зависит от числа элементов и операций установления отношений между ними. Точно так же не совпадают меры разнообразия, неопределенности, однородности и упорядоченности. Так, для меры упорядоченности необходима точка отсчета, чего не нужно для меры разнообразия. Меры упорядоченности не должны зависеть от числа элементов. Система может быть упорядоченной, но не однородной (443311) и может быть локально упорядоченной и однородной (431431).
Анализ разнообразия тесно связан с характеристиками отражателя и способом его взаимодействия с объектом. Существенными характеристиками отражателя являются его энтропия, емкость памяти и вид выполняемого им преобразования. Способы взаимодействия можно разделить на последовательные и параллельные, которые зависят от относительной величины объекта.
Подводя итоги, можно сказать, что на основе системы понятий: целое, декомпозиция, элемент, признак, алфавит, состав, отношение, множество отношений, структура, интегральная характеристика можно произвести полное аналитико-синтетическое исследование изображения как целого. Существенной особенностью этого пути является то, что он начинается от топологии (элемент), переходит к тополого-метрическому понятию (признак), затем к метрике, а затем опять к метрико-топологии (интеграл отношений) и снова к топологии. Этот путь показывает ведущую роль топологии и подчиненность метрики, что и логично, так как метрические пространства являются частным случаем топологических.
Выше были приведены некоторые примеры интегральных характеристик двуградационных изображений. В следующем параграфе будут описаны интегральные характеристики мелодий. В связи с интегральными характеристиками представляют интерес следующие вопросы:
а) определение системы интегральных характеристик для объектов данного класса;
б) изучение распределения значений интегральных характеристик в данном классе объектов;
в) определение допустимых и максимальных значений интегральных характеристик;
г) определение зависимости между различными интегральными характеристиками объектов одного и того же класса;
д) психологическая интерпретация существования области допустимых значений и значений, соответствующих максимуму распределения значений.
Набор значений интегральных характеристик конкретного объекта отражает его индивидуальность в соответствующем классе объектов.
Гармоничный анализ объектов восприятия. Простейшим объектом, в котором реализованы все принципы гармоничного целого, является отрезок, разделенный на две части в золотом отношении. Рассмотрим теперь реализацию этих принципов в двумерных изображениях.
Повторение целого в частях означает, что один из признаков целого должен иметь близкие значения во всех ограниченных частях плоскости. Например, все части целого имеют близкую форму или колорит, ориентацию или эксцентриситет. Отсюда видно, что этот принцип реализуется на уровне состава. С точки зрения множества векторов, характеризующих части целого, это означает, что по одному из компонентов векторы сильно сближены.
Соподчиненность частей в целом применительно к изображению означает, что все части, во-первых, распадаются на три группы — главную, второстепенную и дополнительную, которые, в свою очередь, могут делиться. Основанием для такого распределения являются величины одного из признаков частей. В отличие от принципа повторения одного целого в частях, значения признака, по которому происходит соподчинение, должны занимать весь диапазон своих значений, располагаясь в нем по определенному закону. В качестве такого признака могут выступать положение в пространстве, величина, яркость, оптическая масса и другие. Соподчиненность реализуется на уровне структуры.
Множество метрических отношений объекта должно быть упорядочено в единую систему. Это достигается путем наложения ограниченной соразмерности. В объектах зрительного восприятия членение в каждом измерении производится по наиболее важным, фиксированным точкам. В случае двумерных объектов восприятия соразмерность может производится по каждому измерению в соответствии с применяемой системой координат. Рассмотрим в качестве примера изображение человека (рис. 8). Из рисунка видно, что функционально значимые и визуально фиксируемые точки тела, расположенные на вертикальной оси человека, связаны между собой метрическим (7—7—7—7—7), арифметическим (5—10—15) и геометрическим (7—11—18) рядами. Все размеры частей оси и вся ось имеют общий модуль. Этот, хотя и частный, но очень важный пример, а также анализ классических произведений живописи и архитектуры, позволяют высказать ряд соображений о соразмерности правильно (оптимально) организованных объектов зрительного восприятия.
Важнейшие фиксированные точки объекта восприятия должны быть охвачены тремя видами закономерностей: метрическим, арифметическим и геометрическим рядами, причем каждый из рядов может проходить по несовпадающим точкам. Часто арифметический ряд совпадает с отрезком натурального ряда, а геометрический имеет своим знаменателем (динамическим модулем) величины √2, √3 и 0,5(√5 - 1) (золотое сечение).
В сложных объектах могут существовать несколько однотипных рядов, но с разными постоянными. Ряды могут охватывать часть объекта. Особенно часто общим закономерностям не подчиняются краевые элементы, служащие для согласования с окружающей средой или фоном. Благодаря этому в объекте, наряду, с детерминизмом метрических отношений, реализуется и элемент стохастичности, неопределенности. Каждый из трех рядов выполняет свою функцию: метрический ряд обеспечивает статику восприятия, геометрический — динамику, а арифметический — непрерывный переход от статики к динамике.
Схему метрических отношений тела человека (рис. 8) будем рассматривать как общий инвариант. Описание метрических отношений тела конкретного человека можно представить как отклонение от этого общего инварианта в относительных единицах. Тем самым будут разнесены регулярная и вариантная части описания.
Наличие в объектах восприятия и результатах репродуктивной деятельности (см. § 5 этой главы) регулярных метрических отношений, благоприятное воздействие таких отношений на запоминание, восприятие и движение позволяет поставить вопрос о механизмах, фиксирующих такие отношения.
Выделим ряд факторов, определяющих субъективное чувство равновесия: равновесие объекта относительно вертикальной и горизонтальной осей, уравновешенность направленных частей объекта, тональное равновесие. Равновесие объекта относительно вертикальной оси зависит от распределения оптических масс, положения главного элемента [68].