Перестройка восприятия при обучении
До сих пор мы обсуждали условия, необходимые для полноценного развития восприятия. Действительно, и активное взаимодействие с объектом, и наличие обратной связи, и ряд других условий способствуют построению адекватных образов, позволяющих узнавать оригиналы и быстро, и точно, и надежно. Однако не сразу образы достигают такого совершенства. На этом пути выявлен ряд промежуточных этапов. Понимание механизмов этих последовательных этапов позволяет представлять воспринимаемый материал оптимальным способом и тем ускорять и корректировать процесс формирования восприятия.
Зрительное наблюдение — целесообразно организованное восприятие, подчиненное стоящей перед человеком задаче. Обычно основные задачи наблюдения формулируют как обнаружение, опознавание (узнавание), идентификацию. При обнаружении наблюдатель фиксирует только наличие объекта (есть он или нет), при опознании он относит его к классу объектов (по обобщенным характеристикам класса), а при идентификации производит сличение объекта с конкретным эталоном, хранящимся в памяти, и на основании этой информации определяет значимость объекта в данной ситуации и принимает соответствующее решение.
Для обнаружения объекта с максимальной скоростью человек должен использовать такие свойства образов, как константность, обобщенность, предметность. Например, только достаточно сформированная константность допускает точное определение пространственного положения и ориентации объекта независимо от его расстояния до наблюдателя, ракурса наблюдения, цвета и формы. Опознание объекта может быть реализовано достаточно быстро и надежно, если человек опирается на эффективную систему признаков.
На основании экспериментального и теоретического анализа механизмов восприятия и узнавания зрительных изображений нами была выдвинута гипотеза о иерархической структуре процессов восприятия и опознавания [87, 88]. Такая структура развития восприятия позволяет понять переход от подробного и последовательного обследования объекта, зависящего только от его конфигурации, к активному выдвижению гипотез о возможной его форме на основе информации о классе близких фигур, накопленной в долговременной памяти, и проверке только критических точек этих гипотез.
Каждая зрительная задача содержит ограничения по скорости и точности решения. Они направляют поиск в различные поля долговременной памяти, определяя обращение к более или менее обобщенным признакам. Когда человек должен решить задачу достаточно точно, а время решения жестко не ограничено, он, по нашему мнению, прибегает к описанию объекта с помощью рекурсивно-вычисляемых признаков разного уровня обобщенности. Если задача решается в дефиците времени и некритична к точности решения, то используются описания другого типа — целостные представления объектов. Формирование таких представлений связано с разными видами пространственных преобразований всей фигуры в мысленном поле. Предполагается, что признаки первого типа фор-
мируются механизмами левого полушария головного мозга, а второго — механизмами правого полушария [90].
Процесс формирования «левополушарных» признаков любого уровня включает восприятие отдельных свойств объекта и логические операции, совершаемые над описаниями кодов этих свойств во внутреннем поле. Число и состав этих логических операций и определяют отличие каждого уровня в иерархии обобщенности признаков. Чем выше уровень, тем большая часть операций по вычислению признаков объекта при его анализе производится мысленно, с разрывом во времени между восприятием и узнаванием объекта. Движение от низшего уровня иерархии признаков ко все более высоким соответствует постепенному переходу при узнавании от действий только с объектом через сочетание действий с объектом и информацией, хранящейся в памяти, к действиям главным образом с информацией в памяти. Иными словами, этот процесс сопоставляется с погружением (интериоризацией)—переходом при узнавании от внешних двигательных операций с объектом к замене внешних действий на мыслительные операции обобщения и абстрагирования. По мере продвижения по этой иерархии более медленные — двигательные — операции вносят все меньший вклад в формирование признаков, и, овладевая признаками более высоких уровней обобщенности, человек использует при восприятии все более обобщенные оперативные единицы. В связи с тем, что объем кратковременной памяти ограничен (об этом более подробно см. в разделе «Память»), при повышении степени обобщенности оперативных единиц, используемых в качестве признаков, растет информативный объем оперативного поля.
Первый, низший уровень иерархической системы признаков восприятия составляют локальные (первичные) признаки, характеризующие отдельные участки контура объекта, например выпуклость участка, излом, кривизну, длину. Число участков, на которые разбивается контур объекта при его описании с помощью первичных признаков (первичный код), сопоставимо со сложностью объекта: оно тем больше, чем он сложнее. При опознании производится сличение кодов объекта, формируемого при восприятии и хранящегося в памяти. Сравнение первичных кодов адекватно наложению контуров объектов друг
на друга и их повороту до совмещения всех одинаковых участков.
Следующий уровень иерархии составляют обобщенные (вторичные) признаки, характеризующие не отдельные участки контура объекта, а весь объект в целом, например число углов (ранг), число вогнутостей, степень изрезанности всего контура и др. Логические операции фильтрации, компрессии и суммации, производимые в памяти, позволяют из первичного кода объекта получать его обобщенные признаки. Поскольку уже не вся обработка объекта при его восприятии производится во внешнем поле, а часть операций выполняется мысленно, во внутреннем поле, постольку скорость восприятия повышается, но происходит некоторая потеря точности узнавания объекта из-за обобщенности признаков.
Третий уровень составляют еще более обобщенные — третичные — признаки. Они характеризуют не сам контур воспринимаемого объекта, а его соотношение с контуром другого вспомогательного объекта, который целиком формируется мысленно. К таким признакам можно отнести удлиненность объекта, его компактность, площадь, ориентацию. Операции, вычисляющие третичные признаки, соотносят воспринимаемый объект со вспомогательным, и большая часть операций по обработке сведений об объекте выполняется мысленно, поэтому скорость узнавания на их основе растет по сравнению с узнаванием при использовании вторичных признаков, но точность его понижается.
Высший уровень иерархии — признаки сходства. Они обозначаются словами: похож, напоминает, близок и содержат сведения не об одном, а о нескольких объектах в их взаимных отношениях. Определение признаков сходства базируется на мысленных операциях — соотнесении отображений объектов с системой абстрактных осей координат. Каждая ось в этой системе — признак, по которому сравниваются объекты. Результаты сравнения положения объектов относительно всех использованных осей (выбранного пространства признаков) и есть признаки сходства. Они хранятся в памяти как сведения о степени качественного и количественного сходства объектов. Таким образом, признаки сходства отражают уже информацию не о свойствах самих объектов, а только об отношениях их свойств.
Если человек владеет указанной левополушарной системой признаков, то последовательность узнавания может быть представлена таким образом. Вначале устанавливается взаимное расположение и обобщенное сходство фигур, затем каждая из них категоризуется с помощью третичных, вторичных или первичных признаков в зависимости от необходимой скорости и точности опознания.
Особенности правосторонних представлений являются следствием иного восприятия объекта и иных форм его мысленного преобразования. Как известно, каждый объект мы характеризуем прежде всего со стороны практической — что мы можем делать с ним. Реализуя специфические для данного объекта действия, мы постепенно формируем его образ, и в дальнейшем, воспроизводя в предельно сокращенном варианте начальные компоненты этой системы действий в виде лишь намека на действия, мы получаем образ объекта. Важно подчеркнуть, что, поскольку правое полушарие ответственно за восприятие пространственных отношений и направления движения, постольку оно и обеспечивает развитие так называемого геометрического мышления, позволяющего, например, выделять топологические инварианты еще до созревания логического мышления, классификации и истинных понятий. Такие свойства правосторонних преобразований вносят весомый вклад в функционирование практического интеллекта, который позволяет осуществить не только вербально-логическое, но и наглядно-действенное выделение признаков. Используя особую логику — пространственно-временную и логику действия, правое полушарие формирует те грани образа, в которых может быть отражено не только целостное восприятие объекта, но и синтезировано видение его с нескольких ракурсов одновременно. Если представить себе левосторонний образ как проекцию объекта на плоскость в некоторый единственный момент восприятия, то правосторонний образ — это обобщенный портрет объекта.
Правое полушарие использует другие способы описания конфигурации изображения. В отличие от иерархии левосторонних признаков, они уже на нижнем уровне своей иерархии характеризуют не отдельный участок фигуры, а всю ее одновременно, целостно. К таким целостным признакам можно отнести симметрию, особым об-
разом утоньшенную исходную фигуру, получившую название «скелет», и сложность. При этом сложность является весьма обобщенной характеристикой, так как включает в себя меру регулярности свойств объекта, число его элементов и их разнообразие, а также учитывает конкретную последовательность анализа данного объекта при его восприятии. Скелет, сохраняя связность, ориентацию и симметрию исходной фигуры, создает возможность не только воспринять пространственную организацию фигуры, но и упростить мысленные пространственные преобразования с ней. Кроме уже упомянутых признаков к правополушарным можно отнести такое целостное представление, как цвет фигуры. Как известно, восприятие цвета оказывает на человека глубокое и многогранное влияние. В качестве правосторонней характеристики восприятие цвета тесно связано с первичными сенсорными процессами, неосознаваемыми душевными состояниями, оказывает мощное воздействие на работоспособность и настроение. В контексте обсуждаемых проблем необходимо подчеркнуть, что цвет влияет на восприятие человеком веса тела, температуры помещения, оценку удаленности объекта и различимость предметов.
Важная роль сложности как более обобщенного описания конфигурации изображения, чем сходство, проявилась в наших экспериментах, когда испытуемым предъявляли наборы несмысловых фигур и их просили разложить эти фигуры на две группы по сложности или по сходству. В каждом наборе фигуры были либо одного цвета, либо пяти различных цветов. Эксперименты показали, что стратегия испытуемых при классификации по сложности не зависела от цвета (была стандартной при всех цветах), а опиралась только на форму фигур. Что касается другого критерия — сходства, то действия испытуемых явно зависели от цвета. Таким образом, сложность, соотносимая с иерархией правосторонних описаний конфигурации изображения, проявила себя как более обобщенное описание, чем признак сходства, соотносимый с высшим уровнем иерархии левосторонних описаний. Использование оптимальных композиций право- и левополушарных признаков позволяет моделировать процесс узнавания для таких сложных объектов, как рукописные буквы, разрушенные, дефокусированные изображения и фотографические портреты [87, 88, 349].
Автоматическое распознавание рукописных знаков— букв и цифр — приобретает особую актуальность в связи с компьютеризацией. Этого требуют задачи обработки и редактирования рукописных текстов, обработки информации в банках и ряд других. Традиционные методы решения этой задачи основаны на анализе всех точек контура буквы, при этом каждый дискретный элемент ее конфигурации рассматривается несколько раз (минимум дважды), что приводит к большой затрате времени на перебор и замедляет узнавание. Разработанные нами алгоритмы распознавания на основе сбалансированного использования право- и левополушарных признаков позволяют радикально сократить перебор информативных точек изображения буквы и тем самым ускорить и упростить процесс распознавания. Существо использованного подхода состоит в том, что процесс анализа начинается с формирования обобщенного правополушарного представления буквы в виде ее каркаса — скелета. При построении каркаса используется менее десяти точек контура буквы, и многие буквы отличаются уже по каркасу. Для различения знаков с тождественными каркасами требуется следующий этап — применение левополушарных признаков, характеризующих форму отдельных коротких участков буквы. Программная реализация алгоритмов позволила сократить в 2—3 раза перебор при распознавании букв различных алфавитов — русского, английского, грузинского, армянского, хинди, урду.
Идея начинать анализ с обобщенного представления изображения применялась также для автоматического распознавания многотоновых фигур, разрушенных (дефокусированных) в такой степени, что невозможно было выделить их контуры. В этом случае опознание тоже начиналось с построения каркаса. Однако если каркас буквы представлял собой ее внешнюю оболочку, то здесь он формировался как структура из двух или четырех зондирующих линий, пересекавших фигуру. В качестве левосторонних различительных признаков использовались соотношения следов фигуры на линиях каркаса. Алгоритм оказался эффективным при распознавании нескольких десятков классов фигур, дефокусированных в разной степени, вплоть до такой, когда человек не различал уже никаких характерных особенностей фигур.
Аналогичный подход использовался и при обработке
реальных многотоновых фотопортретов. Для автоматического выделения контуров на них формировался каркас как структура зондирующих линий, но теперь уже с учетом предынформации о типовом строении лица (например, о том, что оба глаза не могут находиться по одну сторону от носа). При решении этой задачи также удалось достичь существенного ускорения обработки за счет сокращения перебора точек на входном фотопортрете. Упомянутые исследования подтвердили перспективность последовательного всключения правосторонних и левосторонних признаков на разных этапах распознавания. Это и неудивительно. В главе «Психические процессы и асимметрия полушарий» будет показано, что такая стратегия является магистральной при решении человеком зрительной задачи, поскольку доминирование правого и левого полушарий, сменяя друг друга последовательно, включают разные способы обработки информации.
Итак, в процессе восприятия человек накапливает сведения о предметах и явлениях не как сумму отдельных ощущений, а усваивает отношения между предметами и их свойствами. Восполнение наличных сведений следами прошлого опыта создает возможность предсказания и тем самым не только существенно ускоряет процесс узнавания, но и более успешно адаптирует человека к среде. Как психическая функция, восприятие обладает такими характеристиками, как константность, предметность, целостность и обобщенность. Они делают его относительно независимым от постоянно изменяющейся внешней среды.
Образ воспринимаемого объекта возникает, если человек так или иначе активен по отношению к объекту, т. е. если имеет место активная предметная деятельность. Система действий, посредством которой создавался образ, свертывается, погружается, и каждый раз, когда человек обращается к этому образу, он воспроизводит соответствующую, хотя и преобразованную, систему действий.
Адекватность образа поддерживается и корректируется правильно функционирующей обратной связью при достаточном объеме поступающей внешней и внутренней информации. Внешняя информация регулирует оптимальный уровень чувствительности восприятия, совокупность поступающей извне и изнутри информации создает возможность правильного восприятия своего положения во времени и пространстве, и, наконец, привычная структурированность внешней информации в сочетании с индивидуальным опытом человека обеспечивает закономерную работу его психики.
ВНИМАНИЕ
Вот какой рассеянный С улицы Бассейной!
С. Маршак.