Глава 4. Распознавание паттернов
Рис. 4.5. Канонический вид чашки и блюдца
Одно из теоретических объяснений общности канонических перспектив состоит в том, что через общий опыт восприятия объектов мы создаем постоянные воспоминания наиболее репрезентативного вида объекта, сообщающего наибольшее количество информации о нем. Таким образом, исследования канонических перспектив предоставляют нам информацию о восприятии формы, но они гораздо больше говорят об обработке информации, формировании прототипа (или типичных репрезентациях объектов в памяти), структуре мышления и, в упомянутом выше примере с чашкой и блюдцем, эффективности коммуникации. Мы храним понятия об общих классах объектов и используем своего рода зрительную стенографию, чтобы рассказать другим о наших впечатлениях.
Рис. 4.6. Чашка и блюдце - вид сверху
Канонические перспективы 143
Экспериментальные данные подтвердили эти выводы. Палмер, Рош и Чейз (Palmer, Rosch & Chase, 1981) делали серии фотографий обычных объектов в различных ракурсах (рис. 4.7). Испытуемые оценивали типичность этих ракурсов и степень знакомства с ними. Во второй части эксперимента испытуемым показывали фотографии лошади и других объектов (например, фотоаппарата, автомобиля, фортепьяно и т. д.), которым была дана подобная оценка, и просили назвать объекты как можно быстрее. Неудивительно, что канонические виды были идентифицированы быстрее всего; при этом время реакции увеличивалось по мере увеличения степени отличия изображения от канонического. Также следует отметить, что зрительная система все же работает достаточно эффективно, даже оценивая не вполне «совершенные» фигуры.
Есть несколько возможных причин того, что время реакции обычно больше для картин, отступающих от канона.
1. Меньшее количество деталей объекта попадают в поле зрения. Посмотрите на вид сзади на рис. 4.7. Сколько частей тела лошади вы можете видеть, смотря на нее сзади? Не очень много. (И кто знает, о чем бы вы подумали, если бы вам показали эту фотографию.)
2. Лучший (канонический) вид (фигура в верхнем левом углу) — тот, который мы видим наиболее часто. Мы «видим» пишущие машинки, стулья, автомобили, телефоны и лошадей в одном ракурсе чаще, чем в других, и поэтому этот вид нам более привычен.
Рис. 4.7. Двенадцать видов лошади, используемых в эксперименте Палмера, Роша и Чейза (Palmer, Rosch & Chase, 1981 ), со средними оценками «хорошей фигуры»
Глава 4. Распознавание паттернов
Теория геонов
Существует альтернатива жесткой модели сравнения с эталоном, требующей бесчисленных миллионов форм для сравнения с ними повседневных образов мира. Она предполагает, что человеческая система обработки информации имеет ограниченное число простых геометрических «базисных элементов», которые могут быть применены к сложным формам. Одна из подобных теорий, также имеющая некоторое сходство с подетальным анализом (мы рассмотрим его далее в этой главе), была сформулирована Ирвингом Бидерманом из Университета Южной Калифорнии. Представления Бидермана о восприятии формы основаны на понятии геон (сокращение от «геометрические ионы»). Согласно этой концепции, все сложные формы состоят из геонов. Например, чашка составлена из двух геонов: цилиндра (емкость для воды) и эллипса (ручка). (Примеры геонов и объектов приведены на рис. 4.9.) Теория геонов, как ее сформулировал Бидерман (Biederman, 1985, 1987, 1990; Biederman & Cooper, 1991; Biederman & Gerhardstein, 1993; Cooper & Biederman, 1993), предполагает, что распознавание объекта, например телефона,