Реконструкция видимого мира: зрение и обработка информации
Несмотря на сложность устройства сетчатки, она не в состоянии отделять непостоянные, лишние детали от постоянных, существенных черт видимых нами объектов, сцен и лиц. Сортировка зрительной информации, позволяющая сохранять необходимые для распознавания черты и отбрасывать несущественные, проходит преимущественно в коре больших полушарий. Более 20 лет Дэвид Хьюбел и Торстен Визель продолжали исследования Стивена Куффлера. Они изучали отделы зрительной системы в коре больших полушарий и углубили наше понимание механизмов обработки зрительной информации. Работы этих двух ученых, а также Семира Зеки из Университетского колледжа Лондона, дали первоначальное представление о способах конструирования мозгом линий и контуров, необходимых для распознавания объектов.
Зеки обратил внимание на принципиальную роль линий в творчестве первых мастеров абстрактной живописи, таких как Сезанн, Малевич и кубисты. Эти художники догадывались, что в мозге зрителя образы линий подвергаются существенной доработке и воспринимаются как очертания. Разные значения линий и контуров можно найти, сравнив две картины Климта и Кокошки с двумя рисунками Климта и Шиле.
Обычно мы без труда различаем изображенные объекты по их очертаниям. Но нередко это просто границы между цветовыми зонами. Сравним второй климтовский портрет Адели Блох-Бауэр (рис. I–1 ) с портретом Огюста Фореля работы Кокошки (рис. I–30 ). Климт выделил лицо и руки модели резким контрастом и довольно явственными контурами. Мы понимаем, где заканчивается голова и начинается головной убор, по резкому цветовому переходу между светлой и темной зонами. Простая контурная линия вместе с цветовым контрастом подчеркивают двумерность изображения и статичные, вневременные качества изображенной женщины. Кокошка сделал нечто иное. Пытаясь передать бессознательные мысли изображенного, художник использовал для передачи лица незначительные градации яркости, зато обвел его жирными линиями, благодаря которым голова почти выступает из холста. Руки выделены еще сильнее.
Когда мы смотрим на контурные рисунки, зрительная система может формировать мысленные представления, исходя из малозаметных различий в линиях и контурах. На рис. 16–1 мы видим слегка намеченную фигуру, окруженную орнаментом. На рис. 8–2 фигура изображена лаконичнее, ее контуры подчеркнуты. Этот рисунок сделан в технике Родена: художник не сводит глаз с натурщицы. Контурные линии на втором рисунке подчеркивают объем. Кроме того, они экономными средствами задают границу между фигурой и фоном. В итоге, хотя женщины на обоих рисунках в схожих позах, мы воспринимаем их по-разному.
Хотя контурные изображения, как на рис. 8–2, могут передавать трехмерные формы, они мало напоминают трехмерные формы, которые мы встречаем в жизни. Окружающие нас объекты, подобно фигурам Климта, не отделены от фона видимыми контурами. Убедительность контурных изображений помогает разобраться в интереснейших особенностях средств, используемых мозгом для распознавания видимых объектов.
Рис. 16–1. Густав Климт. Лежащая полуобнаженная. 1912–1913 гг.
По зрительному нерву (биологическому “кабелю”, объединяющему более 1 млн аксонов) импульсы ганглионарных клеток сетчатки передаются в латеральное коленчатое тело. Эта структура входит в состав таламуса – ворот и распределителя сенсорной информации, передаваемой в кору больших полушарий. Хьюбел и Визель начали с таламуса животных и выяснили, что нейроны латерального коленчатого тела обладают свойствами, сходными со свойствами ганглионарных клеток сетчатки. У них также имеются округлые рецептивные поля двух типов, с on- и off- центрами.
Затем Хьюбел и Визель исследовали нейроны первичной зрительной коры. Эти нейроны получают от латерального коленчатого тела информацию об изображениях и передают ее в другие отделы коры. Как и нейроны сетчатки и латерального коленчатого тела, нейроны коры высокоспециализированы, и каждый из них реагирует лишь на стимуляцию определенного участка сетчатки – своего собственного рецептивного поля. Нейроны первичной зрительной коры не просто воспроизводят информацию, поступающую из латерального коленчатого тела, а выделяют линейные аспекты закодированных образов. Рецептивные поля нейронов первичной зрительной коры имеют форму не кругов, а полос, благодаря чему эти нейроны лучше всего реагируют на линии, соответствующие очертаниям видимых объектов или границам между темными и светлыми участками зрительных образов.
Но самое поразительное открытие состояло в том, что нейроны первичной коры реагируют лишь на линии с определенной ориентацией: вертикальной, горизонтальной или наклонной. Если, например, линия поворачивается перед глазами, постепенно меняя угол наклона, при разных углах в первичной коре будут возбуждаться разные нейроны. Одни реагируют на вертикальное положение линии, другие – на горизонтальное, третьи – на промежуточные. Кроме того, нейроны первичной зрительной коры, как и нейроны сетчатки (и латерального коленчатого тела), лучше всего реагируют на нарушения непрерывности света и тьмы (рис. 16–2, 16–3 ).
Таким образом, глаза млекопитающих работают не по принципу фотоаппарата. Они не записывают пиксель за пикселем изображения находящихся в поле зрения картин и не воспроизводят их цвета как они есть. Кроме того, зрительная система умеет отбирать, отсеивать информацию, чего не делают ни фотоаппараты, ни дисплеи компьютеров.
Зеки пишет об открытии Хьюбела и Визеля:
Открытие того, что… клетки избирательно реагируют на линии, имеющие определенную ориентацию, стало огромным шагом вперед в изучении зрительной системы мозга. Физиологи теперь видят в этих клетках “строительные блоки” зрительного восприятия форм, хотя никому пока не известно, как именно мозг конструирует сложные формы из сигналов клеток, реагирующих на эти элементарные формы. Наши поиски и выводы в чем-то похожи на поиски и выводы Мондриана, Малевича и других художников. Мондриан считал прямую линию универсальной формой, из которой строятся все более сложные формы, а физиологи считают, что нервная система конструирует представления о сложных формах из сигналов клеток, специфически реагирующих на прямые линии определенной ориентации. Мне трудно поверить, что это сходство результатов физиологических исследований… с озарениями художников чисто случайное[145].
Рис. 16–2.
Художники оценили выразительную силу линий задолго до нейробиологов. Климт мастерски использовал закономерности восприятия контуров, давая зрителю возможность мысленно дорисовать очертания. Особенно ярко это мастерство проявилось в работах “золотого” периода, когда он “прятал” контуры тел портретируемых среди орнаментов, доверяя выстраивание этих границ воображению зрителя. Иногда он подчеркивал двусмысленность таких орнаментов. Ожерелье Юдифи (рис. 1–20 ) “отсекает” голову героини, и наше воображение дорисовывает контуры шеи. Наш мозг пользуется принципом завершения, благодаря которому мы, в частности, видим треугольник Канижа, которого на самом деле нет (гл. 12 ).
Рис. 16–3.
1. Рецептивное поле клетки первичной зрительной коры можно определить, регистрируя ее активность во время проецирования полоски света на сетчатку. Продолжительность освещения отмечена горизонтальной линией над последовательностью регистрируемых импульсов. Реакция данной клетки на полоску света сильнее всего тогда, когда полоска ориентирована вертикально и проходит через центр рецептивного поля.
2. Рецептивные поля простых клеток первичной зрительной коры состоят из узких и длинных возбуждающих (+) и тормозных (–) зон. Эти клетки могут реагировать на разные стимулы, но у их рецептивных полей есть три общих черты: 1) определенное положение на сетчатке, 2) отчетливые возбуждающие и тормозные зоны и 3) наличие оси ориентации.
3. Модель механизма работы рецептивного поля простой клетки коры, предложенная Хьюбелом и Визелем. К нейрону первичной зрительной коры ведут возбуждающие связи от трех или большего числа клеток с on- центром, вместе реагирующих на прямую полоску света, падающего на сетчатку. Рецептивное поле клетки коры получает вытянутую возбуждающую зону, обведенную на схеме прерывистой линией. Тормозную зону периферии, по-видимому, создают клетки с off- центром, рецептивные поля которых (не показаны на схеме) прилегают к рецептивным полям данных клеток с on- центром. Hubel, Wiesel 1962, с изменениями.
Хьюбел и Визель показали, что вычислительная работа зрительной системы организована иерархически: глаза получают образ в необработанном виде, а другие отделы шаг за шагом перерабатывают его в сознательно воспринимаемый. Кроме того, Хьюбел, Визель и Зеки продемонстрировали, что нейроны первичной зрительной коры и особенно двух следующих отделов зрительной коры, зон V 2 и V 3, реагируют на виртуальные линии так же, как на реальные. Эти нейроны способны дорисовывать неполные контуры. Эта способность лежит в основе явления, которое гештальтпсихологи назвали “завершением”.
Одним из примеров может служить треугольник Канижа (рис. 12–5 ). Этот неполный и неоднозначный рисунок наш мозг пытается завершить и осмыслить. С помощью нейровизуализации Зеки продемонстрировал: когда человек смотрит на подразумеваемые линии, у него активируются нейроны первичной зрительной коры и зон V 2 и V 3, а также зоны, играющей ключевую роль в распознавании объектов.
Предполагается, что наш мозг завершает неполные линии потому, что в природе часто встречаются неясные контуры, которые для правильного восприятия образов необходимо мысленно дорисовать. Это бывает, например, когда мы видим человека, выглядывающего из-за угла, или льва за кустом. Ричард Грегори отмечал: “Наш мозг сам создает значительную часть того, что мы видим, добавляя к зрительным образам недостающее. Но мы замечаем, как он прибегает к догадкам, лишь тогда, когда он угадывает неверно, порождая явно несуществующие вещи”[146].
Для распознавания фигур их необходимо отделять от фона. Разделение на фигуры и фон осуществляется непрерывно и динамично, потому что элементы, входящие в состав фигуры в одном контексте, могут входить в состав фона в другом. Некоторые клетки зоны V 2, реагирующие на виртуальные линии (такие как очертания вазы Рубина), реагируют также на границы фигур. Но для отделения фигуры от фона недостаточно определить ее границы: необходимо также сделать из контекста вывод, с какой стороны границ располагается фигура. Проблему принадлежности границ особенно наглядно демонстрирует, например, ваза Рубина, где одни и те же части кажутся то фигурой, то фоном.
С помощью нейровизуализации Зеки и его коллеги наблюдали, что происходит в голове человека во время переключений фигуры и фона. Когда испытуемый смотрит на вазу Рубина, попеременно активируется то зона распознавания лиц (в нижней височной коре), то зоны теменной коры, задействованные в распознавании предметов. Кроме того, каждое переключение сопровождается мимолетным спадом активности первичной зрительной коры. Активность этой зоны необходима для восприятия любого образа, будь то ваза или лица, но для переключения с одного образа на другой требуется ее приостановка. Зеки и его коллеги также отметили, что во время переключения информация в мозге транслируется шире, активируя и лобно-теменную область коры. Ученые предположили, что такая активность соответствует нисходящей обработке информации и что именно она определяет, какой образ человек воспринимает сознательно. Вероятно, участие лобно-теменной коры необходимо для осознания человеком, смотрящим на вазу Рубина, что видимый образ только что изменился. (Мы вернемся к этому вопросу в главе 29, посвященной переключению с бессознательной обработки информации на сознательную.)
Изображение, проецируемое на сетчатку, двумерно, как картина или фильм, но мы все-таки видим мир трехмерным. Как это выходит? Для восприятия глубины мозг пользуется прежде всего монокулярными и бинокулярными разновидностями признаков.
В немалой степени восприятие глубины, в том числе перспективы, возможно на основе монокулярных признаков. Более того, наши недалеко расставленные глаза, по сути, одинаково видят объекты, удаленные на 6 м и дальше. Когда мы смотрим на такие объекты, не имеет значения, делаем ли мы это двумя глазами или одним. Тем не менее мы обычно без труда оцениваем расстояние до удаленных объектов. Наша способность воспринимать глубину одним глазом обеспечивается рядом монокулярных признаков глубины (рис. 16–4 ). Художники знают это не одно столетие. Леонардо да Винчи классифицировал и описал их еще в начале XVI века.
Когда мы смотрим на неподвижные изображения, например картины, мы пользуемся пятью основными монокулярными признаками глубины. Эти признаки особенно важны для художников, которым приходится изображать трехмерные сцены. Первый признак – знакомые размеры. Так, имея дело с известным нам человеком, мы можем оценить расстояние до него (рис. 16–4 ). Если он кажется нам меньше, чем был, когда мы видели его в последний раз, он, судя по всему, находится дальше от нас, чем в тот раз.
Рис. 16–4.
Перекрывание. Прямоугольник 4 нарушает видимые очертания прямоугольника 5, указывая на то, что находится перед ним, но не на расстояние между ними. Линейная перспектива. Хотя прямые 6–7 и 8–9 параллельны, на плоскости изображения они выглядят сходящимися. Сравнительные размеры. Исходя из того, что размеры двух мальчиков примерно одинаковы, мы предполагаем, что тот из них, кто кажется больше (1), находится ближе к нам, чем тот, который кажется меньше (2). По тем же признакам мы оцениваем, насколько прямоугольник 4 ближе прямоугольника 5.
Знакомые размеры. Мужчина (3) и ближайший мальчик имеют на картинке почти одинаковые размеры. Если мы знаем, что мужчина выше мальчика, мы выводим из их размеров на картинке, что мужчина ближе к нам, чем мальчик. Эта разновидность признаков не так надежна. Hochberg 1968, с изменениями, Kandel et al., 2000.
Второй монокулярный признак – сравнительные размеры. Если два человека или схожих объекта имеют разные видимые размеры, мы предполагаем, что тот из них, кто кажется меньше, находится дальше. Кроме того, мы оцениваем размеры объекта, сравнивая его с непосредственным окружением (рис. 16–5 ). Когда мы видим двоих людей, удаленных на разное расстояние, мы судим об их размерах, сравнивая этих людей не друг с другом, а с непосредственно окружающими их предметами. При этом мы опираемся на свое знакомство с размерами этих предметов.
Рис. 16–5.
а) Девушка на переднем плане ближе к фотоаппарату, чем мужчина на заднем плане.
б) На обработанной фотографии мужчина перенесен на передний план. Теперь кажется, будто девушка и мужчина находятся от нас на одинаковом расстоянии, но мужчина сильно уменьшился, хотя размеры его изображения не изменились.
Третий признак – перекрывание. Если человек или предмет частично закрыт другим человеком или предметом, мы предполагаем, что второй ближе к нам, чем первый. Например, мы видим на плоской поверхности три геометрических фигуры (рис. 16–6 ): круг, треугольник и прямоугольник. Кажется, что ближе всего к нам круг, а дальше всего – прямоугольник, потому что прямоугольник частично перекрыт треугольником, а треугольник – кругом. В отличие от других монокулярных признаков, перекрывание позволяет определять лишь относительную удаленность объектов, но не позволяет судить об их абсолютном положении в пространстве.
Четвертый признак – линейная перспектива. Параллельные прямые линии, такие как железнодорожные пути, выглядят сходящимися к одной точке на горизонте. Чем больше видимая длина таких линий, тем большее мы ощущаем расстояние (рис. 16–4 ). Зрительная система интуитивно интерпретирует схождение как признак глубины, предполагая, что параллельные линии всегда остаются параллельными.
Пятый признак – пространственная перспектива. Теплые цвета кажутся нам ближе, чем холодные, а темные объекты – ближе, чем светлые.
Рис. 16–6.
Американский астроном Дэвид Риттенхаус, построивший первый в США телескоп и прославившийся своими способностями к картированию и наблюдению звездного неба, в 1786 году отметил, что мы невольно интерпретируем как трехмерность также затенение, опираясь на два допущения (использование которых, как теперь известно, относится к числу врожденных свойств нашего мозга). Первое допущение таково: все, что мы видим, освещено лишь одним источником света. Второе – что свет падает сверху (рис. 16–7 ). Зрительная система исходит из этих допущений потому, что наш мозг сформировался в Солнечной системе, где наши предки обычно сталкивались только с одним источником света – Солнцем, светившим сверху. Мы воспринимаем округлости с более светлым верхом как выступы, а такие же округлости с более светлым низом – как углубления.
Рис. 16–7. Свет и тень могут служить надежными указаниями на трехмерность объекта. Даже без других признаков глубины мы можем сказать, что на рисунке изображен шар.
Когда мы смотрим на “форму для кексов” на рис. 16–8, то видим три ряда округлых выпуклостей, будто выступающих из страницы, светлых сверху и темных снизу (рис. 16–8 а). Из тех же допущений мы исходим, когда смотрим на изображение шара (рис. 16–7 ). Все эти объекты выглядят освещенными одним источником света, падающего сверху. Но если мы перевернем книгу, то вместо “кексов” увидим углубления. Мозг исходит из того, что свет падает на изображенные объекты сверху, и интерпретация меняется. Мы можем увидеть на рисунке углубления и не переворачивая книгу. Для этого нужно представить, что свет падает снизу. Трудность такой интерпретации связана с врожденным ожиданием того, что источник света сверху. Еще один пример представлен на рис. 16–8б. Три ряда округлых объектов освещены сбоку, причем в среднем ряду освещен левый край, а в верхнем и нижнем – правый. Может показаться, что в среднем ряду округлости выпуклые, а в двух других – вогнутые, или наоборот, но переключиться с одной интерпретации на другую нетрудно. Обратите внимание: когда вы представляете себе округлости среднего ряда выпуклыми, остальные кажутся вогнутыми, и наоборот. Мозг исходит из допущения, будто источник света всего один.
Рис. 16–8.