Распознавание естественных объектов и обработка по принципу «сверху вниз»
Мы кое-что узнали о распознавании букв и слов, а как насчет естественных объектов — животных, растений, людей, одежды и мебели?
Признаки естественных объектов. Форма естественных объектов состоит из более сложных признаков, чем линии и кривые, и скорее напоминает простые геометрические фигуры. Эти признаки таковы, что их комбинация позволяет создать форму любого узнаваемого объекта (так же как сочетанием линий и кривых можно получить любую букву). Кроме того, надо, чтобы признаки объектов были составлены из более простых признаков — линий и кривых, поскольку простые признаки — это единственная информация, изначально имеющаяся у перцептивной системы. Такие соображения направляли поиски возможного набора признаков предметной среды.
Одно из предположений заключалось в том, что в состав признаков объектов входят некоторые геометрические фигуры, например цилиндры, конусы, параллелепипеды и клиновидные фигуры, как показано на рис. 5.17а. Такие признаки называют геонами (неологизм от «геометрические ионы»); их разработал Бидерман (Biederman, 1987). Бидерман считает, что набора из 36 геонов, аналогичных показанным на рис. 5.17а, в сочетании с небольшим набором пространственных отношений будет достаточно для описания формы всех объектов, которые человек способен опознать. Чтобы оценить этот момент, заметьте, что всего из двух геонов можно составить 36x36 различных объектов (сформировать объект можно из любых двух геонов — см. рис. 5.17б), а из трех геонов — 36x36x36 объектов. Эти два числа дают в сумме уже около 30 000, а еще надо учесть возможные объекты из четырех и более геонов. Кроме того, геоны, показанные на рис. 5.17а, различаются только своими простейшими признаками. Например, геон 2 на рис. 5.17а, куб, отличается от геона 3, цилиндра, тем, что у куба прямые края, а у цилиндра — изогнутые; прямые и изогнутые линии являются простыми признаками.
Рис. 5.17. Возможный набор признаков (геонов) естественных объектов.а) Клин, куб, цилиндр и конус могут быть признаками сложных объектов. б) Из комбинации признаков (геонов) получаются естественные объекты. Заметьте, что если дугу (геон 5) присоединить к цилиндру (геон 3), получается чашка; если же дугу присоединить к верху цилиндра, получится ведро (по: Biederman, 1990).
То, что геоны являются признаками объектов, подтвердилось в экспериментах, в которых испытуемым предлагалось распознать нарисованные объекты, предъявляемые на короткое время. Общий результат был таков, что объект распознается настолько хорошо, насколько хорошо воспринимаются его геоны. В одном эксперименте стиралась часть формы объекта; в одном случае стирание мешало восстановлению геонов (правая колонка на рис. 5.18), в другом — не мешало (средняя колонка на рис. 5.18). Объекты распознавались намного лучше, когда стирание не интерферировало с геонами.
Рис. 5.18. Распознавание объектов и восстановление геонов.Элементы, использовавшиеся в эксперименте по распознаванию объектов. В левой колонке показаны исходные интактные варианты объектов. В средней колонке показаны варианты объектов, у которых некоторые участки стерты, но восстановить геоны все же можно. В правой колонке — варианты объектов, где участки стерты так, что геоны невосстановимы. Варианты объектов из средней колонки распознавались лучше, чем из правой (по: Biederman, 1987).
Обычно в описание объекта входят не только его признаки, но и отношения между ними. Это хорошо видно из рис. 5.17б. Если дуга присоединена сбоку цилиндра, получается чашка; если же она подсоединена сверху цилиндра, получается ведро. После того как описание формы объекта составлено, оно сравнивается с массивом геонных описаний, хранящихся в памяти, с тем чтобы найти наилучшее соответствие. Такое сопоставление описаний формы объектов с описаниями, хранящимися в памяти, похоже на ранее упоминавшийся процесс распознавания букв и слов (Hummel & Biederman, 1992).
Роль контекста.В восприятии есть принципиальное различие между процессами обработки, протекающими или снизу вверх, или сверху вниз. Процессы «снизу вверх» управляются только входными сигналами, а процессы «сверху вниз» — знаниями и ожиданиями человека. Для иллюстрации скажем, что когда на основе только геонного описания объекта последний узнается как лампа, то здесь участвуют только процессы «снизу вверх»; все начинается с появления на входе простых признаков этого объекта, далее определяется геонная конфигурация входных данных, и затем это описание входа сравнивается с хранящимися в памяти описаниями форм. Наоборот, если мы узнаем в некотором объекте лампу отчасти потому, что она находится на ночном столике рядом с кроватью, то в этом участвуют некоторые процессы «сверху вниз»; здесь привлекается не только та информация, которая поступила на сенсорный вход. Хотя до сих пор мы в этой главе обсуждали в основном процессы типа «снизу вверх», процессы «сверху вниз» также играют важную роль в восприятии.
Именно принцип обработки «сверху вниз» стоит за сильным влиянием контекста на наше восприятие предметов и людей. Если вы ожидаете, что ваша сотрудница Сара во вторник появится в химической лаборатории, как всегда, в 15:00, то когда она в указанный момент входит в лабораторию, вам даже не обязательно смотреть, чтобы знать, что это она. Ваше прежнее знание обусловило сильное ожидание, и для распознания достаточно очень слабого входного сигнала. Но если бы Сара вдруг появилась в вашем родном городе на рождественские каникулы, возможно, вам в первый момент даже было бы трудно ее узнать. Она оказалась бы вне контекста — нарушила бы ваши ожидания, и вам пришлось бы прибегнуть к обширной обработке «снизу вверх», чтобы сказать, что это на самом деле она (такие вещи обычно ощущаются как бы «со второй попытки»). Из этого примера ясно видно, что при соответствующем контексте (т. е. когда он предвосхищает объект на входе), восприятие облегчается; при несоответствующем контексте восприятие затрудняется.
Влияние контекста особенно примечательно, когда стимульный объект неоднозначен, т. е. когда он может восприниматься по-разному. Пример двойственного изображения показан на рис. 5.19; его можно воспринимать как старуху или как молодую женщину (хотя в первый момент с большей вероятностью видна старуха). Если вы уже смотрели на обычные картинки, напоминающие молодую женщину на рис. 5.19 (т. е. если контекст составляют молодые женщины), то на этой двойственной картинке вы скорее всего увидите вначале молодую женщину.
Рис. 5.19. Двойственный стимул.На этом неоднозначном рисунке можно видеть или молодую женщину, или старуху. Большинство видит сначала старуху. Молодая женщина отвернулась, и видна левая часть ее лица. Ее подбородок образует нос старухи, а цепочка у нее на шее — рот старухи (по: Boring, 1930).
Этот эффект временного контекста виден на другом наборе изображений на рис. 5.20. Смотрите на них, как при чтении рассказа в картинках — слева направо и сверху вниз. Картинки в середине этой последовательности неоднозначны. Если вы смотрели на эти изображения в предложенной последовательности, то скорее всего видели в них мужское лицо. Если вы посмотрите на них в обратном порядке, то в двойственных картинках скорее всего увидите молодую женщину.
Рис. 5.20. Эффект временного контекста.То, что вы здесь увидите, зависит от порядка рассматривания картинок. Картинки в середине ряда — двойственные. Если вы вначале смотрите на картинку с мужским лицом, они будут казаться вам искаженными мужскими лицами. Если вы вначале смотрите на картинку с женщиной, они будут походить на женщину (по: Fisher, 1967).
Чтобы показать влияние контекста, стимульный объект не обязательно должен быть двойственным. Представьте, что человеку сначала показывают изображение какой-либо сцены, а затем на короткое время предъявляют для распознавания изображение однозначного объекта; в этом случае распознавание будет более точным, если этот объект соответствует сцене. Например, посмотрев на сцену кухни, испытуемый более часто дает верную идентификацию быстро предъявленного изображения буханки хлеба, чем такого же по времени изображения почтового ящика (Palmer, 1975).
Благодаря обработке по принципу «сверху вниз» мотивы и желания потенциально могут влиять на восприятие. При сильном чувстве голода, быстро взглянув на красный шарик на кухонном столе, можно распознать в нем помидор. Желание есть заставляет думать о еде, и эти ожидания комбинируются с входной информацией (красный круглый предмет), создавая в результате перцепт помидора. Возможно и отрицательное влияние мотивов на восприятие. Если мы считаем, например, что некто — соблазнитель детей, мы более вероятно расценим его невинное прикосновение к ребенку как сексуальное.
Влияние контекста и обработка по принципу «сверху вниз» имеют место и в распознавании букв и слов, играя важную роль при чтении. Читая, мы не отслеживаем строчку текста плавным непрерывным движением. На самом деле глаза совсем недолго задерживаются на месте, а затем перепрыгивают в другую позицию на строчке, снова ненадолго останавливаются, затем снова прыгают и т. д. Периоды, в течение которых глаза остаются в покое, называются фиксациями, и именно во время фиксаций зрительная система извлекает информацию. На количество и длительность фиксаций очень сильно влияет то, что известно о данном тексте, и, следовательно, объем привлекаемой обработки «сверху вниз». Если материал незнакомый — скажем, незнакомый научный текст, — объем обработки «сверху вниз» минимален. В таких случаях мы останавливаемся на каждом слове, за исключением некоторых функциональных слов вроде «и», «о», «тот» и т. п. По мере ознакомления с материалом становится возможным привлекать полученное знание для обработки по принципу «сверху вниз», и тогда зрительные фиксации становятся реже и короче (Just & Carpenter, 1980; Rayner, 1978).
Процессы типа «сверху вниз» и недостаточность входного сигнала. Обработка по принципу «сверху вниз» происходит даже при отсутствии контекста, если входной сигнал очень скудный или ослаблен. Предположим, что, находясь у подружки в квартире, вы в темноте заходите на кухню и видите в углу небольшой черный предмет. Вы думаете, что это, наверное, ее кот, но воспринимаемый сигнал слишком слаб, чтобы быть уверенным, и тогда вы начинаете представлять какой-нибудь конкретный признак кота— скажем, его хвост — и затем избирательно направляете внимание на тот участок предмета, где этот признак может скорее всего быть, если это действительно кот (Kosslyn & Koenig, 1992). Это — процесс обработки по принципу «сверху вниз», поскольку вы использовали определенное конкретное знание (что у кота есть хвост), чтобы сгенерировать ожидание, которое затем комбинируется со зрительным входным сигналом. Подобные ситуации довольно обычны для повседневной жизни. Иногда, если входной сигнал очень слабый, формируемые ожидания могут оказаться несостоятельными, скажем, когда вы наконец разберетесь, что этот якобы кот на кухне — на самом деле сумочка вашей подружки.