Природа эвристик

Мы видели, что успех лица, решающего задачу, которое стал­кивается со сложной проблемой, основан прежде всего на его спо­собности правильно выбирать для обследования небольшую часть общего проблемного лабиринта. Процессы, которые осуществляют этот выбор, мы обозначаем как эвристики. Мы видели, что боль­шинство эвристик основано на стратегии, при которой последую­щий поиск изменяется как функция информации, полученной в предыдущем поиске; и мы рассмотрели несколько наиболее зна­чительных и эффективных типов эвристик, с которыми мы столк­нулись в своих попытках имитировать процессы решения задачи человеком. Мы придали операциональный смысл соответствую­щим терминам путем выделения реальных процессов, которые осу­ществлял бы «логик-теоретик» или машина, играющая в шахма­ты. Мы обращались к протоколам испытуемых для подтверждения положения о том, что эти процессы действительно имеют место в поведении человека при решении задачи. Мы разработали также количественные приемы оценки сокращения поисковых действий, вызванных избирательностью этих эвристик, и использовали эти оценки для определения способности людей и машин, имитирую­щих их, путем использования тех же самых процессов решать кон­кретные задачи.

П. Линдсей, АНАЛИЗ ПРОЦЕССА

Д. Норман РЕШЕНИЯ ЗАДАЧ

Норман (Norman) Дональд (род. 25 декабря 1935) — американский психолог, один из крупных совре­менных исследователей в области изучения познавательных процессов. Профессор Калифорнийского универ­ситета. Автор книги «Память и вни­мание» («Memory and Attention». N. Y., 1969), редактор и участник фундаментальной коллективной мо­нографии «Модели человеческой па­мяти» («Models of Human Memory». N. Y.—L., 1970). Вместе с Питером Линдсеем (Lindsay) (университет Торонто, Канада) Д. Норман является также автором учебника по психологии, в котором последова­тельно проводится теоретико-ин­формационный подход к анализу по­знавательных процессов («Human Information Processing». N. Y.—L., 1972). В отрывке из этой книги (пе­чатается по русскому переводу — М., 1974) рассматриваются некото­рые приемы изучения и описания процесса решения задач, характер­ные для направления «эвристическо­го программирования» на современ­ном этапе.

Что именно следует сделать, чтобы решить некоторую задачу? Мы рассмотрим стратегии и процедуры, обычно используемые людьми. Прежде всего задачи бывают двух основных типов: чет­ко поставленные и нечетко поставленные. В четко поставленной задаче цель ясно сформулирована. Вот примеры таких задач:

1) как наилучшим образом проехать в другой конец города, если все главные улицы закрыты для транспорта по случаю парада;

2) как решить шахматную задачу, помещенную во вчерашней газете: белые начинают и делают мат в пять ходов.

В этих задачах, помимо ясной цели, имеется определенный способ судить о том, идет ли процесс решения в надлежащем на­правлении. И хотя в жизни, пожалуй, чаще встречаются задачи, поставленные нечетко, у нас есть все основания сосредоточить на­ше исследование на четко поставленных задачах. Наша цель — выяснить, какие процессы использует человек, добивающийся решения той или иной задачи. Мы хотим понять, как он строит внутреннюю модель задачи, какую стратегию избирает, каким правилам следует. Мы хотим узнать, какие средства позволяют ему успешно продвигаться к решению. Результаты этих исследований должны быть приложимы к решению любых задач, поставлены ли они четко или нечетко.

Лучше всего, вероятно, начать с исследования конкретной задачи.

природа эвристик - student2.ru

Данная задача относится к классу криптоарифметических за­дач. В приведенном выражении использовано десять букв, каждая из которых соответствует определенной цифре. Задача состо­ит в том, чтобы найти для каждой буквы соответствующую ей цифру, так чтобы получившиеся цифры удовлетворяли сформулированному арифметическому равенству.

Мы разберем небольшую часть словесного отчета одного испытуемого, пытавшегося решить эту задачу. Дав пояснения к за­даче, сходные с приведенными выше, его просили думать вслух в процессе поиска решения. Испытуемый впервые пытался решить такого рода задачу. Полная запись его высказываний в течение 20 мин, затраченных на решение, составляет протокол объемом около 2200 слов (задача, ее анализ и приводимые ниже цитаты из протокола заимствованы из работы Ньюэлла, 1967).

Протокол решения задачи «DONALD+ GERALD»

Каждая буква имеет одно и только одно числовое значение? (Это был вопрос к экспериментатору, который ответил: «Одно числовое значение»). Имеется десять различных букв, и каждая из них имеет одно числовое значение.

Букв две, и каждая из них соответствует 5; значит, Т есть нуль. Так что, я думаю, можно для начала вписать это в текст задачи. Я вписываю: 5,

5 и 0.

Посмотрим, есть ли у нас еще Т. Нет. Зато есть еще одно D. Значит, я могу поставить 5 с другого края.

Дальше, у нас есть два А и два L — каждая пара в одном разряде и еще три R. Два L равны одному Р. Разумеется, я перенес 1 во второй разряд, откуда следует, что Р должно быть нечетным числом, поскольку сложение двух одинаковых чисел дает четное число, а 1 — число нечетное. Так что Р может быть равно 1 или 3, но не .5, не 7 и не 9.

(Здесь наступила долгая пауза, и экспериментатор спросил: «О чем вы сей­час думаете?»).

Теперь G. Раз R — нечетное число, a D равно 5, то О должно быть чет­ным. Я смотрю на левый край примера, где складывается D с G. Ах, нет, возможно, сюда надо прибавить еще 1, если мне пришлось бы перенести 1 из предыдущего разряда, где складываются О и Е. Пожалуй, мне нужно на минуту отвлечься от этого.

Вероятно, лучше всего решать эту задачу, перебирая различные возмож­ные решения. Но я не уверен, что это окажется самым легким путем.

Цитированный текст будет служить нам первичным материа­лом для анализа процесса решения. Первое впечатление от такого протокола — что испытуемый не подходит к задаче прямо и не­посредственно. Он накапливает информацию и проверяет различ­ные гипотезы, выясняя, к чему они приводят. Он часто заходит в тупик и, отступая, пробует другой путь. Взгляните на протокол. Испытуемый начинает энергично и сразу обнаруживает, что Т равно нулю.

Букв D две, и каждая из них соответствует 5; значит, Т есть нуль. Так что, я думаю, можно для начала вписать это в текст задачи. Я вписываю: 5, 5 и 0.

После этого он выясняет, можно ли использовать где-нибудь в тексте задачи свое знание, что Т равно нулю, a D равно 5. Ищет Т.

Посмотрим, есть ли у нас еще Т. Нет. Эта попытка не удалась. Ну, а как D? Зато есть еще одно D. Значит, я могу поставить 5 с другой стороны.

Отметив это обстоятельство, испытуемый обнаруживает другое место в тексте задачи, которое кажется перспективным.

Дальше, у нас есть два А и два L — каждая пара в одном разряде — и еще три R. Два L равны одному R. Разумеется, я перенес 1 во второй раз­ряд. Откуда следует, что R должно быть нечетным числом.

Хотя испытуемый уже пришел к заключению, что R — нечет­ное число, он вновь возвращается к этому вопросу, как бы прове­ряя свой вывод:

...поскольку сложение двух одинаковых чисел дает четное число, а 1 — число нечетное.

На этот раз он продолжает рассуждение несколько дальше и конкретно, перечисляет возможные числа.

Так что R может быть равно 1 или 3, но не 5, не 7 и не 9.

После долгой паузы испытуемый, однако, отказывается от это­го пути по понятной причине: нет очевидного способа выбрать зна­чение R из возможных вариантов. Он опять возвращается к идее о нечетности R. Дает ли это какую-нибудь информацию относи­тельно G?

Теперь G. Раз R — нечетное число, a D равно .5, G должно быть четным.

Этого краткого анализа отчета о первых пяти минутах экспе­римента достаточно для того, чтобы обнаружить некоторые об­щие закономерности в поведении испытуемого при решении за­дачи. Однако словесными протоколами пользоваться неудобно. Для подробного исследования процесса решения задачи нужно иметь какой-то метод представления происходящих событий. По­лезно строить визуальные изображения последовательности опе­раций, совершаемых во время решения задачи. Одним из методов, пригодных для этой цели, является граф решения задачи, разра­ботанный А. Ньюэллом (Саймон и Ньюэлл, 1971).

Исследуя протокол, мы видели, что испытуемый постепенно накапливает информацию о задаче, применяя определенные пра­вила или стратегии. Он производит разного рода операции над этой информацией и над текстом задачи; в результате его

Знания возрастают. Вся информация о задаче, которой испытуемый рас­полагает в данный момент, называется его состоянием осведом­ленности. Всякий раз, как он применяет некоторую операцию к не­которому новому факту, состояние осведомленности изменяется.

природа эвристик - student2.ru

Описание поведения человека при решении задачи должно, таким образом, отражать это по­следовательное продвижение от одного состояния осведомленно­сти к другому. Будем изобра­жать графически состояние осве­домленности прямоугольником, а операцию, переводящую испытуе­мого из одного состояния осве­домленности в другое, — в виде стрелки (рис. 23).

Теперь протокол можно пред­ставить в виде прямоугольников, соединенных стрелками: послед­ние показывают путь, проходимый испытуемым через последова­тельные состояния осведомленности.

Граф задачи «Donald+Gerald». Несколько высказываний в начале словесного отчета отражают просто проверку испытуемым своего понимания условий задачи. Само рассуждение начинается лишь с фразы:

Букв D две и каждая из них соответствует 5; значит, Т есть нуль.

Испытуемый, несомненно, перерабатывает информацию, содержащуюся в этом разряде, где показано, что D+D=T. Назовем эту операцию обработкой 1-го разряда. Эта операция пере­водит испытуемого из начального состояния осведомленности (в котором он знает, что D=5) в новое состояние, в котором он знает, кроме того, что Т=0. Известно ли испытуемому также, что необходимо сделать перенос в следующий, 2-й разряд? За­бегая вперед, читаем: «Разумеется, я перенес 1». Таким образом, это испытуемому известно. К настоящему моменту наш граф решения задачи насчитывает два состояния осведомленности. (рис. 24)

Следующие несколько фраз протокола, по существу, резюмируют сведения, известные испытуемому к данному моменту. Затем делается попытка найти другие разряды, содержащие Т или D. Первое применение операции взять новый разряд (с Т) безуспешно; второе дает положительный результат: находится другой разряд, содержащий D. Граф решения задачи получил некоторое приращение (рис. 25), на этом рисунке прямоуголь­ник, которого не было на предыдущей схеме, обведен жирной линией.

Теперь испытуемый решает еще раз взять новый разряд, пробуя сначала 3-й разряд, а затем 2-й.

Дальше, у нас есть два А и два L — каждая пара в одном разряде — и еще три R.

природа эвристик - student2.ru

Это приводит его к тому пункту рассуждения, в котором имеет смысл обработать 2-й разряд. В результате обработки он

Обратный ход. Теперь испытуемый возвращается к пройден­ному состоянию. Обратите внимание на последовательность Дей­ствий. Сначала, в состоянии 5, он говорит:

Два L равны одному R. Разумеется, я перенес 1 во второй разряд, откуда следует, что R должно быть нечетным числом.

Но затем испытуемый решает конкретно выяснить возмож­ные числовые значения буквы R: для этого он возвращается в состояние 4 и испытывает новый подход.

...поскольку сложение двух одинаковых чисел дает четное число, а 1 — число нечетное. Так что R может быть равно 1 или 3, но не 5, не 7 и не 9.

На графе этот обратный ход отображается таким образом, что стрелка к следующему, 6-му состоянию идет из состояния 4 (рис. 27). Состояние 6 — это, собственно, то же состояние 4, только в более поздний момент времени. В состоянии 7 испытуемый вновь воспроизвел тот факт, что R нечетно, а в состоянии 8 он методически перечисляет все подходящие и неподходящие нечетные числа.

Последующая часть текста протокола дает пример того, ка­кие трудности испытывает экспериментатор, «добывая» протокол. Испытуемый молчит, так что экспериментатор вынужден вмешаться и просить его говорить. В результате мы не имеем явных свидетельств того, как использованы возможные числовые зна­чения R. Вместо этого мы видим, что процесс решения снова идет вспять; на этот раз испытуемый обращается к 6-му разря­ду и исходя из того, что R — число нечетное, a D равно 5, заключает, что G должно быть четным числом, это приводит нас к состоянию 10.

природа эвристик - student2.ru

Теперь G. Раз R — нечетное число, a D равно 5, то G должно быть чет­ным.

Хотя этот вывод неверен, тем не менее в момент, представ­ляемый состоянием 10, он отвечает действительному состоянию осведомленности испытуемого (рис. 28). В данном случае воз­можность того, что G не обязательно четно, приходит ему в го­лову довольно скоро.

Я смотрю на левый край примера, где складывается D с О.

Ах, нет, воз­можно, сюда надо прибавить еще 1, если мне пришлось бы перенести 1 из пре­дыдущего разряда, где складываются О и Е. Пожалуй, мне нужно на минуту отвлечься от этого.

Последняя фраза указывает, что испытуемый вновь хочет приступить к обработке 6-го разряда и в результате оказывается в состоянии 12 (признает возможность переноса), а затем ре­шает еще раз вернуться назад, отказавшись от полученной ра­нее численной оценки для G (четное число). На этом мы закан­чиваем анализ фрагмента протокола. Соответствующий фрагмент графа решения показан, на рис. 28.

Рассмотрим теперь, чем отличаются друг от друга три( раз­личных «пространства» задачи: внутреннее, отраженное в прото­коле и внешнее. Испытуемый решает задачу про себя в соответ­ствии с некоторыми общими стратегиями и посредством опера­ций, которые, будем надеяться сходны со стратегиями и операциями, представленными в графе решения задачи. Это ре­шение представлено во внутреннем пространстве, прямое наблю­дение которого для нас невозможно. Словесные высказывания, делаемые испытуемым в ходе решения задачи, — протокол — это запись в протокольном пространстве. И, кроме того, продвигаясь к решению, испытуемый записывает те или иные выражения и выполняет некоторые действия, порождая тем самым внешнее пространство.

природа эвристик - student2.ru

Посмотрим, как можно соотнести эти три пространства друг с другом. Внутреннее пространство можно представить схемати­чески в виде графа решения задачи. На рис. 29 показан пример внутреннего пространства, в котором представлено 22 состояния. Но испытуемый может объявить в своем протоколе лишь некото­рые из этих внутренних состояний — они показаны заштрихо­ванными прямоугольниками. В данном случае в протоколе пред­ставлено 13 из 22 состояний внутреннего пространства.

Понятно, что произошло. В протокольном пространстве дело обстоит так, как если бы от состояния 1 испытуемый перешел непосредственно к состоянию 5 и 6. Промежуточные состояния 3 и 4, а также тупиковая линия к состоянию 3 выпали совершен­но. И вдобавок состояние 10 и состояние 13 следуют за состоя­нием 7. Часто при анализе протокола может быть обнаружена

нехватка каких-то звеньев. Окончательный граф, реконструиро­ванный на основании протокола, действительно имеет много об­щего с графом внутренних состояний, однако он определенно не является полным отображением процессов, происходивших в хо­де решения задачи. Проходя че­рез последовательность внутренних состояний, испытуемый порождает на уровне поведения сокращенную версию внутренних процессов мышления.

природа эвристик - student2.ru

Граф решения — один из методов разложения процесса решения этой задачи на этапы, выделения в процессе его отдельных шагов. В нем графически представлено чередование успехов и неудач, харак­терных для хода решения всякой задачи. Эта общая форма анализа и изображения поведения представ­ляется применимой к широкому раз­нообразию проблемных ситуаций. Понятно, что конкретные правила, используемые человеком, зависят от характера решаемой задачи, однако общая структура его по­ведения в ходе решения задачи всегда одинакова. Человек разбивает задачу на множество более простых промежуточных задач, т. е. ставит перед собой промежуточные вопросы. В любой заданный момент достигнутый им успех можно охарактеризовать с помощью понятия осведомленности. Человек переходит от од­ного состояния осведомленности к другому через попытки приме­нения одной из операций, выбираемых из имеющегося у него небольшого выбора. Анализируя сам подход к решению задачи, можно выделить две различные стратегии.

В большинстве случаев решение задачи включает момент прямого поиска. Другими словами, человек сначала испытывает какой-то метод подхода к задаче, а затем смотрит, продвинулся ли он вперед в результате его применения. Если да, то он про­должает идти в том же направлении от достигнутого пункта. Здесь важно то, что поиск от начала до конца осуществляется простыми, прямыми шагами.

Второй подход представлен обратным поиском. Здесь человек рассматривает искомое решение, задаваясь вопросом: какой предварительный шаг необходим для того, чтобы прийти к нему? После определения этого шага определяется шаг, непосредствен­но ему предшествующий, и т. д., в лучшем случае — вплоть до отправной точки, заданной в постановке исходной задачи. Обрат­ный поиск чрезвычайно полезен в некоторых визуальных задачах, вроде нахождения по карте пути из одного пункта в другой.

При обратном поиске продвижение к цели осуществляется небольшими шагами. Определяется некоторая промежуточная цель и делается попытка решить промежуточную задачу. Здесь вступает в действие одна, вероятно наиболее сильная стратегия, так называемая стратегия сопоставления средств и целей. При этом сопоставлении цель (ближайшая промежуточная цель) сравнивается с наличным состоянием осведомленности. Пробле­ма состоит в нахождении оператора — средства, уменьшающего разрыв между этими двумя вещами.

В учении о решении задач рассматриваются два типа планов (или операторов): алгоритмы и эвристические приемы. Они отли­чаются друг от друга наличием или отсутствием гарантии получения правильного результата. Алгоритм — это совокупность правил, которая если ей следовать автоматически порождает верное решение. Правила умножения представляют собой алго­ритм; пользуясь ими надлежащим образом, мы всегда получим правильный ответ. Эвристические приёмы больше напоминают эмпирические правила: это процедуры или описания которыми относительно легко пользоваться и ценность которых оправдывается предшествующим опытом решения задач. 0днако в отли­чие от алгоритмов эвристические приёмы не гарантируют успеха. Для многих из числа наиболее сложных и наиболее интерес­ных задач, алгоритмы решения не найдены, а в некоторых случаях даже известно, что они не существуют.

В таких случаях приходится прибегать к эвристическим приемам.

Эвристика вступает в действие во всякой сложной ситуации, связанной с решением задач. Большинство исследований, посвященных решению задач, в значительной мере сводится к изуче­нию типов эвристических приемов, применяемых человеком.

Особенности рассмотренных стратегий решения задачи коре­нятся в общем характере процессов, протекающих в мозгу чело­века, и в их организации. Более того, эти общие организацион­ные принципы, несомненно применимы к любым системам, кото­рые хранят, отыскивают и используют информацию, будь то си­стемы электронные или биологические. Ввиду этой общности при всякой попытке найти принципы устройства человеческого мозга целесообразно рассмотреть принципы организации самых разнообразных информационных систем. Подчеркиваем, речь идет именно о принципах, детали выполнения различных функций и механизмы их осуществления нас здесь не интересуют. Если мы умеем определить, что данная система использует эвристический прием сопоставления целей и средств, то не имеет зна­чения, построена ли система из нейронов, интегральных схем или из рычагов и шестеренок, — эвристика во всех случаях одна.

О. К. Тихомиров ИНФОРМАЦИОННАЯ И

Наши рекомендации