Меньше – лучше, иногда даже при совместной оценке

Кристофер Ши из Чикагского университета предложил испытуемым оценить наборы посуды, выставленные на распродажу в местном магазине, где они обычно стоят от 30 до 60 долларов. В этом эксперименте было три группы. Одной группе показали приведенную ниже таблицу – Ши назвал это совокупной оценкой, поскольку она позволяет сравнить два набора. Двум другим группам показывали только один набор, это назвали одиночной оценкой. Совокупная оценка – это межкатегориальный эксперимент, а одиночная – внутрикатегориальный.

Меньше – лучше, иногда даже при совместной оценке - student2.ru
При условии, что тарелки в обоих наборах одного качества, какой из них стоит больше? Это легкий вопрос. В наборе A есть все предметы из набора B и, вдобавок, семь целых предметов, то есть набор А должен стоить больше. Участники эксперимента по совокупной оценке в среднем были готовы заплатить за набор A чуть больше, чем за набор B, – 32 доллара против 30.
При одиночной оценке результат получился обратный: набор B оценили гораздо выше набора A – 33 доллара против 23. Мы знаем, почему так вышло. Множества (в том числе и набо ры посуды!) представляются нормами и прототипами. Вы сразу же чувствуете, что средняя цена предметов в наборе A гораздо меньше, чем в наборе B, потому что никто не хочет платить за посуду с дефектом. Если при оценке основную роль играет среднее значение, то неудивительно, что набор B стоит больше. Ши назвал такую реакцию «лучше меньше, да лучше». Когда набор A стал на 16 предметов (7 из которых в хорошем состоянии) меньше, его цена выросла.
Экспериментальный экономист Джон Лист повторил открытие Ши на реальном рынке бейсбольных карточек. Лист продавал с аукциона наборы по десять дорогих карточек и такие же наборы, но с добавлением трех карточек умеренной стоимости. Как и в эксперименте с посудой, при совокупной оценке бо́льшие наборы оценивались выше маленьких, а при одиночной – ниже. С точки зрения экономической теории результат вызывает тревогу: экономическая ценность набора посуды или бейсбольных карточек – суммоподобная переменная. Добавление в набор элем ента с положительной ценой может ее лишь увеличить.
У задачи про Линду и задачи про посуду одинаковая структура. Вероятность, как и экономическая ценность, – тоже суммоподобная переменная. Это видно на следующем примере:

вероятность (Линда – кассир) = вероятность (Линда – кассир-феминистка) + вероятность (Линда – кассир и не феминистка)

Именно поэтому, как и в эксперименте Ши с наборами посуды, одиночные оценки задачи про Линду дают результаты «лучше меньше». Система 1 оценивает среднее вместо суммы, а потому, когда из списка убирают кассиров-нефеминисток, субъективная вероятность возрастает. Однако суммоподобный характер переменной для вероятности менее очевиден, чем для денег. В результате совокупная оценка устраняет ошибку только в эксперименте Ши, но не в эксперименте с Линдой.
Ошибку конъюнкции, сохраняющуюся при совокупной оценке, вызывает не только задача про Линду. Сходные нарушения логики обнаруживаются и во многих других случаях. В одном из исследований участников попросили расположить четыре возможных исхода Уимблдонского турнира, от наименее до наиболее вероятного. На момент проведения эксперимента первой ракеткой мира был Бьорн Борг. Варианты ответов были такие:

A. Борг выиграет матч.
B. Борг проиграет первый сет.
C. Борг проиграет первый сет, но выиграет матч.
D. Борг выиграет первый сет, но проиграет матч.

Самые важные пункты здесь B и C. Событие B распространяется на более широкий круг явлений, и его вероятность выше, чем вероятность включенного в него события. Вопреки логике – но не репрезентативности или правдоподобию, – 72 % испытуемых оценили вероятность B ниже, чем вероятность C: еще один пример «лучше меньше» в прямом сравнении. Сценарий, который оценили как более вероятный, выглядел более правдоподобным, более когерентно вписывался в то, что было известно о лучшем теннисисте мира.
Предупреждая возможные возражения о том, что ошибка конъюнкции возникает из-за неверной интерпретации вероятности, мы составили задание, требующее оценки вероятностей, где события не описывались словами, а термин «вероятность» вообще не упоминался. По условиям эксперимента 20 раз бросали обычную шестигранную игральную кость, четыре грани которой выкрашены в зеленый цвет, а две – в красный. Испытуемым показали три последовательности выпадения зеленых (З) и красных (К) сторон и попросили выбрать одну из них. При выпадении выбранной последовательности участники (гипотетически) выигрывали 25 долларов. Последовательности были такие:

1. КЗККК
2. ЗКЗККК
3. ЗККККК

Поскольку зеленых граней вдвое больше, чем красных, первая последовательность довольно нерепрезентативна, вроде роли банковского кассира для Линды. Вторая последователь ность на шесть бросков больше подходит к нашим ожиданиям в отношении этой кости, поскольку содержит две «З». Эту последовательность построили простым добавлением буквы «З» к первой последовательности, так что она всего лишь менее вероятна, чем первая. Это – невербальный эквивалент Линды в роли кассира-феминистки. Как и в случае с Линдой, преимущество было за репрезентативностью. Почти две трети респондентов предпочли сделать ставку на последовательность номер 2, а не на номер 1. Однако, услышав аргументы в пользу этих вариантов, подавляющее большинство испытуемых решили, что верный ответ (последовательность 1) более убедителен.
При решении следующей задачи случился прорыв: мы, наконец, обнаружили условия, в которых количество ошибок конъюнкции значительно уменьшилось. Двум группам представили слегка разные варианты одной задачи:

Меньше – лучше, иногда даже при совместной оценке - student2.ru
Количество ошибок в группе, получившей задание слева, оказалось 65 %, а в груп пе, получившей задание справа, – всего 25 %.
Почему же на вопрос «Сколько из 100 участников…» легче ответить, чем на вопрос о процентах? Вероятное объяснение состоит в том, что упоминание ста человек вызывает в мыслях пространственное представление. Вообразите, что большое количество людей просят разбиться на группы внутри зала: «Те, у кого фамилии начинаются с букв от А до Л, собираются в левом ближнем углу». Затем их просят распределиться на меньшие группы. Отношение включения становится очевидным: те, у кого имя начинается на Д, окажутся подмножеством собравшихся в ближнем левом углу. В задании про медицинский опрос в углу зала собираются перенесшие сердечный приступ, и некоторые из них моложе 55 лет. Не у всех возникнут именно такие яркие образы, но последующие эксперименты показали, что такое представление, называемое частотным, облегчает осознание того факта, что одна группа включена в другую. Решение загадки, похоже, заключается в том, что вопрос «сколько?» заставляет думать об отдельных людях, а тот же вопрос в формулировке «какой процент?» – нет.
Что же выяснилось из этих экспериментов о работе Системы 2? Один из выводов состоит в том, что, как известно, Система 2 не особенно бдительна. Студенты университетов, участвовавшие в наших исследованиях ошибок конъюнкции, безусловно, «знали» логику диаграмм Венна, однако недостаточно надежно применяли ее, когда им представляли всю необходимую информацию. Абсурдность подхода «лучше меньше», очевидная в эксперименте Ши с посудой, легко распознается в представлении «сколько?», но неочевидна тысячам людей, допустившим ошибку конъюнкции в задаче про Линду и в других, сходных с ней заданиях. Во всех этих случаях конъюнкция выглядела правдоподобной, и для принятия ее Системой 2 этого оказывалось достаточно.
В этом частично играет роль леность Системы 2. Многие испытуемые избежали бы ошибки конъюнкции, если бы от правильности ответа зависел их следующий отпу ск, если бы им дали на решение неограниченное время, попросили бы соблюдать логику и не отвечать, пока они не будут совершенно уверены. Отпуск от правильности ответа не зависел, времени испытуемые потратили мало и отвечали так, будто их всего лишь «попросили высказать свое мнение». Леность Системы 2 – важная часть жизни, однако представляется интересным и наблюдение, что репрезентативность мешает применению очевидного логического правила.
Примечателен контраст задачи про Линду с задачей о посуде. У заданий одинаковая структура, но разные результаты. Люди, видящие набор посуды с дефектными предметами, оценивают его очень низко; их поведением управляет интуиция. Те, кто видит оба набора сразу, следуют правилу логики, увеличивая стоимость для большего количества предметов. В условиях внутрикатегориального эксперимента над оценками властвует интуиция; при совокупной оценке руководящая роль отведена логике. В задаче про Линду, напротив, интуиция преобладает над логикой даже при совокупной оценке, хотя мы и обнаружили условия, при которых логика побеждает.
По нашему с Амосом убеждению, явные нарушения логики вероятности, наблюдаемые в очевидных задачах, были интересны и стоили того, чтобы сообщить о них коллегам. Мы также считали, что результаты подкрепляют наши доводы в пользу эвристических методов оценки и смогут убедить сомневающихся. Здесь мы ошиблись: задача про Линду стала классическим примером при изучении разногласий.
Наше исследование привлекло большое внимание, но как магнит притягивало критиков нашего подхода к суждениям. Многие исследователи также обнаружили сочетания инструкций и подсказок, уменьшающих количество ошибок конъюнкции, а некоторые настаивали, что в контексте задачи про Линду испытуемые вправе воспринимать слово «вероятность» как «правдоподобие». Временами из этих аргументов делали общий вывод о том, что все наши идеи ложны: если можно ослабить или объяснить одну когнитивную иллюзию , то и для остальных это тоже возможно. Такие рассуждения упускают из вида уникальную особенность ошибки конъюнкции как конфликта между интуицией и логикой. Никто не оспаривал свидетельства в пользу эвристики, полученные во время межкатегориальных экспериментов (включая и исследования задачи про Линду), – их вообще не упоминали, а из-за пристального внимания к ошибке конъюнкции эвристические методы стали менее заметны. В итоге задача про Линду принесла нашим работам широкую известность, но среди коллег наш подход оказался дискредитирован. Мы ожидали совсем другого.
В судебных разбирательствах адвокаты применяют два типа критики: для опровержения иска под сомнение ставят аргументы в его поддержку, а для дискредитации свидетеля сосредоточиваются на самой слабой части показаний. На слабых сторонах часто концентрируются и в политических дебатах. По-моему, это неуместно в научных спорах, но мне пришлось смириться с тем, что нормы полемики в общественных науках не запре щают использование аргументации в политическом стиле, особенно если речь идет о важных проблемах, одной из которых мне представляется господство искажений в оценках и суждениях.
Несколько лет назад я сотрудничал с Ральфом Гертвигом, упорным критиком задачи про Линду. В тщетной попытке устранить наши разногласия я однажды спросил его, почему он сосредоточился исключительно на ошибке конъюнкции, а не на результатах, объяснявших наш подход. Он улыбнулся и ответил: «Так было интереснее», а затем добавил, что задача про Линду привлекла столько внимания, что нам не на что жаловаться.

Разговоры о ситуациях, где «лучше меньше»


«Составители запутанного сценария настаивают, что такое развитие событий весьма вероятно. Это не так, просто история правдоподобная».

«К дорогому продукту добавили дешевый подарок, и в итоге все стало менее привлекательно. В данном случае лучше меньше».
<
> «В большинстве ситуаций прямое сравнение делает людей осторожнее и логичнее, но не всегда. Временами интуиция побеждает логику, даже если правильный ответ перед вами».

Наши рекомендации