Предсказания, основанные на множественных наблюдениях

Итак, в чем же состоят преимущества агрегирования? Предположим, что мы классифицировали детей на основании не одного, а 50, 100 или даже бесконечно большого числа наблюдений. Можно с уверенностью сказать, что мы были бы в состоянии очень точно предсказать средний уровень застенчивости, агрессивности и подобных им личностных характеристик, которые каждый ребенок обнаруживал бы в ходе множества дальнейших наблюдений. В самом деле, нам удалось бы точно спрогнозировать распределение реакций каждого ребенка в целом, т.е. мы смогли бы с уверенностью предсказать, что распределение реакций каждого ребенка в будущем будет близко напоминать распределение его же реакций в прошлом. Однако при этом нам не удалось бы существенно снизить нашу неопределенность в отношении поведения конкретного ребенка в конкретной единичной ситуации.

В частности, если бы нам был известен усредненный, или «истинный», показатель агрессивности того или иного ребенка, вычисленный на основании данных, полученных за продолжительный период, исходя из которого мы бы строили свои прогнозы в отношении данного индивида, то это позволило бы нам сократить среднюю разницу между нашими предсказаниями и данными реальных последующих наблюдений приблизительно лишь на 8%, т.е. наша средняя ошибка будет в этом случае на 8% меньше, чем если бы мы просто предположили, что поведение каждого ребенка в каждой ситуации будет соответствовать среднему показателю для всего класса.

Чтобы понять, почему ошибка уменьшится на столь скромную величину, необходимо вспомнить, что поведение детей на протяжении достаточно длительного периода будет очень изменчивым и индивидуальные средние показатели детей будут фактически близки к средним показателям для выборки в целом. (Чтобы этого не произошло, имеющаяся у нас кросс-ситуативная корреляция должна быть выше 0,16.) Соответственно этому наилучшие догадки, которые мы можем построить относительно реакций отдельных детей, все равно будут близки к среднему для выборки значению. Но поскольку действительное распределение реакций каждого ребенка в различных ситуациях весьма вариативно, даже эти наши лучшие из возможных предположений будут часто далекими от реальности.

Рис. 4.3. Распределение индивидуальных реакций для 21 испытуемого, каждый из которых имеет отличный от других процентный ранг в пределах выборки. Индивидуальные средние показатели отмечены полыми кружочками. Показатели, отстоящие от средних показателей для каждого испытуемого на величину в одно или два стандартных отклонения (как вверх, так и вниз), отмечены закрашенными кружочками. Особо выделены распределения для индивидов, имеющих соответственно процентные ранги «2», «15», «50», «85» и «98», причем каждый пятый процентный ранг в этих распределениях отмечен поперечной черточкой.

На рис. 4.3 показаны распределения реакций отдельных детей, имеющих в данной выборке различные процентные ранги. Здесь мы опять уделяем особое внимание пятерым детям из нашего гипотетического исследования, чьи средние оценки имеют в пределах выборки соответственно следующие процентные ранги: «2», «15», «50», «85» и «98». Уже после беглого взгляда на рисунок становится ясно, что даже самые «экстремальные» дети демонстрируют явно среднее поведение гораздо чаще, чем экстремальное, и даже наиболее «средние» дети проявляют иногда поведение, близкое к экстремальному. Короче говоря, когда соответствующие корреляции, измеряющие кросс-ситуативную согласованность поведения, составляют 0,16, подавляющее большинство детей демонстрируют весьма сходные и заурядные распределения реакций — распределения, после ознакомления с которыми к этим детям уже нельзя без колебаний применять такие эпитеты, как «застенчивый», «агрессивный» или даже «средний», не делая при этом оговорок относительно вариативности поведения.

Можно с уверенностью сказать, что порядок ранжирования средних показателей детей, которые они имели в прошлом, сохранится и в дальнейшем при условии, что число наблюдений за их поведением, сделанных в прошлом, равно как и число наблюдений, планируемых в будущем, будет достаточно велико, и, конечно, при условии, что личностные диспозиции детей за это время не изменятся. Таким образом, как и утверждал Эпштейн, корреляция между высоко агрегированными данными будет высокой. Но проблема состоит в том, что разница между средними показателями поведения детей в новых ситуациях, равно как и разница между их средними показателями в предшествующих ситуациях, будет сравнительно невелика, а наблюдаемая внутрииндивидуальная вариация вокруг этих средних показателей будет продолжать оставаться сравнительно большой. Закон больших чисел — мощнейший принцип, однако и он не в состоянии выжать воду из камня, т.е. в нашем случае — внести определенность в агрегированную совокупность, поведением каждого элемента которой руководит изменчивость.



Наши рекомендации