Шкалограммный анализ Гуттмана. Решение проблемы существования латентной переменной и выбора системы информативных признаков.
Известный американский психолог Л.Гуттман предложил свой способ адаптации тестовой традиции к потребностям социологии. В принципе идея была той же — опереться на проверку того, что наблюдаемые признаки представляют собой плотную "связку" в смысле корреляции друг с другом, и предложить такой способ измерения латентной переменной, чтобы при фиксации ее значения эти корреляции исчезали.
Наблюдаемые признаки — дихотомические. Предполагается, что выполнение условий, требующихся для реализации тестовой традиции, будет обеспечено, если удастся доказать возможность определенным образом их упорядочить. А именно: будем говорить, что признаки упорядочены, если, скажем, относительно человека, положительно реагирующего на третий признак, можно быть почти уверенным, что он положительно реагировал и на четвертый, пятый и т.д. признаки.
Подобные шкалы называются кумулятивными. Они использовались и до Гуттмана. Так, кумулятивна известная шкала социальной дистанции Богардуса, содержащая семь признаков, отражающих различные степени социальной дистанции. Эти признаки могут быть следующим образом упорядочены (речь идет об отношении респондента к человеку или социальной группе, дистанция до которой вычисляется): допущение человека в качестве родственника посредством брака, как личного друга, в качестве соседа, допущение равной работы, гражданства, допущение в страну только в качестве туриста. Кумулятивность шкалы представляется очевидной: относительно респондента, согласного принять кого-то в качестве соседа, можно почти наверняка сказать, что он согласится с тем, чтобы тот же человек имел одинаковые с ним работу, гражданство, или мог приехать в страну как турист.
Значение латентной переменной рассчитывается как сумма положительных ответов, данных респондентом на рассматриваемые вопросы. Нетрудно показать, что если рассматриваемые дихотомические признаки удалось упорядочить, то соответствующая матрица данных приведется к так называемому диагональному виду (табл. Как рисовали на лекции, плюсы и минусы виде лесенки, по вертикали – респ, по горизонтали – суждения).
Плюсами помечены положительные ответы респондентов на соответствующие вопросы анкеты (их согласие с соответствующими суждениями), минусами — отрицательные.
Нетрудно проверить, что согласие респондента, скажем, с 4-м суждением означает его согласие с 5-м, 6-м и т.д. А это и означает, что наши признаки упорядочены.
Но поскольку количество респондентов, как правило, будет больше числа суждений, то многие респонденты будут давать одинаковые наборы ответов, и матрица приобретет ступенчато-диагональный вид (табл. 7.3).
Нетрудно показать, что для таких переменных будут выполнены все требующиеся посылки: они будут связаны друг с другом и фиксация значения латентной переменной приведет к распаду этих связей.
Действительно, пусть р. и р. — вероятности положительных ответов на /-й и у'-й вопросы соответственно, р.. — вероятность положительного ответа на /-й и у'-й вопросы одновременно (напомним, что в выборочном исследовании вероятность какого-либо события отождествляется с относительной частотой его встречаемости).
Итак, наша работа начинается с того (имеется в виду этап работы после предварительного формирования анкеты), что мы проводим пробное исследование, собираем данные и переставляем столбцы и строки полученной матрицы до тех пор, пока она либо приобретет диагональный вид, либо мы убедимся в том, что это сделать невозможно. В первом случае мы полагаем, что одномерная латентная переменная существует, признаки и способ выражения через них латентной переменной выбраны удачно, и переходим к основному исследованию. Во втором — вообще говоря, отказываемся от построения одномерной шкалы. Однако в отдельных случаях исправить положение можно с помощью некоторой корректировки данных. Скажем, может оказаться, что привести матрицу к диагональному виду нам мешает какой-то ее столбец. Тогда выбросим из рассмотрения соответствующее суждение: оно не укладывается в наше упорядочение (может быть, не так понимается респондентами, как мы рассчитывали, и т.д.). Затем перейдем к основному исследованию. В приведенном выше примере таким суждением можно считать шестое (правда, убрав его, мы уменьшим долю "неправильных" клеток не до 10%, а только до 12% (стало быть, R будет равно 0,88).
Может оказаться и так, что нам "мешает" строка матрицы, т.е. какой-то респондент. Можно отбросить и его и двигаться дальше. Но здесь надо быть осторожными, о чем мы уже говорили.