Индексы при сборе и анализе данных
Логический квадрат
Задаем респонденту, студенту социологического факультета одного из названных вузов, два взаимодополняющих друг друга вопроса:
1. Представьте себе, что у вас есть возможность перейти на другой социологический факультет. Перешли бы вы?
— да, перешел бы
— нет, не перешел бы
— затрудняюсь ответить (з/о)
2. Представьте себе, что вы нигде не учитесь. Пришли бы вы или нет учиться на ваш факультет?
— да, пришел бы
— нет, не пришел бы
— з/о
Проанализируем все возможные сочетания вариантов ответа на эти два вопроса. Таких сочетаний 9, т. е. после сбора информации мы можем столкнуться с девятью ситуациями. Каждая из них требует интерпретации до проведения пилотажа. Как вы знаете, пилотаж — это небольшое по объему пробное исследование для апробации инструментария. На рис. 2.2.1 изображен логический квадрат, в котором каждая возможная ситуация отмечена буквами а, b, с, d, e, f.
«Пришел бы...» | «Перешел бы...» | ||
Нет | З/о | Да | |
Да | а | b | f |
З/о | b | с | d |
Нет | f | d | е |
Рис. 2.2.1 Логический квадрат
Максимальная удовлетворенность будет наблюдаться в ситуации а, минимальная — в ситуации е, средняя — в ситуациис. Вы обратили внимание на то, что некоторые ситуации обозначены одинаковыми буквами. Буквой fобозначены две ситуации, которые практически не могут встретиться в данных, ибо содержат в себе противоречие. Две ситуации, обозначенные b, в определенной мере идентичны. Степень удовлетворенности для этих случаев меньше, чем максимальная, и больше, чем средняя. Например, студент Михаил не хочет никуда переходить, а по поводу поступления на факультет вновь не имеет определенного мнения (з/о), а студент Сергей готов вновь поступить на факультет, но по поводу перехода затрудняется ответить. В определенной мере можно считать, что сила мотивации у них одинакова. При этом она не так сильна, как в ситуации а, но сильнее, чем в ситуации с. И наконец, две одинаковые ситуации, обозначенные буквой d. Им соответствует степень удовлетворенности меньшая, чем средняя, и большая, чем минимальная. Рассуждения аналогичны предыдущим.
Логический квадрат называется логическим в силу того, что исследователь проводит только логические операции, а квадратом — потому что такова его форма существования. На входе мы имеем трехчленную шкалу, а на выходе шкалу порядков с пятью градациями. Можем закодировать или присвоить шкальные значения ситуациям так, чтобы выполнялось условие:
a>b>c>d>e
Например, а=5, b=4, с=3, d=2, e=l.
С помощью логического квадрата мы определяем удовлетворенность учебой только отдельно взятого студента. Для решения поставленной выше задачи, а именно сравнения степени удовлетворенности учебой студентов-социологов различных вузов Москвы, необходимо решить еще одну задачу: измерения искомой удовлетворенности для группы студентов отдельно взятого вуза. Ее можно решить посредством формирования уже групповых индексов. К этой задаче мы вернемся после рассмотрения еще одного логического индекса. Его условно можно обозначить как логический прямоугольник.
Логический прямоугольник
Термины квадрат, прямоугольник (может быть, и куб) при построении логических индексов можно вообще не употреблять.
Представим себе, что мы изучаем рейтинг преподавателей, читающих спецкурсы на социологическом факультете. При этом опираемся на мнения студентов. Для достижения этой цели, естественно, необходима процедура или модель оценки качества «курса лекций». Здесь возможно построение нескольких моделей. Я думаю, что у вас не вызовут возражения следующие рассуждения. Для оценки качества лекций мы хотим использовать три понятия, а именно:
— содержательность (наличие нового знания);
— интересность (в смысле стиля, ораторские способности);
— понятность (доходчивость материала).
Эти три компонента, три фактора определяют качество любого «курса». Не исключаем и того, что могут быть предложены и другие варианты такого рода факторов. Исходя из этой модели, студенту, например, для оценки качества курса лекций Г. Татаровой или любого другого преподавателя можно задать три вопроса:
Как Вы считаете, содержательный или нет данный курс лекций?
—да
— нет
— з/о
Как Вы считаете, интересно читает лектор или нет?
— да, интересно
— нет, не интересно
—з/о
Индексы для равнения групп.
Теперь представим себе, отвлекаясь от рассмотренных нами задач, что нам нужен индекс, характеризующий группу респондентов. При этом у нас есть оценки для каждого респондента, полученные по шкале порядков. Логика формирования индекса на основе шкалы порядка одинакова независимо от того, каким способом получена исходная порядковая шкала и сколько на ней градаций (пунктов шкалы). Возьмем, к примеру, случай, когда по каждому респонденту есть оценка «уровня беспокойства» трудоустройством по специальности после окончания вуза, полученная по порядковой шкале с пятью градациями. Выше был приведен этот эмпирический индикатор как вопрос вида «Насколько Вы уверены, что найдете работу по специальности после окончания вуза?». Перед нами стоит задача получения оценки уровня беспокойства/ уверенности в целом по группе респондентов. Для начала несколько упростим ситуацию и представим себе, что исходно имеем дело со шкалой с тремя градациями:
— уверен, что найду
— и да, и нет
— совсем не уверен, что найду
Естественным образом, оценкой «уровня беспокойства» для группы может служить разница между числом «уверенных» и числом «неуверенных» в группе. Но не абсолютная разница, а относительная, т. е. доля этой разницы в общем числе респондентов данной группы. Тогда значение индекса не зависит от объема группы и по нему можно сравнивать «уровни беспокойства» групп разного объема.
Если обозначим через n+ — число «уверенных», n — число «неуверенных», а через n0 — число «нейтральных», то индекс I будет иметь следующий вид:
Какой бы индекс социолог ни использовал, он необходимым образом выясняет свойства этого индекса, т. е. выясняет правила его «поведения». Данный индекс обладает следующими свойствами. Он принимает максимальное значение, равное 1, тогда, когда все респонденты в группе уверены, что найдут работу по специальности. Он принимает минимальное значение, равное —1, тогда, когда все респонденты не уверены, что найдут работу по специальности. Индекс равен нулю, если число «уверенных» равно числу «неуверенных». Положительное значение индекса говорит о том, что уверенных больше, чем неуверенных. И соответственно, отрицательное значение появится в ситуации, когда число неуверенных больше, чем уверенных. Понятно, что в группах с одинаковой разницей (отличной от нуля) между числом уверенных и неуверенных (это называется абсолютной разницей в отличие от относительной), значение индекса будет больше в той группе, где меньше нейтральных ответов.
А теперь, опираясь на те же рассуждения, можно предложить аналогичный индекс и для случая пяти градаций. Обозначим через na — число уверенных студентов, nb — число скорее уверенных, чем нет, nc — число нейтральных, пd —число не очень уверенных и ne — число скорее неуверенных. Тогда можно предложить индекс следующего вида:
Если в предыдущей формуле все коэффициенты при разных n (частотах) были равны единице, то в этой формуле появились коэффициенты разные (1 и 0,5). Это означает, что отдельно взятая градация вносит разный вклад, разную долю в значение индекса. Коэффициент, равный 0,5 перед nb и nd вводится для того, чтобы сделать равноправными «не очень уверенных» и «скорее неуверенных». Это во-первых. Во-вторых, вклад тех, кто «не очень», в два раза меньше, чем вклад тех, кто «очень». И наконец, рассмотрим ситуацию, когда в группе нет респондентов уверенных, нейтральных, не очень уверенных, совсем неуверенных, а все респонденты скорее уверены, чем нет. Тогда значение индекса будет равно 0,5. Аналогичные рассуждения можно продолжить для выяснения всех остальных свойств индекса.
Индекс, который мы рассматриваем, имеет достаточно простую, прозрачную конструкцию. Возникает вопрос, что будет, если число градаций на порядковой шкале увеличить. Самый простой ответ на этот вопрос обусловлен существованием интересного феномена в методической социологии. Назовем его условно для образности и яркости «законом триад». Какое бы исследование ни проводилось, социолог пользуется этим законом. Например, выбирает предприятия, территориальные образования, исходя из простой схемы: большое — среднее — малое. Выбирает для опроса студенческие группы: хорошие — средние — плохие. Анализирует отдельно различные группы по доходу: богатые — средние — бедные. Могут быть триады типа:
— удовлетворенные — и да, и нет — не удовлетворенные
— уверенные — и да, и нет — неуверенные
— вероятные — мало вероятные — невероятные
— интересующиеся — и да, и нет — не интересующиеся
Список можно продолжать до бесконечности, но не в этом дело. Для нас с вами важно, что в группе, например, «богатых» можно в свою очередь ввести новую триаду:
— богатые, но не очень — достаточно богатые — очень богатые,
А, например, между группами «удовлетворенных» и тех, кто «и да, и нет», также можно ввести новую триаду. Это очень удобный и простой способ, и для создания порядковых шкал, и для трансформации шкал, т. е. увеличения или уменьшения числа градаций на шкале. Разумеется, речь идет о так называемых сбалансированных шкалах. К ним относятся порядковые шкалы, на которых есть нейтральное положение и число «положительных» позиций равно числу «отрицательных». Сбалансированные шкалы пришли в социологию из психологии, где при измерениях опираются на модель «стимул — реакция». Соответственно, предполагается, что реакция может быть положительной, нейтральной и отрицательной.
Вернемся к задаче формирования индекса для характеристики группы в случае, когда исходные порядковые шкалы имеют большее число градаций, чем пять. В этом случае можно преобразовать исходную шкалу в шкалу с меньшим числом градаций и предложенным способом вычислить групповой индекс. Но следует иметь в виду, что преобразовать необходимо в сбалансированную шкалу. Если же этого нельзя сделать, то возможно проводить сравнения различных групп респондентов на основе других показателей, например на так называемых мерах центральной тенденции. О них будем говорить в соответствующем разделе книги.
Формирование аналитических индексов может быть отнесено и к отдельно взятому респонденту. Совершенно ясно, что с помощью прямо поставленных вопросов или с помощью логических индексов можно измерить очень ограниченное число свойств социальных объектов. Перейдем к рассмотрению еще одного приема измерения, который может быть обозначен как формирование шкалы суммарных оценок.
Впервые такого рода шкалу использовал в 1929—1931 гг. Р. Лайкерт (Ликерт) (R. Licert) для измерения расовых, национальных установок. Обычно социолог, «изобретая» некоторую шкалу суммарных оценок, называет ее шкалой типа шкалы Лайкерта, имея в виду процедуру измерения. Таким образом, шкалой называется и какая-то «линеечка», и алгоритм ее получения, т. е. сама процедура измерения. Процедуру измерения лучше называть шкалированием.
Далее шкалу Ликерта будем называть шкалой Лайкерта ибо так её называют в большинстве случаев в русскоязычной литературе.
Шкала суммарных оценок
Эта процедура обычно используется для измерения социальной установки, например отношения: мужчин к феномену «умная женщина»; молодежи к «старикам»; студентов к учебе; молодежи к «новым русским», внебрачным сексуальным отношениям, к суициду, политике как деятельности и т. д.
В работе В.А. Ядова [29, с. 106] приводится пример измерения отношения женщин к детям. Перечисленные выше социальные установки невозможно измерить посредством «прямых» вопросов, обращенных к респонденту. Эти установки носят латентный характер. Что касается отношения молодежи к «старикам» и отношения женщин к детям, то необходимо еще и учесть, что речь идет о социально неодобряемом поведении, если это отношение у респондента будет отрицательным. Поэтому нельзя пользоваться прямыми вопросами для изучения этих феноменов.
Не представляется возможным здесь и использование логических индексов. По крайне мере, мне так видится, но возможно, вы придумаете какой-нибудь индекс.
Тогда, следуя логике, предложенной Лайкертом, сочиним (пока не говорим как) совокупность суждений (утверждений) безличных. И будем считать, что степень согласия/несогласия со всей совокупностью этих суждений характеризует социальную установку респондента. Рассмотрим модельный пример (на практике эти суждения не использовались для измерения отношения мужчин к феномену «умная женщина»). В таблице 2.2.1 изображены ответы отдельно взятого респондента.
Обратите внимание, что в таблице представлены два типа суждений: одни помечены (+), а другие (-). Согласие с суждениями (+) характеризует как бы «хорошее» отношение к умной женщине, а согласие с суждениями (-) как бы «плохое» отношение. Градации шкалы интерпретируются как баллы. Поэтому в первом случае максимальный балл, равный пяти, получают те, кто полностью согласен с суждением, а во втором — те, кто совершенно не согласен с суждением.
Таблица 2.2.1
Индексы в бюджетах времени
Индексный анализ — анализ посредством формирования и использования индексов - основной прием работы с данными времяпрепровождения. Существует, как минимум, пять основных индексов, которые социологи называют показателями. Обозначим через ti затрату времени на осуществление некоторого занятия (чтение газет, курение, пение и т. д.) i-м респондентом. Если число респондентов в интересующей нас группе равно n, то данные можно представить в виде ряда:
Первый показатель (Р1) из пяти равен средней продолжительности затрат времени на осуществление занятия для всех n респондентов. Второй показатель равен средней частоте встречаемости занятия для всех n респондентов. Третий показатель (Р3) равен доле в % так называемых «актеров» среди всех респондентов, т. е. респондентов, у которых есть заданное занятие. Обозначим их число через na Четвертый показатель (Р4) и пятый аналогичны соответственно первому и второму только относительно «актеров», а не для всех респондентов. Ниже приводим в качестве примера только три обозначенных выше показателя - индекса.
Это примеры как бы групповых индексов. Можно ввести и индивидуальные индексы. Например, индекс характеризующий степень разнообразия досуга отдельного индивида, или другие индексы, описывающие структурувремяпрепровождения.
ИНДЕКСЫ ПРИ СБОРЕ И АНАЛИЗЕ ДАННЫХ
Косвенное измерение. Построение индексов как прием измерения и как составная часть анализа эмпирической информации. Логический квадрат. Логический прямоугольник. Шкала суммарных оценок. Индексы в бюджетах времени, в государственной статистике, в текстовой информации.
В рамках самого распространенного приема измерения — измерение как кодирование информации — предлагался достаточно простой подход к измерению, например, уровня удовлетворенности учебой. Заметим, что он прост только технически, т. е. достаточно придумать эмпирический индикатор (вопрос анкеты). Это только кажущаяся простота. Что же касается обоснования этого подхода, то характер такого обоснования может носить сложный для исследователя характер. Ибо необходимо доказать, что таким образом мы измеряем именно «удовлетворенность» учебой, а не какие-то другие психологические феномены (пессимизм, равнодушие к учебе и т. д.). Таким же упрощенным способом можно измерить любые другие «удовлетворенности» (здоровьем, полученным образованием, семейной жизнью и т. д.), отношения к чему-то, интерес к чему-то, уровень «беспокойства» и т. д. По сути своей такой подход редко бывает теоретически обоснованным, но в массовых опросах без него трудно обойтись. Применяя такой подход, необходимо понимать, каковы границы интерпретируемости результатов, полученных с его помощью.
Для корректного и глубокого изучения социальных феноменов, и особенно связанных с так называемыми аттитюдами, т. е. с социальными установками, необходимы другие способы. Тем самым возникает проблема измерения социальных установок, получения так называемых установочных шкал (когда «цифирь» приписывается респонденту). Напомним, что еще в 1942 году М. Смитом была определена трехкомпонентная структура аттитюда: когнитивный компонент (осознание объекта социальной установки); аффективный компонент (эмоциональная оценка объекта, выявление чувства симпатии или антипатии к нему); поведенческий (конативный) компонент (последовательное поведение по отношению к объекту). Само понятие «аттитюда» было введено ещё раньше. Социальная установка (это понятие ввел Уильям Томас в 1916 году) — осознание, оценка, готовность действовать или ценностное отношение к социальному объекту, психологически выражающееся в готовности положительной или отрицательной реакции на него [3, с. 251—264, 30, с. 844]. Из этого мы делаем вывод, что, прежде чем приступать к выбору процедуры измерения, необходимо понимание того, какие аспекты социальной установки, какой компонент мы, социологи, измеряем. Разумеется, в некоторых процедурах измерения эти компоненты переплетаются между собой, могут быть неразделимы.
Вернемся к измерению феномена «удовлетворенность». Представим себе ситуацию, когда к вам обращаются с вопросом о степени вашей удовлетворенности учебой, а ко мне о степени моей удовлетворенности работой. Реакции ваши и моя будут примерно одинаковы, а именно, прозвучит ответный вопрос «Что вы имеете в виду?». Одними аспектами учебы и работы мы, респонденты, удовлетворены, а другими — нет. Однозначный ответ невозможен, и, соответственно, прямой вопрос для измерения удовлетворенности не годится. Это не значит, что у каждого из нас отсутствует «удовлетворенность», но это наше свойство «иметь определенную степень удовлетворенности» носит латентный(скрытый) характер. Необходимы какие-то косвенные вопросы, косвенное измерениеискомого феномена. А то, что его можно измерить, пока у нас не вызывает никакого сомнения.
Как можно поступить в данном случае, как найти выход в этой исследовательской ситуации? Первый способ — с помощью глубинного интервью выяснить все аспекты удовлетворенности и неудовлетворенности. Скорее всего, эти феномены должны измеряться по разным шкалам. Например, известно, что феномен удовлетворенности работой [26] связан с одной группой факторов (интерес к работе, осознание своей значимости и т. д.). Феномен же неудовлетворенности — с другой группой факторов, а именно с так называемыми «гигиеническими» (условия труда).
Существует и другая возможность измерения феномена «удовлетворенность». Однако для этого необходима экспликация(уточнение) понятия «удовлетворенность» в зависимости от исследовательских задач. Например, социолога может интересовать удовлетворенность учебой не вообще, ему важен и нужен лишь уровень удовлетворенности только студентов социологического факультета и только как сила мотивации учебой именно на данном факультете и только для сравнения студентов-социологов различных вузов Москвы. К примеру, возьмем МГУ (Московский государственный университет), МГПУ (Московский государственный педагогический университет) и ГАУ (Государственная академия управления). Все они выпускают социологов. Для этого случая можно воспользоваться приемом измерения, связанным с формированием логических индексов (определение дадим несколько ниже). Рассмотрим один из них, так называемый логический квадрат.
Логический квадрат
Задаем респонденту, студенту социологического факультета одного из названных вузов, два взаимодополняющих друг друга вопроса:
1. Представьте себе, что у вас есть возможность перейти на другой социологический факультет. Перешли бы вы?
— да, перешел бы
— нет, не перешел бы
— затрудняюсь ответить (з/о)
2. Представьте себе, что вы нигде не учитесь. Пришли бы вы или нет учиться на ваш факультет?
— да, пришел бы
— нет, не пришел бы
— з/о
Проанализируем все возможные сочетания вариантов ответа на эти два вопроса. Таких сочетаний 9, т. е. после сбора информации мы можем столкнуться с девятью ситуациями. Каждая из них требует интерпретации до проведения пилотажа. Как вы знаете, пилотаж — это небольшое по объему пробное исследование для апробации инструментария. На рис. 2.2.1 изображен логический квадрат, в котором каждая возможная ситуация отмечена буквами а, b, с, d, e, f.
«Пришел бы...» | «Перешел бы...» | ||
Нет | З/о | Да | |
Да | а | b | f |
З/о | b | с | d |
Нет | f | d | е |
Рис. 2.2.1 Логический квадрат
Максимальная удовлетворенность будет наблюдаться в ситуации а, минимальная — в ситуации е, средняя — в ситуациис. Вы обратили внимание на то, что некоторые ситуации обозначены одинаковыми буквами. Буквой fобозначены две ситуации, которые практически не могут встретиться в данных, ибо содержат в себе противоречие. Две ситуации, обозначенные b, в определенной мере идентичны. Степень удовлетворенности для этих случаев меньше, чем максимальная, и больше, чем средняя. Например, студент Михаил не хочет никуда переходить, а по поводу поступления на факультет вновь не имеет определенного мнения (з/о), а студент Сергей готов вновь поступить на факультет, но по поводу перехода затрудняется ответить. В определенной мере можно считать, что сила мотивации у них одинакова. При этом она не так сильна, как в ситуации а, но сильнее, чем в ситуации с. И наконец, две одинаковые ситуации, обозначенные буквой d. Им соответствует степень удовлетворенности меньшая, чем средняя, и большая, чем минимальная. Рассуждения аналогичны предыдущим.
Логический квадрат называется логическим в силу того, что исследователь проводит только логические операции, а квадратом — потому что такова его форма существования. На входе мы имеем трехчленную шкалу, а на выходе шкалу порядков с пятью градациями. Можем закодировать или присвоить шкальные значения ситуациям так, чтобы выполнялось условие:
a>b>c>d>e
Например, а=5, b=4, с=3, d=2, e=l.
С помощью логического квадрата мы определяем удовлетворенность учебой только отдельно взятого студента. Для решения поставленной выше задачи, а именно сравнения степени удовлетворенности учебой студентов-социологов различных вузов Москвы, необходимо решить еще одну задачу: измерения искомой удовлетворенности для группы студентов отдельно взятого вуза. Ее можно решить посредством формирования уже групповых индексов. К этой задаче мы вернемся после рассмотрения еще одного логического индекса. Его условно можно обозначить как логический прямоугольник.
Логический прямоугольник
Термины квадрат, прямоугольник (может быть, и куб) при построении логических индексов можно вообще не употреблять.
Представим себе, что мы изучаем рейтинг преподавателей, читающих спецкурсы на социологическом факультете. При этом опираемся на мнения студентов. Для достижения этой цели, естественно, необходима процедура или модель оценки качества «курса лекций». Здесь возможно построение нескольких моделей. Я думаю, что у вас не вызовут возражения следующие рассуждения. Для оценки качества лекций мы хотим использовать три понятия, а именно:
— содержательность (наличие нового знания);
— интересность (в смысле стиля, ораторские способности);
— понятность (доходчивость материала).
Эти три компонента, три фактора определяют качество любого «курса». Не исключаем и того, что могут быть предложены и другие варианты такого рода факторов. Исходя из этой модели, студенту, например, для оценки качества курса лекций Г. Татаровой или любого другого преподавателя можно задать три вопроса: