Источники и применение сводных данных

Политолога не интересуют отдельные люди. Вернее, политолога (как ученого) интересуют отдельные индивиды лишь постольку, поскольку они являются составной частью изучаемойим группы людей. Например, мы можем изучать поведение какого-то конкретного губернатора, но не потому, что мы хотим узнать больше о губернаторе Смите, а потому, что, как нам кажется, из наблюдений над губернатором Смитом мы можем вынести лучшее представление об американских губернаторах вообще и можем научиться прогнозировать их поведение. Политолога интересует изучение групп или сообществ людей, таких, как совокупность американских избирателей, индийское крестьянство или российская бюрократия.

Иногда для изучения этих групп нам приходится собирать данные об их отдельных членах (или о репрезентативных выборках из них) и затем объединять, или сводить, эти данные, для того чтобы получить информацию о группе в целом. Однако зачастую совокупная информация о группе уже имеется. Данные, характеризующие группу или сообщество индивидов в совокупности, принято называть сводными данными.

Существует две основные разновидности сводных данных. Первая из них – это суммарные показатели, к которым относятся большие совокупности мер групповых признаков, получающиеся путем объединения данных о поведении всех членов группы. К сводным данным, к примеру, можно отнести население государства. Уровень рождаемости, смертности, грамотности, преступности – это все сводные показатели, получаемые посредством сложения всех соответствующих отдельных событий (смертей, рождений, преступлений и т д.) в группу и выражаемые в стандартизованных единицах (например, в расчете на тысячу человек населения). В каждом случае сводные данные отражают количество какого-то группового признака (или свойства), которым члены группы, будучи взятыми по [c.292] отдельности, не обладают. Индивид может выступать в качестве составной части населения, но не может быть самим населением. Индивиды могут рождаться, учиться, умирать, но не могут обладать коэффициентом рождаемости, грамотности, смертности в том же смысле, что и целое государство. Эти данные являются мерами совокупных признаков.

Ко второй основной разновидности сводных данных относятся те меры, которые отражают количество группового признака, выводимого не из объединения признаков отдельных членов группы, а из системных свойств группы. Такие меры часто называютсистемными показателями. Форма правления, например, – это системная переменная, и в любом государстве может быть установлена демократическая или недемократическая форма правления вне зависимости от того, какого поведения и каких взглядов – демократических или нет – придерживаются отдельные граждане этого государства. Точно так же бюджет любого округа в США может обнаруживать высокий уровень расходов на государственное образование вне зависимости от того, какое значение придают соответствующим проблемам отдельные жители этого округа.

Данные обеих указанных разновидностей, относящиеся к самым различным типам групп, можно получить из целого ряда источников. Группы можно разбить на две категории: территориальные группы (определяемые проживанием их членов в пределах определенного географического района, как-то: государства, города или переписного района) и демографические группы (определяемые личными признаками их членов, как, например, расовой принадлежностью или родом занятий).

Из этой главы вы узнаете, что использование сводных данных сопряжено с решением некоторых встающих при этом методологических проблем. Однако преимущества, получаемые от применения сводных данных, чаще всего сильно перевешивают возможные издержки. Использование сводных данных может быть сочтено необходимым или желательным тогда, когда индивидуальные данные (т.е. относящиеся к индивидуальным случаям) недоступны или слишком дорогостоящи. Можно привести следующие примеры. Если мы собираемся предпринять историческое исследование, то по крайней мере часть интересующих нас групп (например, население Чикаго в 1880 г.) [c.293]может принадлежать к числу уже умерших. Члены некоторых важных в политическом отношении групп (например, международных террористических организаций) могут упорно избегать интервьюирования и идентификации их личностей. Чаще, правда, политолог оказывается в ситуации, когда сбор индивидуальных данных теоретически возможен, но непомерно дорогостоящ. В особенности это относится к сравнительным исследованиям, поскольку расходы и организационные проблемы, связанные с проведением международного опроса, огромны.

Занимаясь вопросами, по которым индивидуальные данные почему-либо недоступны, политолог часто находит полезным использовать сводные данные, содержащие основную необходимую ему информацию. В настоящей главе читатель познакомится с тем, какие типы сводных данных являются доступными, какие бывают источники сводных данных, какие методологические проблемы встают при использовании сводных данных и, наконец, какие можно предложить общие правила сбора сводных данных. Читателю вскоре станет ясно, что правильное применение сводных данных требует мастерского владения методами сбора, обработки и анализа информации. Однако как студентам, так и профессиональным политологам приходится иметь дело чаще со сводными данными – в силу их большей доступности, – чем с любыми другими данными, получаемыми с помощью методов, описанных в предыдущих главах. [c.294]

ТИПЫ СВОДНЫХ ДАННЫХ

Большая часть доступных политологам сводных данных бывает, как правило, собрана не политологами и не в исследовательских целях. Поэтому они зачастую имеют лишь косвенное отношение к конкретному политологическому исследованию. На самом деле при анализе сводных данных сложнее всего бывает уметь использовать имеющиеся данные в качестве показателей тех понятий, которые непосредственно интересуют исследователя. Например, на первый взгляд почти нет оснований думать, что политолога может заинтересовать число купленных в стране радиоприемников или величина оформленной подписки на газеты. В конце концов политолог – это не агент по сбыту печатной продукции. И все же соответствующие [c.294] цифры могут оказаться для него полезными, выступая в качестве косвенных показателей уровня обмена политической информацией в обществе или уровня его экономического развития, что само по себе, безусловно, входит в сферу интересов политологии. Точно так же и сведения о числе больничных коек в расчете на тысячу человек населения обретают определенную политологическую значимость, если их рассматривать как показатели, допустим, эффективности государственной политики в области здравоохранения или степени доступности медицинских услуг для различных социальных слоев в рамках города или государства.

Суть в том, что сводные данные часто не представляют самостоятельного интереса; поэтому, чтобы быть примененными с пользой для исследования, они нуждаются в определенной обработке. Не следует ориентироваться только на уже готовые показатели, но нужно уметь увидеть возможность объединения кажущихся не связанными друг с другом мер в пригодные для данного исследования показатели.

Существует шесть типов сводных данных1, приводимых ниже в порядке убывания их валидности и надежности.

1. Данные переписи (цензовые данные). Многие государства мира периодически предпринимают сплошные опросы всего населения (или, как минимум, всех семей), для того чтобы получить информацию, которую можно будет в дальнейшем использовать в целях регулирования налогообложения и планирования государственной политики. Среди прочего эта информация включает данные о количественном составе семьи, о половой принадлежности главы семьи, о времени проживания в данной местности, об уровне образования, о доходах семьи и о ее жилищных условиях. Хотя цензовые данные собираются по каждой семье индивидуально, но к тому времени, как они станут доступными исследователям в форме официальных учетных документов, они обретают вид суммарных итоговых цифр (например, общее число владельцев автомашин в некотором данном районе).

У цензовых данных есть целый ряд свойств, делающих их крайне ценными для политологического анализа. Во-первых, несмотря на то что в них встречаются ошибки2, данные переписи бывают в целом вполне надежными. Во-вторых, [c.295] поскольку измеряемые переписью переменные обычно просты, ее данные принято рассматривать как высоковалидные. В-третьих, в некоторых государствах сбор относительно стандартизованных данных продолжается в течение многих лет. Таким образом, данные переписи дают возможность выявлять исторические тенденции и проверять гипотезы о различных изменениях во времени. В-четвертых, поскольку цензовые данные обычно носят стандартизованный характер (а именно содержат ответы на одинаковые вопросы и подразделяют ответы на одинаковые классификационные категории), они сравнимы между собой и поэтому бывают весьма полезны при сравнивании различных государств, городов или регионов. Вдобавок ко всему цензовые данные легкодоступны. Во многих странах публикуются итоговые отчеты как о всеобщей переписи населения, проводимой обыкновенно раз в десять лет, так и о различного рода специализированных опросах, проводимых в промежутках между всеобщими переписями. ООН раз в год публикует “Демографический ежегодник”, где приводятся данные переписей в разных странах. В США имеется Бюро переписей – большой отдел обслуживания исследователей, который помогает найти и получить для работы нужные данные из тех, что имеются в распоряжении бюро.

2. Ведомственная статистика. В каждом государстве различные органы государственного управления, предприятия, профсоюзы и другие общественные организации занимаются сбором информации, связанной с их собственной деятельностью. Если эти данные удовлетворяют запросам конкретного социологического исследовательского проекта, они могут принести большую пользу исследованию.

Некоторые организации собирают данные самостоятельно, как это делают, например, международные корпорации, ведущие учет своих капиталовложений, больницы, регистрирующие сведения о пациентах, и городские управления, ведущие в целях налогообложения учет недвижимого имущества. Есть организации, которые используют данные, добытые другими агентствами (такими, как министерство торговли США), для преобразованияих в форму различных индексов, отражающих, например, экономическое развитие или демографические сдвиги. В [c.296]США к такому типу организаций относятся Комиссия по вопросам экономического развития и Международная ассоциация городских руководителей.

У исследователя, желающего ознакомиться с ведомственной статистикой, могут возникнуть определенные проблемы. Первой и, наверное, самой важной является проблема получения доступа к информации. Данные, собираемые государственными учреждениями, являются обычно частью государственной статистики и легкодоступны, но данные, которые собираются неправительственными организациями, находятся в частной собственности последних. Некоторые организации – особенно это относится к частным компаниям – считают свои данные секретными и очень неохотно делятся ими. Зачастую проблема состоит даже не столько в том, чтобы добраться до информации, сколько в том, чтобы просто узнать о ее существовании. Ведь никаких централизованных списков статистических данных не существует, поскольку они собираются тысячами самых разных государственных и частных организаций, вовлеченных в деятельность по учету информации. Исследователь может упустить из виду массу важнейших данных в силу простого недостатка сведений о существовании или о содержании конкретной статистики.

Проблема состоит в том, что содержание и качество данных могут сильно варьировать, затрудняя возможность их сравнения и обобщения. Если профсоюзы учителей штатов Индиана и Огайо собирают о своих членах почти несравнимые данные, то и мы не можем использовать эту статистику для осмысленного сравнения этих профсоюзов. Если мы к тому же не знаем, как собиралась информация, то мы и не можем знать, до какой степени надежны приводимые цифры.

И наконец, данные могут находиться в неудобной для обработки форме. Бывает, что статистика естественного движения населения какого-то конкретного района (данные о рождениях, смертях, заключении и расторжении браков и пр.) будет доступна только в несведенной форме и только в центральном населенном пункте этого района, так что исследователю придется много часов провести в здании местного управления, занимаясь утомительным [c.297] переписыванием данных от руки, с тем чтобы их впоследствии можно было ввести в машину и подытожить.

Вышеуказанные проблемы возникают не всегда, и, даже когда исследователю приходится сталкиваться с ними, все равно потенциальная отдача от использования сводной информации обычно стоит тех усилий, которые были приложены для их решения.

3. Выборочные опросы. Опросное исследование предполагает сбор данных на индивидуальном уровне. В тех случаях, когда опросы основываются на выборках, репрезентативно отражающих интересующую нас группу населения, их результаты могут быть использованы нами в качестве сводных данных. Например, мы хотим сравнить уровни политической информированности граждан двух разных государств. Если в каждом из этих государств имеется своя служба изучения общественного мнения, которая регулярно проводит выборочные опросы населения (так, как это делают институты Гэллапа и Роупера в США), включая вопросы о таких поведенческих признаках, как величина подписки на общественно-политические журналы или время, потраченное на просмотр информационных телепрограмм, то результаты этих опросов мы можем применить для построения сводных мер нашей переменной. Подобным же образом иногда можно использовать результаты опросов, проводимых в академических целях3. Преимуществом опросных данных – если они грамотно собраны – является высокий уровень надежности и валидности, причем степень последней зависит от умения исследователя выводить новые показатели. Опросные данные тоже в целом доступны (во всяком случае, за определенную плату их можно получить у тех организаций или ученых, которые занимались их сбором), притом зачастую в удобной для использования форме.

4. Содержание публикаций. Для получения сводных данных можно предпринять и контент-анализ публикаций, финансируемых какой-то определенной организацией или распространяемых среди ее членов. Например, если мы изучаем процесс политизации населения Великобритании, то можно подвергнуть контент-анализу английские учебники по гражданскому праву на предмет определения того, какое внимание уделяется в них демократическим ценностям, и объединенные результаты такого анализа затем использовать в качестве единого показателя демократических ориентации населения страны. Точно [c.298] так же для получения показателя, отражающего соотношение интереса жителей развивающихся стран к международным делам и ко внутренней политике (или соотношениеих симпатий к странам советского блока и к странам западного блока), мы могли бы прибегнуть к контент-анализу основных газет этих стран. И в том и в другом случаях результатом контент-анализа будет показатель определенного группового признака.

Сводные данные этого типа собираются исследователем специально для целей конкретного исследовательского проекта в отличие от тех, что берутся в готовом виде из какого-либо первичного источника, как, например, из отчета о результатах переписи. В силу этого доступность таких данных зависит от доступности необходимых публикаций и от того, располагает ли исследователь средствами для проведения контент-анализа. Надежность и валидность этих данных будут зависеть от умения исследователя правильно применять правила, описанные в гл.9. Сводные данные, собранные посредством контент-анализа публикаций, имеют то преимущество, что они могут быть пригодными для любого исследования, но получаемые с их помощью показатели базовых понятий бывают обычно весьма несовершенными. Ведь не очень ясно, насколько, например, можно быть уверенным в состоятельности утверждений о политических ценностях английских школьников, полученных на основе анализа учебников гражданского права.

5. Событийная информация. Политолога зачастую интересует такая информация об отдельных событиях, которая не отражается ни в отчетах о результатах переписи, ни в ведомственной статистике ввиду того, что эти события либо слишком редки, либо вообще выпадают из поля зрения статистики. Примерами событий такого рода могут служить восстания, революции, убийства, разрыв дипломатических отношений, привлечение государственных должностных лиц к суду за служебные злоупотребления, государственные перевороты и создание новых политических партий. Информация о таких событиях может оказаться полезной при построении показателей каких-либо групповых свойств. Например, уровень политической стабильности в стране можно было бы измерить путем подсчета числа актов политического насилия, имевших [c.299] место в течение определенного периода времени, а уровень политической коррупции в крупных городах – через подсчет числа случаев привлечения государственных чиновников к суду за взяточничество.

Процесс сбора событийной информации очень напоминает контент-анализ. После того как мы решим, какие события важны для нашего исследования, и тщательно их операционализируем (например, решим для себя, из каких действий состоит восстание), мы приступаем к систематическому обследованию всех источников (газет, ежегодников, записей радиопередач), в которых может содержаться информация об этих событиях, после чего подводим итог (следя при этом за тем, чтобы не посчитать одно и то же событие дважды, в том случае если оно упомянуто более чем в одном источнике). Кроме того, для получения более детализированной информации мы можем воспользоваться техникой контент-анализа. Например, для определения того, насколько серьезны общественные беспорядки, их можно классифицировать либо по продолжительности, либо по размерам примененного насилия, либо по числу участников.

Относительная надежность событийной информации может быть обеспечена за счет тщательной подготовки исследователя и благодаря контролю со стороны тех, кто регулярно читает источники. Однако сделать эту информацию валидной чрезвычайно трудно. Главная проблема заключается в полноте отчетности. Даже если исследователь просмотрел все известные источники или отчеты о каком-либо типе событий, все равно нельзя поручиться, что ни одно имевшее место событие подобного рода не избежало регистрации. Есть страны, в которых правительство строго контролирует сообщения о политических событиях, с тем чтобы огласку получала только предпочтительная, с точки зрения этого правительства, информация, поэтому о многих важных акциях (вроде применения войск для подавления забастовки) может не появиться никаких сообщений и, следовательно, никакой валидной меры, этих событий построить нельзя.

Вторая проблема проистекает из первой и связана с тем, что в сообщениях возможны неточности. Даже когда о событиях имеется какая-то информация, детали этой информации могут оказаться намеренно или ненамеренно [c.300] искаженными, эти проблемы, конечно, преодолимы, однако, планируя исследование с привлечением событийной информации, о них следует помнить и реалистически оценивать возможности построения таким путем валидных мер4.

6. Экспертные данные. Бывают случаи, когда данных, нужных для построения мер каких-то определенных совокупных свойств, просто не существует. В этих случаях исследователь может иногда прибегнуть к использованию суждений экспертов или лиц, знакомых с предметом исследования.

Рассмотрим пример исследования, предметом которого является лоббистская борьба нескольких заинтересованных групп в защиту и против природоохранного законодательства. По данному вопросу может не существовать никаких официальных документов, но исследователь вполне может расспросить ведущих законодателей о том, какая группа и сколь интенсивно, по их оценке, поддерживает это законодательство или противодействует ему в своей лоббистской деятельности. Точно так же, если исследователь не в состоянии собрать данные о том, насколько широко тот или иной государственный режим прибегает к насилию, чтобы удержаться у власти, он может обратиться к ученым, которые бывали в соответствующих странах и знакомы с их политическими системами, с просьбой дать оценку соответствующих режимов.

Экспертные данные очевидным образом страдают определенными недостатками. Прежде всего, степень точности таких данных ограничена рамками личного опыта экспертов. Чтобы не полагаться на неверные или ограниченные оценки, можно прибегнуть к помощи нескольких экспертов, сверяя их показания между собой. Однако зачастую трудно найти сразу несколько квалифицированных экспертов, которые бы отличались друг от друга уровнем подготовки и опытом знакомства с предметом исследования, так что даже привлечение целой группы экспертов не может подчас служить гарантией точности данных. Во-вторых, даже тогда, когда информация, полученная от эксперта, абсолютно достоверна, она носит в целом весьма размытый характер. Ведь в конце концов исследователь интересуется впечатлениями и мнением эксперта о сложных явлениях, а не о числе отдельных событий. Тем не [c.301] менее указанные ограничения не должны обескураживать исследователя. Важно, чтобы он помнил о них, планируя исследование и анализируя экспертные данные, ибо ошибочно было бы обращаться с этими данными как с более надежной и точной информацией, чем это есть на самом деле.[c.302]

Наши рекомендации