Описание данных: построение таблиц, диаграмм, гистограмм
Проблема, которую мы ставим в этой части исследования, состоит в том, как наилучшим образом преподнести результаты нашей работы. Мы должны найти стиль ясный, сжатый, точный и, кроме того, объективно отражающий данные. И одновременно мы должны помочь другим исследователям понять значение или значимость того, что мы выяснили. Иначе говоря, нам нужно представить результаты так, чтобы они были без труда поняты. Частично это зависит от применения статистического анализа, обсуждение которого мы отложим до следующей главы. Но в основном успех правильной интерпретации данных зависит от качества схематического и графического материала, от удачного выбора таблиц и диаграмм, от четкости и ясности их построения.
Разнообразие типов схематического и графического описания данных огромно, и нам не удастся рассказать обо всех или даже о наиболее часто встречающихся. Лучше, изучив несколько типичных примеров, мы обсудим те подводные камни, о которых необходимо знать как при чтении, так и при подготовке таблиц, графиков и т. п. По ходу дела мы затронем такие вопросы, как: “В каких случаях следует прибегать к графику? Что лучше – таблица или схема? Как выглядят таблицы, схемы, диаграммы (какова их структура)? Как схематическое и графическое изображение может помочь в понимании материала?”[c.375]
ПЕРЕЧНЕВАЯ ТАБЛИЦА
Начнем изучение этих проблем со знакомой вам уже, возможно, перечневой таблицы. Перечневая таблица – это попросту представление исследовательских данных в виде таблицы, которая, по сути дела, является перечнем. Таблица 13.1, например, суммирует данные о голосовании избирателей за демократов на президентских выборах и их расовую принадлежность за период 1960–1976 гг. Каждая колонка таблицы представляет отдельную переменную (всего четыре переменных). Тот факт, что [c.375]таблица задана переменной год, которая расположена в первой колонке, определяет и порядок изложения данных. Порядок этот подсказывает, что таблица построена так, чтобы ответить на вопрос, как голосование за демократов на президентских выборах изменялось из года в год.
Табл. 13.1 иллюстрирует некоторые правила построения таблиц.
Таблица 13.1.
Голоса белых и чернокожих избирателей,
поданные за демократов в 1960 - 1976 гг., % *
Год | Голосование за демократов | Голосование за белых демократов | Голосование за чернокожих демократов |
1960 1964 1968 1972 1976** | 50 61 43 40 51 | 49 59 38 34 48 | 68 94 58 89 83 |
* Данные о выходцах из Азии, испанцах и др., кроме негров, небелых избирателях, хотя и присутствуют в том наборе данных, по которому построена таблица, из настоящего анализа исключены.
** Данные за 1976 г. основаны на предварительном анализе некоторых сведений Научно-исследовательской кампании по прогнозам
Источник. Данные, представленные в этой таблице, взяты из обзоров Научно-исследовательской кампании по прогнозам, издаваемых раз в четыре года.
Все таблицы должны быть последовательно пронумерованы. В солидных работах с несколькими пронумерованными частями (в диссертации или в книге с большим количеством глав) эти номера должны выглядеть так: табл. 3.1, 3.2 и т. д. или табл. III.1, III.2 и т. д. В небольших по объему работах вполне достаточна нумерация из одной цифры (табл. 1, табл. 2). Если в одной и той же работе таблицы даются наряду с графиками, схемами и другим иллюстративным материалом, то обычно они нумеруются отдельно. Графические изображения обозначаются, например: рис. 1 или рис. 3.1.
Каждая таблица должна иметь заголовок, который точно отражает содержание представленных в ней данных. Этот заголовок должен давать читателю достаточно информации, чтобы решить, изучать ли таблицу детально. Так, для табл. 13.1 заголовок типа “Данные, показывающие, что за демократов трижды за период 1960–1976 гг. [c.376]голосовало более половины избирателей и что чернокожие избиратели отдали им больше голосов, чем белые” будет неуместен. В общем, заголовок должен отражать основные переменные, по которым в этой таблице имеются данные. В случае, если, как в табл. 13.1, данные охватывают определенный период времени, этот период также следует включить в заголовок. Когда таблица полностью или частично составлена по сведениям другого источника, сразу под ней следует дать ссылку. Объяснительные ссылки, относящиеся к таблице в целом (первое примечание в нашем примере), следует отметить звездочкой или другими символами сразу после заголовка. Ссылка, относящаяся лишь к части таблицы (второе примечание в нашем примере), отмечается прямо в самой таблице. Сами примечания помещаются сразу под таблицей, затем упоминается источник.
Что еще следует помнить при подготовке таблицы?
1. Номер таблицы и заголовок лучше помещать в центре страницы (или в ее правой части) и с отступом от предыдущего текста и самой таблицы. Другой вариант – помещать каждую таблицу на отдельной странице. В том месте текста, где идет речь о таблице, отступите строку, напечатайте СЮДА – ТАБЛИЦУ 1 заглавными буквами в центре страницы, отступите еще строку и продолжайте текст. В обоих случаях можно внешние границы таблицы обозначить двумя чертами, внутренние – одной.
2. Если это возможно, лучше избегать вертикальных линий для отделения секций внутри таблицы.
3. Между заголовками и данными внутри таблицы следует оставлять два пробела. Для облегчения чтения, кроме тех случаев, когда они не расположены на одной линии, можно оставить один пробел. Заголовки категорий должны по возможности коротко описывать затрагиваемые переменные и величины, но всегда они должны быть достаточно полными, для того чтобы сделать ясными значения данных.
Опыт показывает, что ни одна таблица не должна быть включена в текст, если по ней нельзя дать хотя бы страницу пояснений. Эти пояснения не должны просто повторять содержание таблицы. Оно, по сути дела, и так перед читателем. He нужно также перегружать таблицы цифрами или другими количественными терминами, хотя иногда их можно [c.377]использовать. Лучше, если пояснения к таблице будут прояснять взаимосвязи, продемонстрированные в ней, и обратят внимание читателя на основные и не основные выводы. Эти пояснения можно использовать также для того, чтобы прокомментировать результаты каких-либо статистических тестов, выполненных на основе табличных данных (см. гл. 14–16). В нашем примере подробные пояснения, возможно, коснутся общего уровня и изменений в голосовании за демократов в рассматриваемый период и относительной роли белых и чернокожих избирателей в этом голосовании. Они могут также коснуться любых замеченных сходств или различий. Особо можно обсудить вопросы об изменчивости или постоянстве, если таковое имеется, в характере вариации переменных, любом отмеченном отклонении в данных и даже надежности источника, из которого были извлечены данные.[c.378]
ЛИНЕЙНАЯ ДИАГРАММА
Иногда хочется избавиться от табличного изображенияили заменить его более простым и наглядным графиком. Это может быть сделано как для более ясного изображения (представьте трудности работы с табл. 13.1, если бы она охватывала период с 1876 до 1976 г.), так и для того, чтобы подчеркнуть определенный аспект в имеющихся данных. Существует множество способов для этого, один из самых простых – линейная диаграмма, изображенная на рис. 13.1.Линейная диаграмма соединяет все значения одной переменной непрерывной линией и дает возможность сравнения значений разных переменных путем нанесения нескольких аналогичных линий, часто различающихся цветом или манерой изображения. Линейные диаграммы особенно полезны при изображении трендов.
Рис. 13.1. Линейная диаграмма: голосование за демократов и его расовая составляющая, 1960-1976 гг.
Диаграмма на рис. 13.1 отражает те же данные, что и табл. 13.1, но в графической форме. В отличие от таблицы, требующей тщательного чтения, одного взгляда на рис. 13.1 достаточно, чтобы сказать, что между 1960 и 1976 гг. демократам было отдано в общем от 40 до 60% голосов на президентских выборах; что в 1960, 1964 и 1976 гг. за них голосовало больше, чем в 1968 и 1972 гг.; что распределение голосов белых избирателей, голосующих за партию, практически соответствует общему (белые выходили из партии в 1968 и 1972 гг., но вернулись в [c.378] в 1976 г., что поддержка партии среди негров постоянно активнее, чем среди белых, и что поддержка негров держится на высоком уровне независимо от успехов или неудач партии. Некоторые доступные детали табл. 13.1 менее очевидны на рис. 13.1 (например, трудно увидеть разницу между 50% голосов в 1960 г. и 51% в 1976 г.), но в общем анализ данных существенно облегчен.
По сути дела, подобные графики нужно оформлять также, как и таблицы. Каждый рисунок должен иметь свой номер и точный заголовок. Горизонтальная и вертикальная оси, если таковые используются, необходимо обозначить, и нужно проявить большую осторожность и внимание, чтобы удостовериться, что каждая из них правильно и убедительно прошкалирована1. Название вертикальной оси следует помещать над номерами ее градаций, название горизонтальной оси – под диаграммой. Если градациями горизонтальной оси являются годы (как в нашем примере), дополнительного названия не нужно. В случае нанесения нескольких линий под диаграммой следует поместитьключ (попунктное описание) к ним. Если необходимо, на самой диаграмме можно поместить добавочный пояснительный текст.[c.379]
Легче всего читать диаграмму, если количество линий сведенок минимуму. Однако иногда бывает полезно поместить данные о нескольких переменных на одной диаграмме. Тогда диаграмму следует сделать как можно больше и, если какие-нибудь из линий пересекаются, придать максимум разнообразия изображенным линиям. Наиболее часто употребляемые способы изображения линий таковы:
[c.380]