Табличное представление данных

Социологу в ходе этих заключительных стадий необходимо постоянно помнить о том, что чаще всего те, кто будет читать ваш аналитический отчет, — отнюдь не профессиональные социологи. Значит, вам необходимо подумать о том, как наиболее наглядно и убедительно представить данные, полученные в результате об­работки первичной социологической информации, чтобы более четко и емко изложить свои выводы, сформулированные в ходе анализа этих данных.

Позаботиться о том, какие таблицы вы будете строить, следу­ет еще на этапе разработки программы исследования — не только при формулировке вопросов анкеты, но и при кодировке их, и в особенности — при разработке той части методического раздела программы, которая относится к логической схеме обработки и анализа данных. Возможно, следует заранее составить списки таб­лиц — как простых, так и комбинированных — с указанием рас­положения переменных по строкам и столбцам. Это упростит про­цедуру обработки данных, сделает ее более компактной во време­ни и более четкой по организации. Вероятно, несколько сложнее заранее предсказать, какие из графических изображений могут оказаться наиболее приемлемыми и значимыми, во многом это проявляется в ходе обработки. И, тем не менее, было бы целесо­образно заранее составить предполагаемый перечень графиков, которые следовало бы построить и просмотреть (пусть даже мно-гие из них и не войдут в окончательный отчет), исходя из харак­тера гипотез, сформулированных в программе. Это лишний раз подчеркивает важность подготовительного этапа — составления программы социологического исследования — и его влияния на окончательные результаты, эффективность, качество и успех этого серьезного и непростого дела.

Таблицы и графики в аналитическом отчете служат не просто иллюстративными материалами, а содержат в себе саму суть, ядро полученной в ходе исследования информации. Без них просто невозможно выразить в словесной форме выводы исследования, и текстовой материал превращается в простую словесную шелу-ху. У нас речь пойдет как о технике составления и обработки, ре­дактирования таблиц и графиков, так и о некоторых областях их| применения.

Статистической называется таблица, которая содержит сводную числовую характеристику исследуемой совокупности по одному или нескольким существенным признакам, взаимосвязанным ло- гикой экономического анализа. Социологические таблицы, полу-чаемые после сбора и анализа первичных данных, относятся к числу статистических. Таблица содержит три вида заголовков: общий, верхние и боковые. Общий заголовок отражает содержа-ние всей таблицы (к какому месту и времени она относится), paс-полагается над ее макетом по центру и является внешним заго-ловком. Верхние заголовки характеризуют содержание граф (за-головки сказуемого), а боковые (заголовки подлежащего) - срок. Они являются внутренними заголовками.

Основные элементы статистической таблицы, представленные на рис. 5.1, составляют как бы ее основу.

Название таблицы* (общий заголовок)
Содержание строк Наименование граф (верхние заголовки)
А  
Наименование строк (боковые заголовки)            
           
           
           
Итоговая строка           Итоговая графа

* Примечания к таблице.

Рис. 5.1. Основа статистической таблицы

Все группировки значений различных переменных, которые были предусмотрены программой исследования, ложатся в осно­ву статистических таблиц, которые обобщают обработанную пер­вичную социологическую информацию. Таблица3 — это перечень сведений, обычно числовых данных, приведенных в определен­ную систему и разнесенных по графам — строкам и столбцам. Внешне таблица представляет собой пересечение граф и строк, которые формируют ее состав. Каждое пересечение образует клет­ку таблицы. Размер таблицы определяется произведением числа строк на число граф. Цифровой материал может быть представ­лен абсолютными (численность населения РФ), относительными (индексы цен на продовольственные товары) и средними (сред­немесячный доход служащего коммерческого банка) величинами. При необходимости таблица сопровождается примечанием, ис­пользуемым с целью пояснения заголовков, методики расчета не­которых показателей, источников информации и т.д.

Строго говоря, процедура составления таблиц не представляет собой какой-то особой математической операции. Это скорее оп­ределенная форма отображения рядов распределений, полученных в результате расчетов. Основное преимущество этой формы зак­лючается в том, что в ней кратко и емко даются пояснения зна­чений соответствующих группировок. Хорошо сконструированная таблица позволяет как самому исследователю, так и заказчику более четко представить, описать и объяснить смысл и сущность изучаемого социального явления.

По логическому содержанию таблица представляет собой «ста­тистическое предложение», основными элементами которого яв­ляются подлежащее и сказуемое.

Подлежащим таблицы называется объект, характеризующийся цифрами. Это могут быть одна или несколько совокупностей, от­дельные единицы совокупностей (фирмы, объединения) в порядке их перечня или сгруппированные по каким-либо признакам (от­дельные территориальные единицы или временные периоды в хро­нологических таблицах и т.д.). Обычно подлежащее таблицы да­ется в левой части, в наименовании строк. В социологической таблице подлежащим выступает конкретная переменная, которая подвергается анализу (рис. 5.1).

Сказуемое— система показателей, которыми характеризуется объект изучения, т.е. подлежащее (или то, что именно говорится в статистическом предложении о подлежащем). Сказуемое формирует верхние заголовки и составляет содержание граф с логически пос­ледовательным расположением показателей слева направо4.

Заголовок — название таблицы, которое раскрывает структуру группировки описываемых переменных либо характер связи (за­висимости) между двумя и более переменными. Наряду с этим в названии (или чаще в подзаголовке) иногда указываются общие для всех переменных единицы измерения (число ответов, процен­ты, средний балл и т.д.).

Все таблицы можно разделить на три вида: простые (линей­ные), групповые и комбинационные.

Простые таблицы представляют собою перечень (список) от­дельных значений той или иной переменной с количественной или качественной характеристикой каждой из них в отдельности. Поэтому иногда их называют также перечневыми. Примером про­стой таблицы может служить распределение опрашиваемой сово­купности по полу респондентов (табл. 5.1).

Таблица 5.1

Распределение респондентов по полу

Пол Частота Процент
Мужчины 46,1
Женщины 52,4
Не указали 1,6
Всего 100,0

Групповые таблицы обычно содержат группировку единиц совокупности по одному признаку, а комбинационные — по двум

и более признакам. В комбинационных таблицах, чтобы избежать излишней нагроможденное™ данных, затрудняющей их воспри­ятие, иногда опускают абсолютные величины (частоты) тех или иных значений переменных, оставляя лишь пропорции или про­центы. Примером комбинационной разработки статистической таблицы может служить табл. 5.2.

Таблица 5.2

Распределение рабочей молодежи по возрастам поступления на работу в

Москве и Московской области в 20-е гг.5 (в процентах к общей численности каждой половой группы)

Возраст(лет) По губернии По Москве
юноши девушки юноши девушки
до 12 7,4 3,8 12,0 4,7
13-15 48,1 43,7 59,2 56,5
16-18 44,5 52,5 28,8 38,8

Такая таблица являет собою уже нечто большее, нежели про­стой перечень данных. Она, с одной стороны, является как спо­собом, так и результатом определенной организации, системати­зации данных, а с другой — может стать удобным инструментом для анализа связей между тремя переменными — географическим положением, полом и возрастом.

Хорошо сконструированная таблица позволяет исследователю более четко представить и описать смысл и сущность изучаемого им социального явления.

Но что такое грамотно сконструированная таблица? Приведем основные правила построения статистических таблиц:

♦ таблица должна быть компактной и содержать только те исходные данные, которые прямо отражают исследуемое явле­ние — либо в статике, либо в динамике;

♦ следует избегать ненужной, второстепенной, бессодержатель­ной, не относящейся к данному объекту исследования информации;

♦ цифровой материал необходимо излагать таким образом, чтобы при анализе таблицы сущность явления раскрывалась чте­нием строк слева направо и сверху вниз;

♦ заголовок таблицы, а также названия граф и строк должны быть четкими, краткими, лаконичными;

♦ в заголовке должны быть отражены объект, признак, время и место совершения события;

♦ в социологических таблицах, отражающих результаты выбороч­ного опроса, в заголовок выносится доля от числа опрошенных (в % к общему числу опрошенных, к общему числу ответивших и т.д.);

♦ заголовки таблицы, граф и строк пишутся полностью, без сокращений;

♦ для облегчения чтения таблицы необходимо избегать боль­шого количества точек7 и запятых в названиях таблицы и граф;

♦ графы и строки в социологических таблицах не обязатель­но нумеровать;

♦ графы и строки должны содержать единицы измерения, со­ответствующие поставленным в подлежащем и сказуемом пока­зателям; при этом используются общепринятые сокращения еди­ниц измерения (чел., руб., кВт • ч и т.д.);

♦ информация, располагаемая в столбцах (графах) таблицы, завершается итоговой строкой, обозначаемой: всего, итого;

♦ если названия отдельных граф повторяются между собой, содержат повторяющиеся термины или несут единую смысловую нагрузку, то им необходимо присвоить общий объединяющий за­головок;

♦ лучше всего располагать сопоставляемую в ходе анализа информацию в соседних графах (либо одну под другой), что об­легчает процесс ее сравнения;

♦ для удобства чтения и работы числа в таблице следует про­ставлять в середине граф;

♦ числа целесообразно округлять с одинаковой степенью точ­ности (до целого знака, до десятой доли);

♦ отсутствие данных в разных случаях обозначается по-разно­му: а) если данная позиция (на пересечении соответствующих гра­фы и строки) вообще не подлежит заполнению, то ставится знак; «X»; б) когда по какой-либо причине отсутствуют сведения, то ставится многоточие «...» или «Нет свед.», или «Н. св.»; в) при отсутствии явления ставится знак — (прочерк);

♦ в случае необходимости дополнительной информации, разъясняющей отдельные позиции в таблице, к ней даются спе­циальные примечания (о сущности или ограничении сферы рас­пространения данного показателя, применяемой методологии, используемых источниках и т.д.).

Соблюдение приведенных правил построения и оформления статистических таблиц делает их основным средством представ­ления, обработки и обобщения статистической информации о состоянии и развитии анализируемых социально-экономических явлений.

Прежде чем перейти к методическим рекомендациям по созда­нию и редактированию таблиц, необходимо обратить внимание на некоторые важные моменты, связанные с их конструированием. Прежде всего, следует отметить, что наиболее рациональным было бы продумать конструкцию таблиц на стадии разработки методи­ческого раздела программы социологического исследования, а именно той его части, которая называется «Логическая схема об­работки и анализа данных». В этой части фактически и задается конструкция и формат таблиц. Обычно не возникает особых слож­ностей с конструкцией таблиц простых (линейных) распределе­ний. Что же касается комбинационных таблиц, то здесь хотелось бы дать некоторые методические рекомендации, исходя из прак­тического опыта проведения исследований.

Большинство комбинационных таблиц при расчетах в про­грамме SPSS формируется в ходе операции, именуемой кросста-буляция. Получаемые в результате кросстабы должны быть, как и любые другие таблицы, наглядны, обозримы и, по возможно­сти, размещаться в пределах одной страницы. Поэтому первая ре­комендация состоит в следующем: так как ориентация текста на странице в абсолютном большинстве случаев бывает «книжная», а не «альбомная» (т.е. страница больше по высоте, чем по ши­рине), нужно обращать внимание на соотношение числа значе­ний (вариантов) тех переменных, связь между которыми будет отражена в кросстабе. При этом мы советуем руководствоваться простым правилом: ту переменную, которая имеет больше воз­можных значений, лучше размещать по строкам, а ту, у которой значений меньше, — по столбцам. Попытаемся показать это на конкретном примере.

По результатам опроса, проведенного студентами НКИ в Ниж­нем Новгороде в декабре 2001 г. и посвященного изучению оце­нок ситуации, сложившейся в течение первых 100 дней после выборов нового губернатора, мы решили выявить связь между возрастом избирателей и уровнем их электоральной активности (по факту реального участия во втором туре выборов губернато­ра). Для этого мы производим кросстабуляцию («перекрестное» наложение распределений ответов на вопросы о возрасте и об уча­стии в выборах). Переменная «участие», согласно анкете, имела 3 значения (да, нет, не помню); переменная «возраст» — 5 значений 226

(до 30 лет; 30—39 лет; 40—49 лет; 50—59 лет; 60 лет и старше). Та­ким образом, таблица может иметь два различных вида в зависи­мости от расположения переменных. Если мы разместим по стро­кам переменную «участие», а по столбцам переменную «возраст», то таблица будет иметь 3 строки и 5 столбцов; а если точнее, то 6 строк и 8 столбцов (6x8), поскольку нужно добавить и по стро­кам, и по столбцам, во-первых, размещение сказуемых, во-вто­рых, варианты «не дали ответа», в-третьих, суммы. Если же мы поступим наоборот, т.е. разместим по строкам переменную «воз­раст», а по столбцам переменную «участие», то таблица будет иметь 7 строк и 5 столбцов (7x5). Реально эти два варианта раз­мещения будут выглядеть так, как показано в табл. 5.3а и 5.36.

Таблица 5.3а

  Зависимость участия в выборах от возраста    
Участие в выборах Возраст   Всего
Нетответа до 30 лет 30—39 лет 40—49 лет 50-59 лет 60 лет и старше
Нет ответа    
Процент 36,4   0,6 1,0   1,0 1,0
Да
Процент 36,4 50,4 60,4 60,5 81,0 72,0 60,4
Нет
Процент 18,2 47,0 34,9 37,4 15,5 27,0 36,2
Не помнят  
Процент 9,1 2,7 4,1 1,0 3,6   2,4
Всего
Процент 100,0 100,0 100,0 100,0 100,0 100,0 100,0

Вообще характер размещения переменных по строкам или столг бцам особо принципиального значения не имеет, однако нам кажет-ся, что второй вариант предпочтительнее в силу своей компактнос-ти и лучшей обозримости. Хотя, конечно, во многом это дело вку-са, и преимущества второго варианта становятся более очевидны, когда одна из переменных имеет достаточно большое число возмож-ных значений. Однако для дальнейшего анализа необходимо принять во внимание еще одно правило: внимательно отслеживайте, где вы размещаете независимую переменную, и соответственно этому зада-вайте команду на расчет процентов в кросстабе.

Напомним процедуру расчетов в SPSS. Учитывая, что в табл. 5.3а независимая переменная — в данном случае возраст — размещается по столбцам, при расчете кросстабуляции в программе SPSS мы, перед тем как нажать клавишу <ОК>, вошли в диалоговое окно

Options и там задействовали опцию Column percentage(Процент по столбцам), затем, нажав клавишу <Continue>, вернулись в окно Crosstabs и лишь после этого нажали клавишу <ОК>. Соответствен­но, поскольку в табл. 5.36 независимая переменная размещается по строкам, мы выбирали опцию Row percentage(Процент по строкам).

Таблица 5.369

Зависимость участия в выборах от возраста

Возраст Участие в выборах Всего
Нет ответа Да Нет Не помнят
Нет ответа
Процент 36,4 36,4 18,2 9,1 1,3
До 30 лет  
Процент   50,4 47,0 2,7 32,1
30—39 лет
Процент 0,6 60,4 34,9 4,1 20,5
40—49 лет
Процент 1,0 60,5 37,4 1,0 23,7
50—59 лет  
Процент   81,0 15,5 3,6 10,2
60 лет и старше  
Процент 1,0 72,0 27,0   12,2
Всего
Процент 1,0 60,4 36,2 2,4 100,0

5.2. Техника редактирования таблиц10

Существует целый ряд особенностей редактирования данных, полученных при расчетах с помощью пакета SPSS, в программе текстового редактора Microsoft Word. Дело в том, что результаты своих расчетов пакет SPSS выдает в формате MS-DOS. Получен-* ный в SPSS файл накопления полученных результатов расчетов (возникающий в окне под названием Output") сохраняется с рас­ширением (.1st) — для версии 6.012 или (.Us) — для версии 4.0. По­этому перед тем как открыть его из программы Word, необходи-228

мо в окошке «Тип файлов» выбрать вариант «все файлы», иначе в перечне файлов он просто не отразится. После того как, выбрав нужный файл, вы нажмете клавишу «открыть», программа Word сделает запрос относительно того формата, в который необходи­мо преобразовать этот файл. В диалоговом окне «Преобразование файла» следует выбрать вариант «Текст DOS».

Приведем пример процедур (с указанием последовательности операций) редактирования конкретных таблиц. В упоминавшемся выше опросе по поводу изучения тех оценок, которые дают ниже­городцы сложившейся послевыборной ситуации, первый вопрос анкеты вместе с вариантами ответов звучал следующим образом:

1. К какому типу избирателей Вы себя относите?

1 — участвую обычно во всех выборах.

2 — участвую только в тех выборах, когда хорошо известны кандидаты и их предвыборные программы.

3 — участвую или не участвую в выборах по случайным при­чинам (настроение, погода, занятость домашними делами и т.д.).

4 — обычно не участвую ни в каких выборах.

После того как мы проделаем все описанные выше манипуляции по загрузке файла в окно Word, соответствующее распределение от­ветов по первой переменной будет выглядеть следующим образом13:

VAR00001

Valid Cum Value Label Value Frequency Percent Percent Percent

  0,00 1,3 1,3 1,3
  1,00 31,7 31,7 33,0
  2,00 27,5 27,5 60,5
  3,00 24,5 24,5 85,1
  4,00 14,9 14,9 100,0
  Total 100,0 100,0  
Valid cases Missing cases  

Понятно, что в таком виде полученные данные анализировать было бы довольно трудно, в особенности человеку, не искушенно-; му в прикладной социологии. Поэтому необходимо преобразовать их

в привычный табличный вид. Вначале предстоит провести несколь­ко подготовительных операций. Два последних столбца содержат такие данные, которые нам в дальнейшем не пригодятся14. Избавить­ся от них можно, вырезав (удалив) этот фрагмент. Мы рекомендуем такой прием редактирования: нажмите клавишу <Alt>, после чего выставьте курсор в нижний (или верхний) правый угол последней колонки и, не отпуская клавиши <Alt>, щелкните левой клавишей мыши и, удерживая ее в этом положении, обведите обе колонки (выделив тем самым фрагмент, подлежащий удалению):

VAR00001

Value Frequency Percent Percent Percent
0,00 1,3 1,3 1,3
1,00 31,7 31,7 33,0
2,00 27,5 27,5 60,5
3,00 24,5 24,5 85,1
4,00 14,9 14,9 100,0
Total 100,0 100,0  
      _________ _________

Valid

Cum

После этого с помощью клавиши <Del> удалите выделенный фрагмент. Точно так же удаляется и лишнее поле слева. Теперь можно удалить лишние знаки и целые строки, после чего заготовка таблицы приобретет такой вид:

VAR00001

Value Frequency Percent

0,00 1,3
1,00 31,7
2,00 27,5
3,00 24,5
4,00 14,9
Total 100,0

Учитывая, что надписи в таблице должны быть сделаны по-русски, необходимо изменить англоязычные термины на рус-230

ские. Поскольку файл обычно содержит не одно распределение, а сразу все, лучше проделать соответствующую замену одновре­менно для всего файла. Поэтому выберите команду Правка -» Заменить;в окошке «Найти» наберите «Value», а в окошке «За­менить» — «Вариант ответа»; затем нажмите клавишу «Заме­нить все». Проделайте аналогичную операцию для всех осталь­ных пар замены:

Frequency -> Частота

Percent -> Процент

Total -> Всего.

Изменив характер шрифта (лучше выбрать Times New Roman) и задав соответствующий размер, вы получите такой вид:

Вариант ответа Частота Процент

0,00 1,3
1,00 31,7
2,00 27,5
3,00 24,5
4,00 14,9
  100,0

Всего

Теперь поставьте знак [; ] (точка с запятой) в конце двух пер­вых столбцов (в последнем столбце не ставить!):

г

Вариант ответа; Частота; Процент

0,00; 11; 1,3

I 1,00; 261; 31,7

| 2,00; 226; 27,5

3,00; 202; 24,5

4,00; 123; 14,9

L

Всего

823;

100,0

Выделите все три колонки и с помощью команды Таблица-> Добавить таблицупоместите тем самым обрабатываемый матери­ал во вновь созданную таблицу:

Вариант ответа Частота Процент
0,00 1,3
1,00 31,7
2,00 27,5
3,00 24,5
4,00 14,9
Всего 100,0
Таблица будет лучше выглядеть, если в двух последних колон­ках мы произведем выравнивание «по центру»:
Вариантответа Частота Процент
0,00 1,3
1,00 31,7
2,00 27,5
3,00 24,5
4,00 14,9
Всего 100,0

Заключительная часть работы состоит в том, чтобы: 1) заменить номера вариантов ответов на их содержание, заданное анкетой (заменив при этом в формулировках вопросов первое лицо на тре­тье и, по возможности, сократив, выразив самую суть); 2) проста­вить ее порядковый номер и 3) сформулировать заголовок табли­цы. Для придания более представительной и компактной формы можно также выполнить команду Таблица-> Автоформат-» Сет­ка 1.Таблица приобретет окончательный вид:

Таблица 5.4

Самоидентификация по типу избирателей

Вариантответа Частота Процент
Не дали ответа" 1,3
Участвуют во всех выборах 31,7
Участвуют, когда известны кандидаты 27,5
Участвуют по случайным причинам 24,5
Не участвуют ни в каких выборах 14,9
Всего 100,0

Теперь, как нам кажется, табл. 5.4 стала вполне понятной, обо­зримой и удобной для анализа методами описательной статистики16.

Несколько иначе выглядит процедура редактирования в тексто­вом редакторе Word комбинационных таблиц, рассчитанных сред­ствами SPSS версий 4.0 и 6.017. Рассмотрим этот процесс для крос-стаба, отражающего в том же исследовании связь между возрас­том и участием в выборах. Кросстабуляция в данном случае

представляла собою наложение двух переменных — участие в вы­борах (var0000218) и возраст (varOOO55).

Предположим, что в упомянутом выше исследовании вы на­мереваетесь проверить гипотезу о наличии связи между возрастом опрошенных (респондентов) и их участием в выборах. Для этого вы производите кросстабуляцию соответствующих переменных — участие в выборах (по колонкам) и возраст (по строкам). В анке­те соответствующие вопросы выглядели так:

Наши рекомендации