Графическое представление данных
Графическое представление данных — это наиболее наглядное изображение полученного распределения результатов исследования. Оно дает возможность с одного взгляда определить структуру и состав изучаемой совокупности, структурные сдвиги, тенденции изменений при переходе от одних значений переменных к другим и т.д. При анализе социологической информации наиболее часто используют такие виды графического представления данных, как гистограмма, полигон и кумулята распределения, а также различные виды диаграмм (столбиковые, ленточные, секторные).
Гистограмма — это графическое изображение распределения, построенного чаще всего по интервальной шкале. Гистограмма представляет собою ряд смежных прямоугольников, построенных на одной прямой: площадь каждого из них пропорциональна частоте нахождения данной величины в интервале, на котором построен данный прямоугольник. При равных интервалах плотности распределения пропорциональны частотам, которые и откладываются по оси ординат. Пример гистограммы, отражающей распределение опрошенных респондентов по возрасту, приведен на рис. 61.
На этой гистограмме, построенной в Microsoft Excel в соответствии с данными табл. 41, удельный вес каждой возрастной категории в общем объеме выборочной совокупности выражается площадью прямоугольника, а общая площадь равна 1 (100%). Если бы мы строили гистограмму на основе абсолютных значений частот, то общая форма ее не изменилась бы, но в этом случае площадь каждого прямоугольника означала бы число лиц данной категории, а общая площадь была бы равна численности опрашиваемой совокупности
Рис. 61 Распределение опрошенных по возрасту 194
(в данном случае — 812, поскольку мы не привели на гистограмме данные о тех, кто не указал в анкете своего возраста). Мы видим, например, что поскольку численность возрастной группы респондентов до 30 лет почти втрое больше численности респондентов в возрастном интервале 50—59 лет, то это выражается и в соответствующем соотношении высот столбцов.
Таблица 41 Распределение респондентов по возрастным группам
Возрастная группа | Частота | Процент |
до 30 лет | 32,1 | |
30—39 лет | 20,5 | |
40—49 лет | 23,7 | |
50—59 лет | 10,2 | |
60 лети старше | 12,2 J | |
Не указали | 1,3 | |
Всего ------------------------------------------ | 100,0 |
Обратим внимание на одну важную особенность гистограммы: протяженность по оси абсцисс должна соответствовать размеру отображаемого интервала. Этим гистограмма отличается, к примеру, от столбчатой (или столбиковой) диаграммы, где ширина столбца значения не имеет и просто фиксирует определенную позицию.
Перевод обычной таблицы в гистограмму сокращает мыслительный про цесс, позволяет быстро и точно оценить ситуацию в целом. Гораздо реж* встречаются ситуации, где гистограмма выполняет основную, а не вспомо гательную роль. Если, к примеру, сравнивают удельный вес позитивных i негативных качеств у человека или социальной группы, располагая положи тельные выше горизонтальной оси, а негативные ниже, то можно получит! прекрасную, почти живописную картину духовного мира человека. Подоб но тому, как деревья отражаются в воде, так и негативные черты симметричн< отражаются по ту сторону береговой линии, представленной осью ОХ. По хожую картину получили В.Ф.Петренко и О.В.Митина, исследовавшие сте реотипы поведения россиянок и американок методом психосемантическоп анализа25. Основной формой обработки исходных матриц данных у них быш сопоставление ролевых позиций путем вычисления коэффициентов корре ляций для пар ролевых позиций, т.е. вертикальных столбцов в матрице ран говых данных отдельно для российской выборки, отдельно для американ ской. В отношении брачных предпочтений у них получился график, пред ставленный на рис. 62.
Полигон распределения используется преимущественно для графическое отображения распределений дискретных рядов (табл. 42). Эти графики стро ятся также в прямоугольной системе координат, в которой на горизонталь ной оси хуказываются значения (или ранг) переменной, а на вертикально оси у отмечается общая численность или доля респондентов (в процентах; обладающая тем или иным значением.
Петренко В.Ф., Митина О.В. Россиянки и американки: стереотипы поведения (психосемантичес кий анализ) // Социологические исследования. 2001. № 8. С. 70-81.
Таблица 42 Социально- профессиональный статус
(агегория | Частота | Процент |
руководитель | 3,0 | |
Предприниматель, фермер | 4,6 | |
"осударственный служащий | 6,1 | |
Дипломированный специалист промышленности | 2,8 | |
Дипломированный специалист сельского хозяйства | 1,1 | |
Рабочий государственного предприятия | 10,3 | |
Рабочий частного предприятия | 15,9 | |
Колхозник | 1,0 | |
Непроизводственная интеллигенция (учитель, врач) | 5,8 | |
Военнослужащий, работник правоохранительных органов | 2,7 | |
Рабочий промышленного предприятия | 6,2 | |
Неработающий пенсионер | 11,5 | |
Студент, учащийся | 17,6 | |
Домохозяйка | 4,7 | |
Безработный | 3,3 | |
Другие | 1,8 | |
Неуказали | 1,5 | |
Всего | 100,0 |
Полигоны могут использоваться и для изображения интервальных рядов. В этом случае ординаты, пропорциональные частоте каждого интервала, восстанавливаются перпендикулярно оси абсцисс из точек, соответствующих середине каждого интервала. Концы каждой из таких ординат соединяются прямыми линиями с концами соседних ординат (рис. 63).
Кумулята26. Это еще один из способов графического изображения вариационных рядов. При построении кумуляты на оси абсцисс откладываются значения дискретных признаков (либо границы интервалов), а на оси ординат — накопленные частоты, соответствующие верхним границам частотных интервалов. Таким образом, отличие кумуляты от гистограммы состоит в том, что на графике кумуляты ординаты, пропорциональные частотам, последовательно накладываются одна на другую, так что высота последней ординаты соответствует сумме высот всех столбцов гистограммы. Ординаты соединяются прямыми линиями.
Мы могли бы использовать в качестве примера построения кумуляты последний столбец (Cum Percent), вырезанный нами из начальной заготовки для табл. 34. Однако более наглядно выглядит кумулята, изображенная на рис. 64 — на основе распределения ответов на вопрос о среднедушевых доходах, задававшийся в том же исследовании.
Кумулята позволяет быстро определить удельный вес той доли совокупности, которая находится выше или ниже некоторой заданной величины значения переменной. Так, по данным рис. 64, доля семейств, в которых месячный Доход на одного члена семьи не превышает 2 тыс. руб., составляет 72,1 %.
От лат. cumulatio — накопление.
19В
Рис. 62. Брачные предпочтения российских и американских женщин
Примечание к рис. 62. Суждения, отражающие брачные предпочтения женщин, возможные в обеих странах:
1. Выйти замуж за человека более высокого социального статуса27.
2. Выйти замуж за простого человека, хорошего хозяина, живущего «земными» проблемами.
3. Выйти замуж за человека другой национальности.
4. Выйти замуж за любимого человека с очень низкими доходами без перспективы их увеличить.
5. Выйти замуж за бизнесмена.
6. Выйти замуж за человека, посвятившего свою жизнь науке.
7. Выйти замуж за человека искусства (музыканта, поэта, артиста).
8. Выйти замуж за иностранца и уехать жить за границу.
9. Выйти замуж за военнослужащего.
10. Выйти замуж за политического деятеля.
11. Выйти замуж за рабочего.
12. Находиться на «содержании» у состоятельного мужчины.
13. Выйти замуж за «звезду» (спорта, эстрады, кино).
14. Выйти замуж без любви, по расчету.
15. Выйти замуж за фермера.
16. Выйти замуж за человека другой расы.
17. Не выходить замуж, полагая, что лучше прожить жизнь одной.
18.Выйти замуж за глубоко религиозного человека.
19.Выйти замуж за представителя криминальных структур.
Отметим как факт, что при ответах на большинство вопросов анкеты российские женщины были более категоричны (давали более выраженные оценки и реже использовали промежуточные баплы) по сравнению с американками. Эта тенденция отчетливо продемонстрирована на рисунке. Столбцы, отображающие оценки, данные российскими женщинами, существенно больше по сравнению с соответствующими столбцами американской выборки.
Рис. 63. Полигон распределений социально-профессионального статуса
Диаграмма2* — это обобщенное название самых разнообразных графических изображений, наглядно показывающих соотношение каких-либо величин. Диаграммы по одним и тем же распределениям и вариационным рядам могут принимать множество различных видов и форм. Если вы откроете окно Мастер диаграммв программе Microsoft Excel, вы убедитесь, что там предлагается достаточно большой их набор: гистограммы, линейчатые, графики, круговые, точечные, кольцевые, пузырьковые и т.п. Выбор того или иного варианта — дело вкуса и чувства меры, поскольку в конечном счете каждая из них лишь по-разному — более или менее убедительно и, главное, наглядно — отображает выраженные в числовой форме ряды этих вариантов.
28 От греч. diagramma — изображение, рисунок.
Рис. 64. Кумупята распределений среднедушевого дохода22
Последняя ордината находится чуть ниже уровня 100%, поскольку на кумуляте мы не отразили 2,: тех, кто не дал никакого ответа на вопрос об уровне среднедушевого дохода.