Методы представления наглядности статистических данных
Основные типы диаграмм
Линейные диаграммы — наиболее распространенный вид диаграмм. Применяется для отображения практически любых статистических величин. (рис. 1)
Рисунок 1. Динамика численности населения России с 1897 г. по 2004 г. |
Столбиковые диаграммы представляют собой изображения различных величин в виде расположенных в высоту прямоугольников одинаковой толщины и разной высоты. Построение столбиковой диаграммы требует только одной масштабной шкалы, которая задает высоту столбика. Такие диаграммы применяются для отображения практически всех абсолютных и производных статистических показателей (рис. 2).
Рисунок 2. Динамика заболеваемости взрослого населения
Красноярского края в 2001-2006 гг.
Особым типом столбиковых диаграмм, который используется для иллюстрации плана, графика работ по какому-либо проекту является ленточная диаграмма (диагра́мма Га́нта). При этом, каждый раздел плана изображается в виде столбика, пропорционального по размерам его длительности.
Для отражения изменений экстенсивных показателей более целесообразно использовать внутристолбиковые диаграммы (рис. 3).
Рисунок 3. Структура посещений врачей поликлиник Красноярского края в 1999-2003 гг.
Показательной для отображения экстенсивных показателей является секторная диаграмма (рис. 4).
Рисунок 4. Структура причин смерти в Красноярском крае в 2006 г.
Для отображения сезонных и циклических явлений оптимальным вариантом является радиальная диаграмма (рис. 5).
Рисунок 5. Зависимость расстояния проживания от реки Енисей и числа посещений по поводу болезней лор-органов и органов дыхания на 1000 детей г. Красноярска (в 2005 году)
Главным критерием выбора той или иной диаграммы для отображения статистических показателей является наглядность и удобство анализа результатов. Например: если анализируется сравнительная заболеваемость мужчин и женщин, то более целесообразно представить попарно сгруппированные показатели мужчин и женщин.
Картограмма – это географическая карта или ее схема, на которой приведены определенные статистические данные (с помощью цветовой гаммы или различной штриховки территорий).
Картодиаграмма – это сочетание географической карты или ее схемы с различными диаграммами, представляющими статистические данные, относящиеся к определенным территориям.
Коробчатую диаграмму называют «коробкой с усами», «ящиком с усами», а по-английски boxplot. Данный тип визуализации данных одновременно изображает пять величин, характеризующих вариационный ряд: минимальное значение, первую квартиль (или 25 процентиль), медиану, третью квартиль (75 процентиль), максимальное значение. Таким образом, польза коробчатой диаграммы заключается в том, что на ней не только представлены основные характеристики распределения, но и доступен для оценки размах вариации, и ее асимметрия. Коробчатые диаграммы очень компактны, с их помощью удобно сравнивать характер распределения в нескольких рядах.
Коробчатая диаграмма может быть как вертикальной, так и горизонтальной. Основой ее является прямоугольник, нижняя (левая, если график горизонтальный) сторона – это нижний квартиль (Q1), а верхняя (правая) – верхний квартиль (Q3). Высота (длина) прямоугольника, таким образом, равна межквартильному интервалу (IQR). Черта поперек прямоугольника – это медиана распределения (рис. 6).
Рисунок 6. Особенности коробчатой диаграммы
Гистограмма характеризует распределение количественного признака, применяется для графического изображения интервальных рядов распределения. Внешне она представляет собой многоугольник, построенный с помощью смежных четырехугольников. Ширина основания каждого четырехугольника соответствует границам группы вариант. Высота столбика определяется частотой группы. На шкале «Х» в выбранном масштабе откладываются интервалы значений переменной. Интервалы не должны перекрывать друг друга или иметь пропуски возможных значений переменной. На оси «Х» указываются центр или границы каждого интервала. Ось «Y» служит шкалой плотности, т.е. на ней откладываются абсолютные (число наблюдений) или относительные значения (доля, процент наблюдений) на единицу шага значения переменной. В простейшем варианте (при условии одинаковой ширины интервалов на оси Х) шаг целого интервала принимается за 1.
Общее число (или долю) наблюдений характеризует не высота столбца, а его площадь. Высота столбца отражает плотность распределения признака в определенном интервале его значений. Площадь всех столбцов гистограммы должна равняться 100% (при относительной шкале плотности) или общей сумме наблюдений (при абсолютной шкале плотности).
Одновременное изображение на гистограмме кривой нормального распределения позволяет зрительно оценить, насколько эмпирическое распределение отличается от нормального (рис. 7).
Рисунок 7. Пример гистограммы с кривой нормального распределения: гистограмма возраста обследованных лиц.