Графический метод обработки статистических данных
Какова же роль графического метода в статистическом анализе, какие преимущества дает он в сравнении с традиционным табличным методом?
Познавательная ценность статистических графиков объясняется их способностью отображать реальную действительность в простом, ясном и наглядном виде. Визуальная интерпретация объективных статистических показателей позволяет облегчить познание предмета исследования, делает его более осязаемым. Т.о., статистические графики могут дать новое знание о предмете исследования, которое в исходном цифровом материале непосредственно не проявляется. Выявление закономерностей, присущих тем или иным явлениям, факторов, их определяющих, дифференциация этих явлений во времени и пространстве - задачи, эффективно решаемые с использованием графического метода.
П.1 Основные элементы графика. Правила построения статистических графиков
Рассмотрим основные элементы статистического графика.
Поле графика - пространство, где расположены геометрические знаки, образующие график. Полехарактеризуется его форматом, т.е. размером и пропорциями (соотношением сторон). Размер графика выбирается в соответствии с его назначением (демонстрация в аудитории, иллюстрация в статье, дипломной работе и т.д.). Пропорции графика определяются законами геометрической гармонии и требованием обеспечения неискаженного зрительного восприятия графического образа. Неудобны для восприятия графики сильно удлиненной формы (как в вертикальном, так и в горизонтальном направлениях).
Геометрические знаки – знаки-символы, изображающие статистические величины, составляющие графический образ. Это -точки, прямые и кривые линии и их отрезки, части плоскости (круги, прямоугольники, квадраты), объемные фигуры (кубы, параллелепипеды, шары), негеометрические фигуры (знаки-символы, изображения предметов). Выбор вида геометрических знаков определяется характером исходной информации (счетные множества- точки, динамика явлений - линейные графики, сравнение абсолютных и относительных величин- плоскостные и объемные фигуры и т.д.), а также основной целью, заложенной в данный график .
Пространственные ориентиры задаются координатной сеткой (диаграммы) или контурными линиями (картограммы). Координатная сетка образуется пересечением линий, проходящих через деления вертикальной и горизонтальной шкал. Наиболее часто применяемая система координат - декартовая (прямоугольная), реже - полярная (круговые графики). На горизонтальной шкале прямоугольных диаграмм обычно размещают независимые переменные (в т.ч. время), на вертикальной - зависимые переменные.
Основная горизонтальная (нулевая) линия обязательно должна быть показана на графике (координатные оси для координатных графиков и «платформа» для столбиковых диаграмм) и для наглядности выделена толщиной. Если уровни изображаемых показателей таковы, что основная часть координатной сетки остается неиспользованной, то на шкале делается разрыв (≀≀,≈), исключающий ненужную часть сетки, но с обязательным указанием нулевой линии. Невключение нуля в вертикальную шкалу является распространенной ошибкой, искажающей изображение, что может привести к неправильному выводу.
Масштабные ориентиры задаются масштабными шкалами (в координатных графиках) или масштабными знаками (в картограммах). При выборе масштаба на вертикальной и горизонтальной шкалах следует добиваться правильной пропорции, соотношения между ними. Чрезмерное укорочение или удлинение вертикальной или горизонтальной шкалы также искажает изображение и может привести к неправильному выводу. Получение оптимальной пропорции достигается подбором (пробное построение нескольких вариантов) или опытностью составителя диаграммы.
Виды масштабных шкал: непрерывные и прерывные. Непрерывная шкала применяется для непрерывно меняющихся величин (всем точкам шкалы соответствует какое-либо число, а все промежуточные значения могут быть интерпретированы). Прерывная (порядковая) шкала - шкала с величинами, промежуточные значения которой не интерпретируются. Так, например, если деления шкалы представлены помесячными данными - январь, февраль и т.д., то точка между январем и февралем ничего не обозначает, т.к. масштаб не предполагал дневных данных. В этих случаях графическое изображение не непрерывно. Оно представляет собой, как правило, отдельные точки и их нельзя соединять непрерывной линией. В дипломных работах часто встречаются ошибки такого рода.
Экспликация состоит из названия графика и объяснения знаков-символов. Название графика должно быть лаконичным и ясным, отвечающим на три основных вопроса: что, где, когда. Пояснения к вертикальным и горизонтальным шкалам должны раскрыть содержание отображаемых показателей, единицы их измерения.
П.2 Композиция статистического графика.
Под композицией графика понимается сочетание всех его элементов. Правильная композиция предполагает:
- тщательно продуманный отбор из имеющегося цифрового статистического материала тех данных, которые будут изображены на графике (таким образом, далеко не все полученные данные следует изображать графически);
- выбор формата (размера и пропорций) графика;
- выбор вида графика - того, который по мнению исследователя наиболее ярко отражает полученные данные;
- подбор масштаба (масштабных шкал и знаков);
- правильное расположение и сочетание всех элементов графика.
Создание правильной композиции должно преследовать главную цель - получить компактное простое и логичное изображение описываемого явления, дающее цельное представление о нем и, в то же время, подчеркивающее при необходимости те или иные особенности этого явления (состав, структуру, дифференциацию, динамику и т.п.).
Немаловажной задачей композиции графика является художественная, эстетическая сторона его оформления. График должен привлекать внимание, обеспечивая в то же время легкость его прочтения и усвоения.
Чтобы композиция графика отвечала отмеченным требованиям, следует при построении графиков соблюдать определенные правила.
П.3 Основные правила построения графиков.
1.Название графика должно быть ясным и полным, отражающим содержание и имеющим при необходимости особые пояснения.
2.Масштаб на горизонтальной и вертикальной шкалах должен быть оптимальным, не искажающим реальные соотношения анализируемых явлений.
3.Надписи и цифры располагаются, как правило, в нижней или правой части диаграммы.
4.Основной ряд полученных диаграмм следует располагать слева направо. Горизонтальную шкалу (по оси абсцисс) строить слева направо, вертикальную (по оси ординат)- снизу вверх.
5.Цифры шкалы следует наносить слева и снизу или вдоль осей.
6.Полезно включать в диаграммы числовые значения, соответствующие отдельным точкам кривой или математическую формулу кривой.
7.Если числовые данные не включены в диаграммы, желательно их дать рядом в табличной форме.
8.Нулевые линии (как вертикальную, так и горизонтальную) рекомендуется выделять на чертеже отдельно от всех других линий координатной сетки. Если по характеру данных это неудобно, то нужно показать нулевую линию посредством «разрыва» диаграммы.
9.Густота координатной сетки должна быть оптимальной, не затрудняющей чтения диаграммы.
10.Линии на диаграмме следует выделять от линий координатной сетки (толщиной или цветом). Т.о. самая заметная линия- это линия самой диаграммы, немного тоньше - нулевая линия и самые незаметные- линии координатной сетки.
11.Если графики отражают серию наблюдений, рекомендуется ясно обозначать все точки, соответствующие отдельным наблюдениям.
12.Во всех случаях, когда это возможно, сравниваемые величины изображаются с помощью линий или полос и столбиков одинаковой ширины, но не площадей или объемов.
П.4 Виды и формы (классификация) графических изображений. Техника построения и анализа различных статистических графиков.
На протяжении развития графического метода разработано большое число видов и форм графических изображений. Этот процесс продолжается и поныне. В зависимости от целей и назначения, характера применяемых графических образов различают несколько видов графиков.
1.Показательные графики или сравнительные диаграммы: диаграммы простого сопоставления; диаграммы структуры; графики динамических рядов; изобразительные диаграммы.
2.Аналитические графики математической статистики: кривые и поверхности распределения (огивы, кумулянты, полигоны и гистограммы); выравнивающие и интерполяционные кривые; кривые эмпирических закономерностей.
3.Статистические карты: картограммы, картодиаграммы.
В свою очередь, эти основные виды графиков имеют многообразие подвидов и форм в зависимости от способа построения, вида масштабных шкал и знаков, графических форм и образов.
Рассмотрим подробнее только некоторые из видов статистических графиков, которые чаще всего используются при изображении данных, полученных в ходе психолого-педагогических исследований.
П.5 Показательные графики и сравнительные диаграммы.
Наиболее широко известны и часто применяются линейные графики, линейные, столбиковые, круговые (секторные) и векторные диаграммы.
При помощи линейного графика можно передать изменения какого-либо признака рядом чисел. Для сравнения двух или нескольких рядов чисел они обычно наносятся на одни и те же оси координат.
Рассмотрим конкретный пример, типичный для психолого–педагогических исследований. Предположим, что для проверки эффективности предлагаемого метода в двух классах - контрольном и экспериментальном- был проведен контрольный срез. Детям предложили решить 15 заданий. На рисунке 1 изобразим график, показывающий количество учащихся (в %) в контрольном и экспериментальном классах, давших верные ответы на различные виды заданий.
Соответствующий линейный график имеет вид:
Рис.1 Сравнительная линейная диаграмма количества учащихся, давших верные ответы на задания.
На приведенном здесь графике по оси х откладывали число заданий, по оси у – процент правильных ответов. Сравнительный анализ этих графиков позволяет выявить ряд особенностей усвоения учащимися материала: данные кривые распределения свидетельствуют о неоднородности состава учащихся этих групп; в целом, кривая распределения экспериментального класса расположена под кривой распределения контрольного класса и только поднимается при значениях х =14 и х=15, причем весьма значительно (это значит, что большинство детей экспериментального класса решили по 14 или 15 заданий).
Таким образом, это свидетельствует о том, что использование экспериментальной методики дает более высокие результаты.
Данные исследования можно изобразить в виде линейной диаграммы.
Допустим, в результате проведения серии контрольных работ получены следующие данные:
Таблица 5.
Номер контрольной работы | |||||
Справились с заданиями (в %) |
Рис. 2 Линейная диаграмма результатов серии контрольных работ.
На рисунке 2 дана линейная диаграмма качества знаний учащихся. По оси х откладываем номера контрольных работ, по оси у - количество детей, справившихся с данной контрольной работой ( в %).
Большую помощь подобные графики могут оказать в выявлении типовых ошибок. Для этого по оси абсцисс откладываются номера заданий, а по оси ординат - процент учащихся, допустивших ошибки в ответах на эти задания (или наоборот - давших правильные ответы). Для большей наглядности эти данные можно соединить ломаной линией, хотя следует помнить, что промежуточные данные при этом истолковать никак нельзя (рисунок 3).
Рис.3. Диаграмма результатов выполнения заданий контрольной работы
Здесь показаны данные о проценте детей, давших верные ответы на задания.
Из этого графика видно, что дети успешнее всего справились с заданиями 2,9 и 10 (относительные максимумы диаграммы), а наиболее трудными оказались для обучаемых задания 5,7 и 8 (относительные минимумы диаграммы). Именно их и следует проанализировать.
Линейная диаграмма очень наглядна и для сравнения результатов по двум вариантам тестов, если перед нами задача проверки их идентичности (т.е. включение равнотрудных заданий в тот и другой варианты). В этом случае, данные числа ошибок по каждому типу заданий должны быть близкими. Рассмотрим рисунок 4.
По оси абсцисс отложим номера заданий, по оси ординат - % ошибочных ответов. В случае же резкого расхождения ломаных линий над каким-либо номером задания мы имеем несовпадение заданий данного типа по трудности. Эти задания следует либо изменить, либо исключить из теста.
Рис.4. Сравнительная линейная диаграмма результатов контрольного среза.
Диаграммы в виде горизонтальных полос или вертикальных столбиков - наиболее простой и достаточно эффективный для анализа вид графических изображений. Применяются достаточно часто в психолого-педагогических исследованиях для сравнения уровней показателей по различным единицам, группам, для анализа состава и структуры по ряду объектов и в динамике.
Основа сравнения в полосовых и столбиковых диаграммах - линейная (одномерная). Длины полос (высоты столбиков) или их составляющих пропорциональны величине изображаемых показателей. Ширина же полос и столбиков и промежутков между ними не имеет специального значения (произвольная), но должна быть одинаковой в пределах одной диаграммы. Обычно придерживаются правила, чтобы ширина промежутков была вдвое больше ширины самих полос. Рекомендуется включение в диаграмму масштабной шкалы.
Рассмотрим пример построения столбиковой диаграммы. Детям экспериментального класса предлагалось назвать любимые школьные предметы (допускалась возможность неоднозначного ответа).
Результаты опроса следующие:
Предмет | Математика | Природоведение | Русский язык | Физкультура |
% детей, указавших данный предмет |
В этом случае столбиковая диаграмма имеет следующий вид:
Рис.5. Столбиковая диаграмма, отражающая предпочтения детей в плане школьных предметов.
Рассмотрим еще один вид часто встречающихся графических изображений.
Круговые диаграммы эффективнее применять для анализа состава или структуры явлений. При этом, составные части целого изображаются секторами окружности соответствующей угловой величины (1% удельного веса принимается за 3,6 градуса длины окружности). Техника построения секторных круговых диаграмм предполагает соблюдение следующих рекомендаций. Последовательность размещения секторов определяется их величиной: самый крупный помещается сверху, справа от вертикальной оси симметрии круга, а остальные - по движению часовой стрелки в порядке уменьшения их угловой величины. Каждый сектор должен иметь четкое обозначение на экспликации. Допускается указание цифр в пределах секторов или вне окружности. При малом угле сектора экспликация к нему указывается стрелкой.
Рассмотрим пример построения круговой диаграммы. Представим с помощью нее успеваемость учащихся параллели по конкретному предмету. Пусть оценку «5» по данному предмету имеют 15% учащихся, оценку «4»- 38% учащихся, «3»- 44% и оценку «2»- 3%. Подсчитаем угловые величины соответствующих секторов:
L5=(360°·15)/100=54° ; L4=(360°·38)/100=136.8°≈137°
L3=(360°·44)/100=158.4°≈158°; L2=(360°·3)/100=10.8°≈11°.
Теперь можно изображать соответствующую круговую диаграмму:
Рис.6. Круговая диаграмма успеваемости по данному предмету.
Круговые диаграммы могут иметь различный вид. Например, в исследовании Г.В. Ивановой, когда проверялась эффективность тестового контроля знаний, учитывались дифференцированно результаты тестов по проверке различных видов языковых знаний (тесты группы А - лексики, В - правил произношения, С - орфографии и т.д.). Поэтому круг был разделен на секторы пропорционально тем долям, которые приходились на каждый вид тестов (А-25%, В-20%, С-20%, D-32%, E-3%). Внутри же каждого сектора заштриховывался процент учеников, давших неправильные ответы. В этом случае сам сектор принимался за 100%. Такого типа круговая диаграмма несет в себе очень большой информационный потенциал. Вместо того, чтобы рисовать пять отдельных круговых диаграмм, изображается только лишь одна.
Круговая диаграмма имеет такой вид:
Рис.7. Круговая диаграмма результатов тестового контроля знаний.
Сравнительные диаграммы объединяют большую группу графиков, решающих задачи представления результатов статистического наблюдения в сопоставимом виде и дающих возможность сравнения изучаемых явлений в том или ином аспекте - по величине, структуре, территории, в динамике и т.д. Очень часто сравнительные диаграммы используются студентами при написании дипломных работ при сопоставлении либо результатов констатирующего и контрольного срезов в одном классе, либо при сравнении результатов одного и того же среза, но в контрольном и экспериментальном классах. Важно помнить, что данные, изображаемые на сравнительных диаграммах должны быть сопоставимы.
Рассмотрим пример. Изобразим результаты констатирующего и контрольного экспериментов в экспериментальном классе. Для замера уровня знаний по данной теме детям предлагались задания трех типов. В таблицу занесены сведения о проценте детей, справившихся с заданиями:
Эксперимент | I тип | II тип | III тип |
Констатирующий | 40% | 50% | 56% |
Контрольный | 45% | 67% | 76% |
А теперь изобразим эти данные:
Рис.8. Сравнительная диаграмма результатов двух экспериментов
Наиболее распространенным видом сравнительных диаграмм являются арифметические линейные диаграммы, используемые, главным образом, для характеристики динамических рядов и рядов распределений, состоящих из большого количества исследующихся величин.
В ряде случаев, когда необходимо показать динамику интересующего нас показателя в отношении отдельных учащихся используют векторные диаграммы. Особенно целесообразно построение векторных диаграмм, когда в эксперименте участвует небольшое количество детей и для исследователя интересен вопрос о динамике прогресса каждого ребенка, принимающего участие в эксперименте.
Рассмотрим пример построения такой диаграммы. В ходе констатирующего и контрольного обследования учеников некоторого класса получены ранговые данные, свидетельствующие об уровне сформированности некоторого приема. Данные представлены в таблице:
N фамилии | ||||||||||
Ранг (конст.эксп.) | ||||||||||
Ранг (контр.эксп.) |
Покажем на векторной диаграмме изменения количественного значения ранга для каждого ребенка.
Рис.9. Векторная диаграмма ранговых показателей учащихся …класса.
П.6 Аналитические графики математической статистики.
Полигон и гистограмма.
Полигон и гистограмма - это графические изображения результатов статистического исследования. Они относятся к аналитическим кривым математической статистики. Здесь и далее мы рассмотрим, как изображаются количественные данные, полученные в ходе статистических исследований. Полигон строится в тех случаях, когда распределение изучаемого признака - точечное.
О п р е д е л е н и е. Полигон- это статистическая аналитическая кривая, для построения которой необходимо по оси абсцисс отложить значения вариант хi , а по оси ординат - соответствующие им относительные частоты. Полученные точки с координатами (хi,рi) соединяют отрезками.
При построении полигона необходимо всегда доводить линии справа и слева до нулевых значений относительных частот, т.е. указывать такие значения вариант, которые в выборочной совокупности не встречались.
П р и м е р 2. Пусть дано статистическое распределение.
Xi | 1.5 | 3.5 | 5.5 | 7.5 |
Ni | ||||
Pi | 0.1 | 0.2 | 0.4 | 0.3 |
Построим полигон частот: по оси абсцисс отложим значения вариант, а по оси ординат - относительные частоты. Изобразим полученные точки, а затем их соединим:
Рис.10. Полигон распределения относительных частот
По изображению полигона можно наглядно судить о том, какое значение признака наиболее популярно, а также, насколько это значение «популярнее», чем все остальные значения вариант. Также, по виду полигона, можно судить о том, каков характер распределения изучаемого признака ( близок ли он к нормальному или нет).
В случае, когда изучаемый признак имеет интервальное распределение, вместо полигона строится гистограмма по следующему правилу.
О п р е д е л е н и е . Гистограмма- это графическое изображение статистических данных, для построения которого по оси абсцисс откладываются интервалы, а затем над каждым интервалом строится прямоугольник, площадь которого равна численности данного интервала.
Очевидно, что самый высокий прямоугольник будет построен над интервалом, в котором сосредоточено большинство вариант.
Проиллюстрируем понятие гистограмма построением данного графического изображения для исследования, результаты которого представлены в таблице 3. Рекомендуется перед построением гистограммы вычислить высоту каждого прямоугольника, беря во внимание длину интервалов.
Рис.11. Гистограмма распределения количества набранных баллов в результате выборочного тестового обследования.
Кумулятивный ряд. Кумулянта и огива.
О п р е д е л е н и е. Накопленной частостью (частотой) в точке х называют суммарную частоту (частость) членов генеральной совокупности со значением признака меньшим, чем х.
Если в статистическом ряду вместо относительных частот записать соответственно накопленные частоты, то получим кумулятивный ряд. Для графического изображения кумулятивных рядов используют кумулянты и огивы.
О п р е д е л е н и е . Кумулянта – это аналитическая кривая математической статистики, для построения которой по оси абсцисс отмечаются точки, соответствующие границам интервалов или значениям признака, в каждой такой точке восстанавливается перпендикуляр, длина которого пропорциональна накопленной частости и концы соседних перпендикуляров соединяют отрезками.
Если по горизонтальной оси откладывать накопленные частости, а по вертикальной- значения признака, то полученная ломаная называется огива.
П р и м е р 3. Предположим проведено 1000 испытаний на предмет наличия или отсутствия интересующего нас признака. Полученные результаты были занесены в таблицу:
Знач. Вар. | 180-190 | 190-200 | 200-210 | 210-220 | 220-230 | 230-240 | 240-250 |
Числ. |
Построим кумулятивный ряд и начертим кумулянту и огиву.
Р е ш е н и е. Найдем накопленные частоты:
w(190)=50, w(200)=50+90=140, w(210)=290, w(220) =570, w(230) =790, w(240) =910, w(250) =1000.
Следовательно, кумулятивный ряд для данной задачи имеет вид:
Знач. Вар. | 180-190 | 190-200 | 200-210 | 210-220 | 220-230 | 230-240 | 240-250 |
Нак.част. |
На основе полученных данных начертим кумулянту:
Рис.12. Кумулянта накопленных частот при исследовании признака
Графическое оформление результатов, тем не менее, не должно быть самоцелью. Это лишь средство более наглядного представления связей и зависимостей в изучаемых явлениях, и поэтому они всегда должны служить подспорьем в проведении качественного и количественного анализа собранного массового материала. Выбор того или иного вида графиков или диаграмм целиком определяется целью и задачами эксперимента и характером собранных экспериментатором данных. Здесь приведены лишь наиболее распространенные способы графического оформления.