Графическая интерпретация рядов распределения
Рассмотрим более подробно на графическом отображении рядов распределения. Чаще всего ряды распределения изображаются в виде полигона или гистограммы.
Полигон используется в первую очередь для изображения дискретных рядов распределения. При его построении по оси абсцисс откладываются значения варьирующего признака, а по оси ординат – абсолютные или относительные численности единиц совокупности.
Гистограмма распределения применяется чаще всего для изображения интервальных рядов. При ее построении по оси абсцисс откладываются интервалы признака, а по оси ординат – численности единиц совокупности. Получают последовательность прямоугольников с основаниями на оси абсцисс.
В ряде случаев для изображения вариационного ряда используется кумулятивная кривая – кумулята. Для ее построения значения варьирующего признака откладываются по оси абсцисс, а по оси ординат откладываются кумулятивные (накопленные) частоты или частости. Если значения осей поменять местами, то получится статистический график, называемый – огивой. Пример статистических графиков для рядов распределения приведен на рис.4.
Полигон | Гистограмма | Кумулята |
Рис.4. Графическое изображение рядов распределения
Рассмотрим пример построения дискретного и интервального вариационных рядов, с последующей графической их интерпретацией.
Пусть быль произведен опрос 25 студентов академии по поводу их возраста и были получены следующие данные: 18, 17, 23, 18, 17, 19, 18, 20, 17, 22, 19, 21, 18, 18, 17, 22, 18, 21, 17, 21, 18, 19, 17, 23, 17. Составим дискретный вариационный ряд.
Для этого выделим все различные варианты, отражающее возраст студентов: 17, 18, 19, 20, 21, 22, 23.
Определим соответствующие этим вариантам частоты и произведем группировку.
xi | |||||||
fi |
Мы построили дискретный вариационный ряд, где каждой варианте поставили в соответствие ее частоту. Построим график полигона частот. Для этого мы должны в прямоугольной системе координат откладывать по оси абсцисс возраст, а по оси ординат – количество студентов этого возраста, попавших под статистическое наблюдение. Полученные точки соединим ломанной (рис.5).
Рис.5. Полигон частот
Теперь построим по имеющемуся дискретному вариационному ряду интервальный ряд. Для определения количества равных интервалов воспользуемся формулой Стерджесса (1). Количество интервалов n будет равно 1 + 3,322lg25 ≈ 6. Поскольку выборка студентов мала, то формула (1) дала довольной условное решение, скорректируем его, оставив три интервала: [17,19), [19,21), [21,23]. Получим следующий интервальный ряд.
xi - xi+1 | [17,19) | [19,21) | [21,23] |
fi |
Построим гистограмму распределения.
Рис.6. Гистограмма распределения
Вопросы и задания
1. Пользуясь формулой Стерджесса, определите интервал группировки сотрудников фирмы по уровню доходов, если общая численность сотрудников составляет 20 человек, а минимальный и максимальный доход соответственно равен 5000 и 30000 руб.
2. Имеются следующие данные об успеваемости 20 студентов группы по статистике в летнюю сессию 2012 г.:
5, 4, 4, 4, 3, 2, 5, 3, 4, 4, 4, 3, 2, 5, 2, 5, 5, 2, 3, 3. Постройте:
а) ряд распределения студентов по баллам оценок, полученных в сессию; б) ряд распределения студентов по уровню успеваемости, выделив в нем две группы студентов: неуспевающие (2 балла), успевающие (3 балла и выше); в) укажите, каким видом ряда распределения (вариационным или атрибутивным) является каждый из этих двух рядов.
3. Известны следующие данные о результатах сдачи абитуриентами вступительных экзаменов (баллов):
Постройте: а) ряд распределения абитуриентов по результатам сдачи ими вступительных экзаменов, выделив четыре группы абитуриентов с равными интервалами; б) ряд, делящий абитуриентов на поступивших и не поступивших в вуз, учитывая, что проходной балл составил 15 баллов. Укажите, по какому группировочному признаку построен каждый из этих рядов распределения: атрибутивному или количественному.
4. Имеются следующие данные о распределении безработных по полу и образованию (табл. 1) и продолжительности безработицы (табл. 2) в 2012 г.
Таблица 1