Графическое представление экспериментальных данных
Для наглядности результатов эксперимента используется их графическое представление: гистограмма, полигон частот и полигон накопленных частот.
Гистограмма – это примыкающие друг к другупрямоугольники. Основание каждого прямоугольника есть ширина группировки hi. а высота - ni. если все hi одинаковые. На графике гистограммы основания прямоугольников откладываются по оси Ох, а высоты по оси Оy.
ni
24,9 25,7 26,5 27,3 28,1 28,9 29,7 30,5 x
Рис. 1. Гистограмма с равными интервалами
Если hi не одинаковые, то по оси Оу откладывается Pi, где Pi = , т.е. высоты прямоугольников должны быть пропорциональны величинам Pi .
Pi
24,9 25,7 26,5 27,3 28,1 29,7 30,5 x
Рис. 2. Гистограмма с объединенными интервалами
На рисунке 1 гистограмма построена по данным таблицы 3 с равными интервалами. На рисунке 2 интервалы взяты не одинаковые (два объединили), поэтому по оси Оу откладывали Pi.
Полигон частот – это ломаная линия, соединяющая точки, соответствующие срединным значениям интервалов группировки.
ni
2
0 25,3 26,1 26,9 27,7 28,5 29,3 30,1 хсi
Рис. 3. Полигон частот
На оси Ох отложены срединные значения, по оси Оу – частоты. Из сравнения двух способов следует, что для получения полигона частот из построенной гистограммы нужно соединить середины сторон отрезками. На рис 1 график полигона частот построен пунктиром.
Полигон накопленных частот получается при соединении отрезком прямых точек. координаты которых соответствуют верхним границам интервалов группировки и накопленным частотам. По оси ОХ границы интервалов, по оси ОУ - накопленные частоты.
nхi
0 24,9 25,7 26,5 27,3 28,1 28,9 29,7 30,5 x
Рис.4. Полигон накопленных частот
Получили более плавную линию по сравнению с полигоном частот.
Числовые характеристики выборки дают количественные представления об эмпирических данных и позволяют сравнивать их между собой. Остановимся на некоторых из них подробнее. К характеристикам положения относятся: среднее арифметическое, медиана, мода. Они определяют положение центра эмпирического распределения.
Среднее арифметическое – одна из основных характеристик выборки и представляет собой такое значение признака, сумма отклонений от которого выборочных значений признака равна нулю. Геометрически среднее арифметическое можно определить как точку на оси Ох, которая является абсциссой центра масс гистограммы и обозначается .
Для несгруппированных данных среднее арифметическое определяется по формуле: , (3.1), где n – объём выборки, хi –варианты выборки.
Пример.
Для оценки уровня физической подготовленности студентов 1-го курса педагогического вуза были выбраны прыжки в длину с места. Результаты контрольной группы студентов в количестве 15 человек оказались следующими (в см): 213, 224, 225, 210, 226, 230, 201, 224, 230, 227, 228, 252, 238, 232, 246. Определить средний результат.
Для сгруппированных данных среднее арифметическое определяется по следующей формуле: , (3.2), где n – объём выборки, ni – частоты интервалов, хi –срединные значения интервалов.
Пример:
Вычислить среднее арифметическое результатов в беге на 5 км (лыжи), сгруппированных в таблице. Для наглядности промежуточные результаты расчетов занесем в таблицу.
Медианой называется такое значение признака X, когда одна половина значений экспериментальных данных меньше её, а вторая половина больше. Если объем выборки невелик, то для вычисления медианы выборку ранжируют, т. е. располагают в порядке возрастание или убывания и вычисляют порядковый номер R (ранг) медианы по формуле: .
Пусть, например, имеется ранжированная выборка n=11:
13, 15, 16. 19, 19, 22, 23, 25, 27, 27, 29. Тогда ;
Ме = 22 (6-ой член ряда).
При n = 8: 12, 15, 16, 18, 22, 24, 25, 27; .
Медианой в этом случае может быть любое число между 18 и 22 (четвертым и пятым членами ряда). Ме = .
Для сгруппированных данных вначале находят медианный интервал, т.е. интервал, в котором находится медиана. Медианным будет тот интервал. в котором накопленная частота окажется больше (n – объем выборки) или накопленная частость больше . Внутри медианного интервала медиана ищется по формуле: , где
Хмен - нижняя граница медианного интервала;
0,05n – 1/2 объема выборки;
h – ширина интервала группировки;
nхмв -1 - накопленная частота интервала, предшествующего медианному;
nме- частота медианного интервала.
Найдем медиану, в предыдущем примере. Медиана содержится в интервале (27,3; 28,0), которому соответствует накопленная частота 32, а =25. Me = 27,3 + 0,8 = 27,6; Ме = 27,6 (мин)
Медиана несколько отличается от среднего арифметического, так как имеет место несимметрическая форма эмпирического распределения.
Как было сказано выше, мода представляет собой значение признака, встречающееся в выборке наиболее часто. Интервал группировки с наибольшей частотой называется модальным. Мода ищется по формуле:
где
Хмон - нижняя граница модального интервала;
h - ширина интервала группировки;
nмо- частота модального интервала:
nмо – 1 - частота интервала, предшествующего модальному.
nмо + 1 - частота интервала, следующего за модальным.
Для предыдущего примера имеем Мо = 26,5+0,8 27,2. Тогда Мо = 27,2 (мин).