Построение диаграммы и полигона частот

Следующий этап первичной обработки – группирование и ее графическое представление. Группировка выборки объема n заключается в следующем: Промежуток [xmin, xmax] разбивают на m интервалов группирования (чаще всего одинаковой длины) и подсчитывают число nj выборочных значений, которые попали в j-й интервал. Обычно выбирают m = 7 – 20, или рассчитывают по формуле

Построение диаграммы и полигона частот - student2.ru . (8)

Kаждый интервал группировки Δj=(aj, bj) представлен своими левой aj, и правой bj границами и числом элементов выборки, которые принадлежат ему. Каждый интервал удобно представлять не двумя границами, а одним числом – средним значением.

Наиболее наглядная форма графического представления группирования – гистограмма. Если δ1, δ2,… δm – длины интервалов группирования, а Построение диаграммы и полигона частот - student2.ru , Построение диаграммы и полигона частот - student2.ru , Построение диаграммы и полигона частот - student2.ru ,.. Построение диаграммы и полигона частот - student2.ru – их середины и Построение диаграммы и полигона частот - student2.ru – относительные частоты попадания наблюдений в j-й интервал группировки, то можно построить график ступенчатой функции: Построение диаграммы и полигона частот - student2.ru , Построение диаграммы и полигона частот - student2.ru , j=l, 2,3.., m.

Этот график называется гистограммой. В Mathcad для построения гистограмм функции hist(Δ,ξ) hist(M,N,n) и histоgram(intvis,data).Для нашей задачи приемлемы функции hist(Δ,ξ) и histоgram(intvis,data).

Другая форма графического представления группируемых данных – полигон частот. Полигон частот – это ломаная линия, которая соединяет точки с координатами ( Построение диаграммы и полигона частот - student2.ru , hi) то есть с абсциссами, равными серединам интервалов группировки, и ординатами, равными соответствующим частотам.

Можно также построить полигон накопленных частот – график ломаной, соединяющей точки с координатами Построение диаграммы и полигона частот - student2.ru , то есть с абсциссами, равными правым границам интервалов группирования и ординатами, равными соответствующим накопленным частотам или относительным накопленным частотам.

Ниже приведен фрагмент рабочего документа Mathcad с вычислением xmax, xmin и R=xmax–xmin для исследуемой выборки, а также с гистограммами и полигонами частот для разных интервалов группировки.

В Excel выборка разбивается на частоты с помощью встроенной функции ЧАСТОТА.

Она вычисляет частоту появления значений в определенном интервале и возвращает массив чисел. Поскольку данная функция возвращает массив, она должна задаваться как функция массива.

Синтаксис: ЧАСТОТА (массив данных; массив карманов (ячеек)), здесь: массив данных – это ссылка на массив данных, для которых вычисляются частоты. Если массив данных не содержит значений, то функция ЧАСТОТА возвращает массив нулей.

Массив карманов (ячеек) – это ссылка на массив интервалов, в которые группируются значения аргумента массива данных. Если массив карманов (ячеек) не содержит значений, то функция ЧАСТОТА возвращает количество элементов в аргументе массив данных. Гистограмма строится по массиву карманов (ячеек).

Из анализа выборочных характеристик, вида гистограммы (или полигона частот) высказывается нулевая гипотеза о виде закона распределения. Данная гипотеза требует проверки.

Наши рекомендации