Построение вариационного ряда и его
ГРАФИЧЕСКОЕ ИЗОБРАЖЕНИЕ
В качестве исходного материала для выполнения первого задания каждому студенту выдаются опытные данные 150-200 измерений или наблюдений какого-либо одного статистического показателя. Так, например, у деревьев различных пород изучаются высоты и объемы ствола; диаметры и площади поперечных сечений на расчетной высоте 1,3 м от нижнего среза; длина листьев, плодов, корней; вес семян; длина корней и высота сеянцев; годичный прирост растений по диаметру и высоте и др.
Выбор способа построения вариационного ряда следует производить на основании оценки общего количества наблюдений признака (N), т.е. с учетом объема выборки.
Если общее число наблюдений (вариант) не превышает 25-30, т.е. имеет место так называемая малая выборка (N<25-30), то построение вариационного ряда сводится к фиксированию значений всех вариант (V) путемих записи в порядке возрастания. Так, например, результаты взвешивания 8 желудей дуба, выбранных для характеристики плодоношения контрольного дерева, позволяют построить следующий вариационный ряд веса желудей (гр):
V1=1,5; V2>1,8; V3=2,4; V4=2.7; V5=2.8; V6=3,1; V7=4.0; V8= 2,7.
Для краткости запись можно упростить в так называемое ранжирование ряда: 1,5; 1,8; 2,4; 2,7; 2,8; 3,1; 4,0.
При большой выборке (N>25-30) необходимо строить интервальный вариационный ряд, в котором варианты близкой величины объединяются в соответствующие классы (ступени, разряды). В конечном итоге интервальный вариационный ряд будет выражен двумя рядами цифр: значениями классов (W) и количеством наблюдений (n) в них. Например, если для характеристики распределения высот деревьев в участке елового леса было сделано 65 обмеров высот, то эти данные могут образовать следующий интервальный вариационный ряд:
W, классы высот, м | ||||||||
n,число обмеров высот, шт. | S | = 65 |
Каждый из шести организованных классов высот объединяет значение высот деревьев, отличающихся от среднего значения любого класса в пределах 1.5 м. Например, в класс 30 м включены варианты со значениями от 28,5 м. до 31,5 м. Значения 28,5 м. и 31,5 м. составляют соответственно левый и правый пределы класса 30 м. Размер классового промежутка между пределами именуется величиной интервала () и составляет в данном примере 3 м. Название классов устанавливают по их средним значениям.
При построении интервальных вариационных рядов, согласно рекомендациям П.Ф. Рокицкого (1964), следует устанавливать количество классов в зависимости от объема изучаемой статистической совокупности или числа наблюдений (табл. 1.1).
Таблица 1.1
Рекомендуемое количество классов
Число наблюдений | Количество классов |
25-40 | 5-6 |
41-60 | 6-8 |
61-100 | 7-10 |
101-200 | 8-12 |
>200 | 9-15 |
Выбранные значения классов и пределов желательно характеризовать четными удобными цифрами, что максимально облегчит последующие вычисления статистических показателей работы.
Рассмотрим конкретный пример построения интервального вариационного ряда по данным измерения диаметров деревьев сосны, измеренных на пробной площади, характеризующей высокополнотные 45-летние сосняки искусственного происхождения.
Построение вариационного ряда следует начинать с установления его размера, то есть размера ряда (Р.р.), который определяется как разность между максимальной (Vmax) и минимальной (Vmin) вариантами. В данном примере:
Р.р.=Vmax - Vmin = 53,6 - 14,3 = 39,3 см
Численность опытной выборки (N=208 наблюдений) обязывает организовать 9-15 классов. Для удобства расчетов принимаем 10 классов, устанавливая величину интервала ( ) следующим образом:
= Р.р./К.к. = 39,3 см : 10 = 3,93 см.
Использование полученной величины интервала для построения вариационного ряда нежелательно по следующим причинам. В этом случае значения каждого организованного класса будут кратными 3,9 см, что сделает такие классы неудобными в последующей работе.
При переходе от расчетной величины интервала к фактической необходимо произвести округление расчетной величины интервала до более удобной цифры (в нашем примере - до 4 см). Кроме этого, для получения значения начального класса вариационного ряда следует также округлить и значение минимальной варианты, т.е. вместо 14,3 см принять 14 см. В этом случае среднее значение начального класса (W1) составит:
W1 = см
Следует иметь в виду, что округление расчетной величины интервала, как правило, следует производить в сторону увеличения, а минимальной варианты - в сторону уменьшения.
Вычисленная описанным способом фактическая величина интервала и значение начального класса нуждаются в проверке, подтверждающей, что минимальная варианта не выходит за пределы начального класса. Поскольку Vmin = 14,3 см, а левый и правый предел начального класса соответственно равны 14 см и 18см, то значение начального класса рассчитано правильно.
Значения величин каждого из последующих классов получаем путем прибавления к предыдущему классу величины интервала. Получение значений очередных классов необходимо завершить написанием класса, в пределы которого поместится максимальная варианта. В нашем примере завершающим будет класс 52 см с пределами 50-54 см, который вмещает Vmax = 53,6 см.
Полученные значения классов имеют четкие удобные значения (16, 20, 24, 28, 32, 36, 40, 44, 48, 52). Расчетное количество классов в данном случае совпало с фактическим и составляет 10. Расчеты приводятся в таблице 1.2.
Таблица 1.2
Вспомогательные расчеты
для построения интервального вариационного ряда
№ пп. | Показатели | Величина показателя |
1. | Минимальная варианта | 14,3 см |
2. | Максимальная варианта | 53,6 см |
3. | Размер ряда | 53,6 - 14,3 = 39,3 см |
4. | Количество классов: | расчетное -10; фактическое -10 |
5. | Величина интервала: | расчетная 3,93 см; фактическая 4 см |
6. | Значение начального класса | 16 см |
Дальнейшая работа заключается в распределении всех вариант по образованным классам. Результаты разноски вариант следует отражать в специальной таблице (табл. 1.3). Наряду со значением классов, в этой таблице указаны пределы классов, облегчающие разноску вариант по классам.
Таблица 1.3
Построение интервального вариационного ряда и ряда последовательного суммирования
Границы классов 14 18 22 26 30 34 38 42 46 50 54 | |||||||||||||||||||||||||||||
Средние значения классов | |||||||||||||||||||||||||||||
Частоты | . . . |
| . | : : | . . | . . . . | . | ||||||||||||||||||||||
Частости, % | 1,4 | 6,7 | 14,0 | 19,7 | 26,0 | 15,4 | 9,6 | 4,8 | 1,9 | 0,5 | |||||||||||||||||||
Накопленные частоты | 3 17 46 87 141 173 193 203 207 208 | ||||||||||||||||||||||||||||
Накопленные частости, % | 1,4 8,1 22,1 41,8 67,8 83,2 92,8 97,6 99,5 100 |
При разноске следует фиксировать очередную варианту исходных данных наблюдения в соответствующем классе, заполняя одновременно все классы вариационного ряда. Учет вариант каждого класса в отдельности (например, класса 16 см, затем 20 см и т.д.) обеспечит получение одинакового результата, но с большей затратой времени. Если значения вариант совпадут с границами классов (например, несколько вариант имеют значение 30 см), то их следует распределить поровну между смежными классами (28 и 32 см).
Количество вариант во всей выборке принято именовать численностью вариационного ряда (N), а в любом из классов - частотой (n). Значения частот, выраженные в процентах от численности ряда, называют частостями. Вычисление частостей классов следует выполнять с точностью до 0,1%.
В таблице 1.3 также следует показать данные, необходимые для построения ряда последовательного суммирования или начётного ряда. С этой целью накопленные частоты или частости записываются под соответствующими границами классов, показывая количество вариант, сосредоточенных от начала ряда до правого предела конкретного класса. Так, например, проставленная под пределом 30 см накопленная частота 87 означает, что от начала ряда (от предела 14 см) до правого предела класса 28 см (равного 33 см) содержится 87 вариант, т.е. сумма вариант первых четырех классов ряда.
Задание завершается графическим изображением интервального вариационного ряда и ряда последовательного суммирования (рис.1.1).
Рис.1.1. Графическое изображение вариационного ряда
(полигон распределения)
Полигон распределения _________ Гистограмма – – – – – – Огива - - - - - - -
Для W: в I см - 4 см; для n: в I см - 10 вариант; для : в I см - 20 вариант
Отложенные на графике значения частот по классам служат основанием для изображения вариационного ряда двух видов. Соединив точки отрезками прямой, получаем многоугольник (полигон) распределений. Выражая частоту каждого класса в виде прямоугольника, имеющего основанием величину интервала и высотой частоту класса, изображаем прямоугольник распределения (гистограмму).
Для построения ряда последовательного суммирования значения накопленных частот откладываются против соответствующих пределов классов. Полученные точки соединяются плавной кривой, которая именуется интегральной или огивой.
С целью экономии места и для большей наглядности все три ряда показываются на одном чертеже, причем для изображения огивы следует принимать более мелкий масштаб.