Геометрическое изображение
Возьмем выборочную совокупность объема п. Если генеральная совокупность имеет небольшой объем, то в некоторых случаях можно в выборку включить все ее члены.
Количественное значение признака, наблюдаемое при отборе, – это случайная величина, ее возможные значения обозначают символами х1 х2, х3, ..., хk, а числа ni объектов с одинаковым количественным признаком называют частотами и обозначают п1, п2, п3,…,nk.
Изучение выборки начинают с составления статистического распределения – таблицы с двумя строками. В одной строке указывают значения признака, в другой – соответствующие им частоты.
Определение. Статистическим распределением случайной величины называют таблицу значений признака, расположенных в возрастающем порядке, и соответствующих им частот или относительных частот.
Различают дискретные (возможные значения признака изолированы друг от друга), и интервальные (с непрерывным признаком) распределения. Составление статистического распределения начинают с определения наименьшего и наибольшего значений признака. Остальные значения записывают между ними в порядке возрастания. Далее подсчитывают частоты каждого значения признака.
Для непрерывно варьирующего количественного признака интервал его изменения разбивают на частичные интервалы одинаковой длины (классы) «от и до». Величина частичного интервала (класса) находятся по формуле
(1)
где п – объем выборки; – разность между наибольшим и наименьшим значениями признака. Обычно при небольших выборках число классов принимают равным 5–9. Точное их число устанавливается практическими соображениями: с одной стороны, важно, чтобы таблица не была слишком громоздкой и с другой стороны, в ней не должны исчезнуть особенности изучаемого признака. Затем подсчитывают число количественных признаков в каждом таком интервале. Обычно признак, находящийся на границе двух интервалов, относят к правой границе интервала.
Пример дискретного распределения. В результате обследования 50 кроликов, по количеству родившихся крольчат в одном помете, составлено распределение, приведенное в табл. 1.
Таблица 1
xi | |||||||||
ni |
Пример распределения с непрерывно варьирующим количественным признаком.При измерении длины 50 колосьев ячменя сорта «Московский 121» получены данные, помещенные в табл. 2.
Таблица 2
Длина колосьев, см | 6...8 | 8...10 | 10...12 | 12...14 | 14...16 | 16...18 |
Частота |
Это пример интервального распределения.
Группировку по классам применяют и в случае дискретного распределения. Так, если число зерен в колосе от 5 до 30, то этот интервал разбивают на классы, например, 3...6, 6...9, 9...12 и т. д.
Геометрическое изображение статистического распределения.Наглядное представление о распределении дает график. Будем откладывать на оси абсцисс числовое значение признака хi а на оси ординат – их частоты ni или относительные частоты. Полученные точки соединим ломаной линией, которая вместе с осью Ох образуют полигон распределения частот или относительных частот. Распределение (см. табл. 1) изображено на рис. 1.
Если количественный признак изменяется непрерывно, то на каждом интервале строят прямоугольники с высотой, равной числу значений признака ni или относительной частоте. Графическое изображение интервального распределения называется гистограммой (рис. 2). Обведем гистограмму плавной линией так, чтобы были приблизительно равны площади, ограниченные: а) ступенчатой ломаной и б) кривой. В результате получим график функции f*(х), называемый эмпирической функцией распределения частот или относительных частот.
В теории вероятностей ей отвечает дифференциальная функция распределения f(x). Если увеличивать объем выборки, то в соответствии с законом больших чисел относительная частота будет весьма мало отличаться от вероятности появления случайной величины X и график f*(х)будет по форме приближаться к графику f(х).