Генеральная и выборочная совокупность
Вся совокупность объектов, изучаемая относительно некоторого количественного признака Х (случайной величины) называется генеральной совокупностью. Количество объектов в ней может быть и не известно.
Любое количество объектов, каким-либо образом отобранных из генеральной совокупности называется выборочной совокупностью или просто выборкой.
Полное количество членов в любой из совокупностей называется ее объемом.
Вариационный ряд. Представление и первоначальная обработка
Различные значения признака Х, обозначаемые называются вариантами. Выборка, упорядоченная по возрастанию и оформленная в виде таблицы (см. таблицу 1) называется простым статистическим рядом. Если объем выборки значителен, а повторяемость вариант небольшая, то весь объем выборки разбивают на части – интервалы. В результате получается ряд интервалов – вариационный ряд (таблица 2). При этом фиксируется только факт попадания варианты в конкретный интервал. Количество интервалов m рекомендуется выбирать в соответствии с формулой Стерджеса:
,
а ширину интервала - , где - разность между наибольшей и наименьшей вариантами, а n – объем выборки.
Пример. Изучается выработка на одного рабочего предприятия в текущем году, взятая в процентах по отношению к прошлому году. Пусть из генеральной совокупности (общего числа сотрудников) сделана выборка объемом n=100. Получены следующие данные:
X={101, 98, 110, 111, 100, 97, 102, 89, 94, 101, 113, 95, 90, 92, 89, 102, 100, 93, 116, 96, 106, 105, 98, 101, 112, 97, 101, 104, 97, 100, 100,112, 103, 109, 94, 94, 94, 101, 96, 100, 97, 102, 89, 100,112, 102, 100, 94, 104, 99, 110, 111, 101, 100, 101, 103, 99, 94, 101, 98, 111, 111, 102, 101, 111, 96, 103, 104, 97, 99, 100, 100,112, 103, 109, 94, 113, 96, 106, 105, 98, 101, 111, 97, 101, 106, 97, 100, 107,112, 113, 96, 106, 105, 98, 101, 112, 97, 101, 104,}.
Требуется построить статистические ряды.
4Расположим признак в порядке возрастания вариант.
X={89, 89, 89, 90, 92, 93, 94, 94, 94,94, 94, 94, 94, 95, 96, 96, 96, 96, 96, 97, 97, 97, 97, 97, 97, 97, 97, 98, 98, 98, 98, 98, 99, 99, 99, 100, 100, 100, 100, 100, 100, 100, 100, 100, 100, 100, 101, 101, 101, 101, 101, 101, 101 101, 101, 101, 101, 101, 101, 102, 102, 102, 102, 102, 103, 103, 103, 103, 104, 104, 104, 104, 105, 105, 105, 106, 106, 106, 106, 107, 109, 109, 110, 110, 111, 111, 111, 111, 111, 111, 112, 112, 112, 112, 112, 112, 113, 113, 113, 116}.
Подсчитаем количество повторяющихся вариант и построим простой статистический ряд в виде таблицы 1:
Таблица 1.
i | |||||||||||||||||||
i | |||||
Здесь - количество появлений значения признака (варианты) в выборке. Очевидно, что .
Учитывая, что в большинстве случаев каждое значение варианты встречается редко, 1–3 раза, перейдем к вариационному интервальному ряду.
; примем: (%).
За начало первого интервала рекомендуется брать величину В данном случае . Сгруппированный вариационный ряд представляется в виде таблицы 2:
Таблица 2.
i | ||||||||
87–91 | 91 – 95 | 95 – 99 | 99– 103 | 103–107 | 107–111 | 111-115 | 115-119 | |
0,04 | 0,1 | 0,16 | 0,33 | 0,16 | 0,05 | 0,15 | 0,01 |
Числа , показывающие, сколько раз встретилась i-тая варианта, называются частотами, а отношения их к общему числу вариант – частностями или относительными частотами.