Выборочные среднее и дисперсия

Лекция 1

Элементы математической статистики

Объект статистики – статистические совокупности – множества, обладающие массовыми свойствами (свойствами, отличными от свойств элементов множеств). Цель статистического исследования состоит в получении указанных свойств совокупностей. Элементы, множество которых образует изучаемую совокупность, называют единицами статистической совокупности.

Выборочный метод

Генеральная совокупность – множество, подвергающееся изучению.

Выборочная совокупность (выборка) – подмножество генеральной совокупности, которое отбирается для наблюдения.

Объем выборки – количество элементов, входящих в нее.

Репрезентативность – способность выборки представлять свойства генеральной совокупности.

Ошибка репрезентативности – ошибка, возникающая потому, что выборка является только частью генеральной совокупности. Обстоятельства, определяющие величину ошибки репрезентативности:

1) способ формирования выборочной совокупности;

2) разброс изучаемого свойства в генеральной совокупности;

3) объем выборки.

Статистика – результат любой обработки выборки. Например, среднее значение, минимальное, размах.

Выборочный метод – получение свойств выборки и распространение их на всю генеральную совокупность.

Если число элементов в изучаемой совокупности невелико, обследование объектов не связано с их уничтожением и не требует больших затрат, то можно исследовать каждый объект в отдельности и сделать вывод о каждом объекте совокупности. Если хотя бы одно из перечисленных условий не выполнено, то сплошное исследование нецелесообразно. Например, если нужно знать среднюю глубину воронки при взрыве снаряда из опытной партии, то проводя сплошное обследование, мы уничтожим всю партию.

Ряды распределения. Группировка и сводка данных. Графическое представление данных

Вариационный ряд – ряд, составленный из единиц (вариантов) в порядке возрастания какого-либо признака. Среди вариантов можно найти вариант с наибольшим значением Xmax и с наименьшим - Xmin. Для вариационного ряда это последний и первый элемент. Разность r = Xmax - Xmin называется размахом выборки.

Ряды распределения получаются в результате двух методов обработки статистических данных:

Группировка данных – разбиение совокупности на группы одинаковых или близких по существенным для исследования признакам единиц. Например, возрастные группы (18-20, 21-25, ...).

Сводка данных – подсчет общего количества одинаковых единиц совокупности. Например, суточная сводка преступлений по городу: убийств – ..., краж – ... и т.д.

Пример: Выборка состоит из чисел: 9,5,7,5,2,3,1,5,7,10. Вариационный ряд будет иметь вид: 1,2,3,5,5,5,7,7,9,10, размах выборки r = 10–1 = 9.

После сводки ряд будет выглядеть (частотный ряд):

X
f

Если объем выборки достаточно большой и много неравных по величине вариантов, то используют группировку данных в интервалы, дающую в кратком виде достаточно ясное представление об основных свойствах изучаемого явления.

При сводке значения объединяются в интервалы (разряды, группы) и подсчитывается сколько раз встречались значения в каждом интервале.

Интервал (Xmin - Xmax) разбивается на некоторое число более мелких. Число интервалов на практике выбирается, исходя из соображений наглядности.

интервальный ряд распределения строится в виде таблицы, для чего подсчитывают частоты ni - число вариантов, попавших в i-ый интервал:

интервал 0-1 2-3 4-5 6-7 8-9 10-11
частоты

Выборочные среднее и дисперсия

Статистический ряд (выборка)

Значения x x1 ... xn

Выборочные среднее и дисперсия - student2.ru

Ряд распределения (частотный)

Значения x x1 ... xn
Частоты f f1 ... fn

Выборочные среднее и дисперсия - student2.ru

Интервальный ряд распределения

Интервалы x x1 – x2 ... xn-1 – xn
Частоты f f1 ... fn

При получении статистик интервалы заменяются на свои середины:

X1 = (x1 + x2)/2, ...

Пример.

Срок расследования до 1 мес. 1 – 2 мес. 2 – 3 мес. 3 – 4 мес. 4 - 6 мес. 6 - 12 мес. 12 - 18 мес.
Число уголовных дел

Средний срок расследования = 1/100 (0,5´ 10 + 1,5´ 40 + 2,5 ´ 25 + ...)

Наши рекомендации