Статистическое распределение выборки
МАТЕМАТИЧЕСКАЯ СТАТИСТИКА
Методические указания
по изучению дисциплины и задания для выполнения контрольной работы
(для студентов агрономического факультета заочного отделения, обучающихся по направлению : бакалавр агрономии)
Полесск
2012.
Одобрено и рекомендовано к печати кафедрой Механизации сельского хозяйства (протокол № 2 от 26 октября 2012 г)
УТВЕРЖДЕНО
На заседании Методического Совета Кф ФГБОУ ВПО СПбГАУ
Протокол № 10
от «26» октября 2012 г.
АВТОР: Аристова И.И.
МЕТОДИЧЕСКИЕ УКАЗАНИЯ
Задачи математической статистики. Генеральная и выборочная совокупности. Репрезентативность выборки.
Напомним, что предметом теории вероятностей является установление и изучение вероятностных закономерностей, которым подчинены массовые однородные случайные события, независимо от их конкретной природы. Естественно, возникает вопрос: как устанавливаются эти закономерности? Установление закономерностей, которым подчинены массовые случайные явления, основано на изучении статистических данных – результатов наблюдений над явлениями окружающего нас мира или специально поставленных экспериментов.
Первая задача математической статистики – указать способы сбора и группировки статистических данных. Вторая и главная задача – разработать методы анализа статистических данных в зависимости от целей исследования, к которым относятся: оценка неизвестной вероятности события; оценка неизвестной функции распределения; оценка параметров распределения, вид которого известен; оценка зависимости случайной величины от других случайных величин; проверка статистических гипотез и т. д.
Пусть требуется изучить совокупность однородных объектов относительно некоторого качественного или количественного признака, характеризующего эти объекты. Например, для партии деталей качественным признаком может служить стандартность детали, а количественным - контролируемый размер детали.
Обследование каждого объекта (сплошное обследование), как правило, невозможно по двум причинам: 1) если совокупность содержит очень большое число объектов, то сплошное обследование практически невозможно; 2) если обследование связано с уничтожением объектов или требует больших материальных затрат, то сплошное обследование практически нецелесообразно. Поэтому обычно случайно отбирают из всей генеральной совокупности ограниченное число объектов и подвергают их изучению. Совокупность случайно отобранных объектов называют выборочной совокупностью или просто выборкой.
Объемом совокупности ( выборочной или генеральной ) называют число объектов этой совокупности.
Выборка называется репрезентативной (представительной), если она правильно представляет пропорции генеральной совокупности. Выборка будет репрезентативной, если ее осуществить случайно, а для этого нужно реализовать такой способ отбора, при котором каждый объект генеральной совокупности имеет одинаковую вероятность попасть в выборку.
Способы отбора.
Различают следующие пять основных способов отбора: а) простой случайный бесповторный; б) простой случайный повторный; в) типический; г) механический; д) серийный.
Простым случайным называют такой отбор, при котором объекты извлекают по одному из всей генеральной совокупности. Повторной называют выборку, при которой отобранный объект перед отбором следующего возвращается в генеральную совокупность. В противном случае выборка называется бесповторной.
Типическим называют отбор, при котором объекты отбираются не из всей генеральной совокупности, а из каждой ее «типической» части.
Механическим называют отбор, при котором генеральную совокупность «механически» делят на столько групп, сколько объектов должны войти в выборку, а из каждой группы отбирают один объект.
Серийным называют отбор, при котором объекты отбирают из генеральной совокупности не по одному, а «сериями», которые подвергают сплошному обследованию.
На практике часто применяется комбинированный отбор, при котором сочетаются перечисленные выше способы.
Статистическое распределение выборки.
Пусть для изучения количественного (дискретного или непрерывного) признака Х из генеральной совокупности извлечена выборка, причем значения признака х1 наблюдалось n1 раз, х2 – n2 раз,…, хk – nk раз и Sni = n – объем выборки. Наблюдаемые значения хi называются вариантами. Последовательность вариант, записанных в возрастающем порядке, называется вариационным рядом. Числа n1, n2,…, nk называются частотами. Отношения частот к объему выборки называются
относительными частотами: wi =
Статистическим распределением выборки называют перечень вариант и соответствующих им частот или относительных частот. Обычно закон распределения после обработки статистических данных задают в виде таблицы:
Для непрерывно распределенного признака Х статистическое распределение задается в виде последовательности интервалов, в которые попадают варианты, и соответствующих им частот( в качестве частоты в этом случае принимают сумму частот вариант, попавших в соответствующий интервал).
В силу устойчивости относительной частоты wi она служит для оценки вероятности события « Х = хi ».
■Пример 1.
При выборочной проверке посещаемости студентами занятий в различных группах и в разные дни осеннего семестра оказалось, что присутствовало на занятии следующее число студентов: 25, 23, 18, 23, 25, 25, 18, 20, 23, 23, 23, 21, 25, 25, 22, 20, 21, 21, 23, 23, 22, 25, 23, 23, 22, 20, 20, 21, 21, 22, 25, 25, 25, 23, 18.
Сгруппируем статистические данные и составим статистическое распределение выборки дискретного количественного признака Х - числа студентов, присутствующих на занятии
xi 18 20 21 22 23 25
ni 3 4 5 4 10 9
∑ni =3+4+5+4+10+9=35 – объем выборки.
Для того, чтобы получить объем N генеральной совокупности, нужно умножить число студенческих групп на число занятий в течение семестра.
Составим распределение относительных частот. Для этого найдем относительные частоты, разделив частоты на объем выборки:
W1 = = = 0.09 ; w2 = = =0.11 ; w3=
W4 = = = 0.11 ; w5 = = =0.29 ; w6=
xi 18 20 21 22 23 25
wi 0,09 0,11 0,14 0,11 0,29 0,26
Контроль: ∑wi=0,09+0,11+0,14+0,11+0,29+0,26=1.