Раздел 7 Основы математической статистики
Выборочной совокупностью или просто выборкой называют совокупность случайно отобранных объектов.
Генеральной совокупностью называют совокупность объектов, из которых производится выборка.
Объемом совокупности (выборочной или генеральной) называют число объектов, из которых производится выборка.
Пусть для изучения количественного (дискретного или непрерывного) признака из генеральной совокупности извлечена выборка объема , причем наблюдалось раз, раз, раз и . Наблюдаемые значения называют вариантами, а последовательность вариант, записанных в порядке возрастания – вариационным рядом.
Числа наблюдений называют частотами, а их отношения к объему выборки – относительными частотами.
Статистическим распределением выборки называют перечень вариант и соответствующих им частот или относительных частот. Статистическое распределение можно задавать также в виде последовательности интервалов и соответствующих им частот (в качестве частоты, соответствующей интервалу, принимают сумму частот, попавших в этот интервал).
Полигоном частот называют ломанную, отрезки которой соединяют точки
, где –варианты выборки и – соответствующие им частоты.
Полигоном относительных частот называют ломанную, отрезки которой соединяют точки , где –варианты выборки и – соответствующие им относительные частоты.
Пример. Построить полигон относительных частот по данному распределению выборки:
Решение. Найдем относительные частоты, для чего разделим частоты на объем выборки:
.
Запишем распределение относительных частот:
Контроль: .
Отложим на оси абсцисс варианты , а на оси ординат – соответствующие им относительные частоты . Соединив точки отрезками прямых, получим искомый полигон относительных частот рис.2.
Рис.2
Эмпирической функцией распределения называют функцию , определяющую для каждого значения относительную частоту события :
,
где – число вариант, меньших .
Эмпирическая функция обладает следующими свойствами:
Свойство 1. Значения эмпирической функции принадлежат отрезку ;
Свойство 2. – неубывающая функция;
Свойство 3. Если – наименьшая варианта, а – наибольшая, то при и при .
Пример. Найти эмпирическую функцию по данному распределению выборки:
и построить ее график.
Решение. Найдем объем выборки .
Наименьшая варианта равна единице, следовательно,
при .
Значение , а именно , наблюдалось раз, следовательно,
при .
Значения , а именно и , наблюдались раз, следовательно,
при .
Так как наибольшая варианта, то
при .
Напишем искомую эмпирическую функцию:
График этой функции изображен на рис.3.
Рис. 3
Пусть требуется изучить количественный признак генеральной совокупности. Допустим, что из теоретических соображений удалось установить, какое именно распределение имеет признак. Возникает задача оценки параметров, которыми определяется это распределение.
Статистической оценкой неизвестного параметра теоретического распределения называют функцию от наблюдаемых случайных величин.
Точечной называют статистическую оценку, которая определяется одним числом.
Несмещенной называют точечную оценку, математическое ожидание которой равно оцениваемому параметру при любом объеме выборки.
Несмещенной оценкой генеральной средней служит выборочная средняя
,
где – варианта выборки, – частота варианты , – объем выборки.
Несмещенной оценкой генеральной дисперсии служит исправленная выборочная дисперсия
.
Пример. Из генеральной совокупности извлечена выборка:
Найти несмещенные оценки генеральной средней и генеральной дисперсии .
Решение. Несмещенной оценкой генеральной средней является выборочная средняя .
.
Найдем исправленную выборочную дисперсию:
.
Модой называют варианту, которая имеет наибольшую частоту.
Например для ряда
мода равна .
Медианой называют варианту, которая делит вариационный ряд на две части, равные по числу вариант. Если число вариант нечетно, т.е. , то ;
при четном медиана .
Например, для ряда медиана равна ; для ряда медиана равна .
Размахом варьирования называют разность между наибольшей и наименьшей вариантами:
.
Например, для ряда размах равен .
Доверительным называют интервал, который с заданной надежностью покрывает оцениваемый параметр.
Для оценки математического ожидания нормально распределенного количественного признака по выборочной средней при известном среднем квадратическом отклонении генеральной совокупности служит доверительный интервал
,
где – точность оценки; – объем выборки; есть такое значение аргумента функции Лапласа (приложение 1), при котором .
Пример. Найти доверительный интервал для оценки с надежностью неизвестного математического ожидания нормально распределенного признака генеральной совокупности, если даны генеральное среднее квадратическое отклонение , выборочная средняя и объем выборки .
Решение. Требуется найти доверительный интервал
.
Здесь все величины, кроме , известны. Найдем . Из соотношения получим . По таблице (приложение1) находим . Подставив в формулу для нахождения доверительного интервала соответствующие знаения и получим искомый доверительный интервал .
ПРАКТИЧЕСКИЕ РАБОТЫ
Практическая работа 1