Лекция 14. Математическая статистика
Пусть требуется изучить множество однородных объектов (это множество называется статистической совокупностью) относительно некоторого качественного или количественного признака, характеризующего эти объекты. Например, если партия деталей, то качественным признаком может служить стандартность детали, а количественным – контролируемый размер детали.
Иногда проводят сплошное обследование, т.е. обследуют из объектов совокупности относительно признака, которым интересуются. Однако на практике сплошное обследование применяется редко, т.к. иногда это физически невозможно из-за очень большого числа объектов или их недоступности и др.
Чаще из всей совокупности объектов случайно отбирают ограниченное число объектов и подвергают их изучению.
Выборочной совокупностью,или просто выборкой называют совокупность случайно отобранных объектов.
Генеральной совокупностью называется совокупность, из которой производится выборка.
Объемом совокупности (выборочной или генеральной) называют число объектов этой совокупности.
С помощью выборки оценивают генеральную совокупность по вероятностным свойствам. Чтобы оценки были достоверными, выборка должна быть репрезентативной или представительной, т.е. необходимо, чтобы по данным выборки можно было достаточно уверенно судить об интересующем нас признаке генеральной совокупности. В дальнейшем будем считать, что все выборки получены из генеральной совокупности случайно
Случайно отобранный объект после проверки нужного признака можно возвратить (возвратная или повторная выборка) или не возвратить (безвозвратная или бесповторная выборка) обратно в генеральную совокупность. В первом случае получаем более независимую и представительную выборку.
Пусть над случайным количественным признаком Х генеральной совокупности произведено п независимых наблюдений. При этом величина Х приняла раз значение , раз значение ,..., раз значение , причем . В итоге получена выборка объема п.
Наблюдаемые значения называются вариантами. Последовательность вариантов, записанная в возрастающем порядке, называется вариационным рядом. Числа наблюдений называют частотами, а их отношение к объему выборки - относительными частотами. Причем
Статистическим распределением выборки называют перечень вариант и соответствующих им частот, которые целесообразно записать в виде таблицы, в первой строке (столбце) которой находятся варианты , а во второй частоты или относительные частоты .
Если количество вариант слишком велико или близко к объему выборки, то целесообразно составить вариационный ряд по интервалам значений генеральнойсовокупности. По интервалам составляют вариационный ряд и из выборки непрерывной генеральной совокупности. В качестве частоты, соответствующей интервалу, принимают сумму частот вариант, попавших в этот интервал.
Пусть имеется некоторая генеральная совокупность, каждый объект которой наделен количественным признаком Х. При случайном извлечении объекта из генеральной совокупности становится известным значение х признака Х этого объекта. Таким образом, мы можем рассматривать извлечение объекта из генеральной совокупности как испытание, Х- как случайную величину, а х – как одно из возможных значений Х.
Допустим, что удалось установить, к какому типу распределения относится признак Х. Естественно, возникает задача оценки (приближенного нахождения) параметров, которыми определяется это распределение.
Обычно в распоряжении исследователя имеются лишь данные выборки генеральной совокупности, например значения количественного признака , полученные в результате п наблюдений. Через эти данные и выразим оцениваемый параметр.
Опытные значения признака Х можно рассматривать и как значения различных случайных величин Х1, Х2, …, Хп с тем же распределением, что и Х, и, следовательно, с теми же числовыми характеристиками, которые имеет Х. Значит, и . Величины Х1, Х2, …, Хп можно считать независимыми в силу независимости наблюдений. Значения в этом случае называют реализациями случайных величин Х1, Х2, …, Хп. Отсюда и из предыдущего следует, что найти оценку неизвестного параметра – значит найти функцию от наблюдаемых случайных величин Х1, Х2, …, Хп, которая и дает приближенное значение оцениваемого параметра.
Определение 1. Генеральной средней называют среднее арифметическое значений признака объектов генеральной совокупности.
Если все объекты генеральной совокупности объемаN имеют различные значения признака, равные , то .
Если N1 объектов имеют значение признака, равное ; N2 объектов имеют значение признака, равное ;...; Nk объектов имеют значение признака, равное , причем , то , или
Причем генеральная средняя совпадает с математическим ожиданием признака: .
В случае непрерывного распределения признака Х по определению полагают .
Пусть для изучения генеральной средней относительно количественного признака Х извлечена выборка объема п.
Определение 2. Выборочной средней называют среднее арифметическое значений признака Х объектов выборочной совокупности.
Если все объекты выборочной совокупности объема п имеют различные значения признака, равные , то .
Если же значения признака имеют соответственно частоты , причем , то или .
Будем считать, что значения признака различны.
Естественно, что выборочная средняя для различных выборок одного и того же объема п из той же генеральной совокупности будет получаться различной.
Таким образом, всевозможные могущие получиться выборочные средние есть возможные значения случайной величины , которая называется выборочной средней случайной величиной.
Учитывая, что и с учетом свойств математического ожидания получим:
. Итак, математическое ожидание выборочной средней совпадает с а- генеральной средней.
Найдем . Так как и Х1, Х2, …, Хп независимы, то согласно свойствам дисперсии получим: .
Если варианты большие числа, то для облегчения вычисления выборочной средней применяют следующий прием. Пусть С- константа.
Так как , то
Константу С- так называемый ложный нуль, берут такой, чтобы, во-первых разности были небольшими и, во-вторых, число С- было целым.