История математической статистики.

Математическая статистика как наука начинается с работ знаменитого немецкого математика Карла Фридриха Гаусса (1777-1855), который на основе теории вероятностей исследовал и обосновал метод наименьших квадратов, созданный им в 1795 г. и примененный для обработки астрономических данных (с целью уточнения орбиты малой планеты Церера). Его именем часто называют одно из наиболее популярных распределений вероятностей – нормальное, а в теории случайных процессов основной объект изучения – гауссовские процессы.

В конце XIX в. – начале ХХ в. крупный вклад в математическую статистику внесли английские исследователи, прежде всего К.Пирсон (1857-1936) и Р.А.Фишер (1890-1962). В частности, Пирсон разработал критерий «хи-квадрат» проверки статистических гипотез, а Фишер – дисперсионный анализ, теорию планирования эксперимента, метод максимального правдоподобия оценки параметров.

В 30-е годы ХХ века поляк Ежи Нейман (1894-1977) и англичанин Э.Пирсон развили общую теорию проверки статистических гипотез, а советские математики академик А.Н. Колмогоров (1903-1987) и член-корреспондент АН СССР Н.В.Смирнов (1900-1966) заложили основы непараметрической статистики.

В сороковые годы ХХ в. румынский математик А. Вальд (1902-1950) построил теорию последовательного статистического анализа.

Б-47 Понятие вариационного ряда и его графические изображения
Пусть некоторый признак генеральной совокупности описыва­ется случайной величиной X.
Рассмотрим выборку {х12,...,хп} объема п из генеральной совокупности. этой выбор­ки представляют собой значения случайной величины X.
На первом этапе статистической обработки производят ран­жирование выборки, т.е. упорядочивание чисел х12,...,хп по возрастанию.
Различные элементы выборки называются вариантами.
Час­тотой варианты История математической статистики. - student2.ru называется число История математической статистики. - student2.ru , показывающее, сколь­ко раз эта варианта встречается в выборке.
Частостью, относи­тельной частотой или долей варианты называется число
История математической статистики. - student2.ru (1.1)
Частоты и частости называются весами.
Пусть х некоторое число. Тогда количество вариант История математической статистики. - student2.ru , значе­ния которых меньше х, называется накопленной частотой, т.е.

История математической статистики. - student2.ru (1.2)
Отношение накопленной частоты к общему числу наблюдений п называется накопленной частостью:

История математической статистики. - student2.ru
Ряд вариант, расположенных в порядке возрастания их зна­чений, с соответствующими им весами называется вариацион­ным рядом.
Вариационные ряды бывают:
- дискретные;
- интер­вальные.
Вариационный ряд называется дискретным, если он представляет собой выборку значений дискретной случайной ве­личины.
Ряд называется непрерывным (интервальным), если он представляет выборку непрерывной случайной величины.
Общий вид дискретного вариационного ряда показан
в табл. 1.1.

Таблица 1.1

Варианты История математической статистики. - student2.ru История математической статистики. - student2.ru История математической статистики. - student2.ru История математической статистики. - student2.ru
Частоты История математической статистики. - student2.ru История математической статистики. - student2.ru История математической статистики. - student2.ru История математической статистики. - student2.ru

Построение интервального вариационного ряда
1. Разбива­ют множество значений вариант на полуинтервалы История математической статистики. - student2.ru т.е. производят их группировку.
Рекомендуется количество интер­валов k выбирать по формуле Стерджерса
История математической статистики. - student2.ru (1.4)
Длина интервала равна
Δ = xmax – xmin/ k
Замечание 1.
В литературе предлагается и такая форма записи формулы Стерджерса
1.Рекомендуемое число интервалов

История математической статистики. - student2.ru
2.Величина интервала:

История математической статистики. - student2.ru
3.Строим интервал: за начало 1-го интервала берут:

История математической статистики. - student2.ru
2. Считают число вариант, попавших в полуинтервал История математической статистики. - student2.ru .
Получают значения частот История математической статистики. - student2.ru , История математической статистики. - student2.ru .
3. Интер­вальный ряд можно представить таблицей (табл. 1.2):
Таблица 1.2

Варианты История математической статистики. - student2.ru История математической статистики. - student2.ru История математической статистики. - student2.ru История математической статистики. - student2.ru
Частоты История математической статистики. - student2.ru История математической статистики. - student2.ru История математической статистики. - student2.ru История математической статистики. - student2.ru

Замечание 2.
Если варианта находится на границе интервала, то ее при­соединяют к правому интервалу.
Графические изображения вариационных рядов
Для наглядности представления используют графические изображения вариационных рядов в виде:
- полигона;
- гистограм­мы;
- кумулянты.
Полигон, как правило, служит для изображения дискретно­го вариационного ряда.
Представляет собой ломаную, соединяющую точки плоскости с координатами История математической статистики. - student2.ru .
Для интервального ряда также строится полигон, только его ломаная проходит через точки История математической статистики. - student2.ru , где История математической статистики. - student2.ru .
Гистограмма служит только для представления интерваль­ных вариационных рядов и имеет вид ступенчатой фигуры из прямоугольников с основаниями, равными длине интервалов Δ, и высотами, равными частотам История математической статистики. - student2.ru интервалов.
Кумулянта представляет собой ломаную, соединяющую точки с координатами История математической статистики. - student2.ru (где История математической статистики. - student2.ru — накопленные часто­ты) для дискретного ряда, или точки с координатами История математической статистики. - student2.ru для интервального ряда.
Эмпирической функцией распределения История математической статистики. - student2.ruназывается функция, значение которой в точке х равно накопленной час­тоте, т.е.
История математической статистики. - student2.ru (1.6)
Для интервального ряда указываются не конкретные значения вариант, а только их частоты на интервалах. В этом случае эм­пирическая функция распределения определена только на кон­цах интервалов. Ее можно изобразить ломаной, проходящей через точки История математической статистики. - student2.ru .
Эмпирической плотностью распределения непрерывного ва­риационного ряда называется функция
, История математической статистики. - student2.ru если История математической статистики. - student2.ru


, если История математической статистики. - student2.ru или История математической статистики. - student2.ru

Функция История математической статистики. - student2.ru является аналогом плотности распределения случайной величины. Площадь области под графиком этой функции равна единице.

Б-48Средняя арифметическая величина

Средней арифметической величиной называется такое среднее значение признака, при вычислении которого общий объем признака в совокупности сохраняется неизменным.

Иначе можно сказать, что средняя арифметическая величина - среднее слагаемое. При ее вычислении общий объем признака мысленно распределяется поровну между всеми единицами совокупности.

Средняя арифметическая – наиболее распространенный на практике вид средних. Различают 2 вида арифметических средних:

Невзвешенную (простую);

Взвешенную.

Средняя арифметическая невзвешенная рассчитывается для несгруппированных данных по формуле:

История математической статистики. - student2.ru .

Для массовых статистических совокупностей рассчитывается взвешенная средняя арифметическая по формуле:

История математической статистики. - student2.ru .

Если при группировке значения осредняемого признака заданы интервалами, то при расчете средней арифметической величины в качестве значения признака в группах принимают середины этих интервалов, т.е. исходят из гипотезы о равномерном распределении единиц совокупности по интервалу значений признака. Для открытых интервалов в первой и последней группе, если таковые есть, значения признака надо определить экспертным путем исходя из сущности, свойств признака и совокупности. Например, по табл.2.1.1 можно минимальный возраст рабочих считать 17 лет. Тогда первый интервал будет от 17 до 20 лет, а максимальный возраст — 65 лет, тогда последний интервал — 50-65 лет.

Средняя арифметическая величина обладает рядом свойств, позволяющих ускорить расчет:

Произведение средней на сумму частот всегда равно сумме произведений вариант на частоты, т. е. История математической статистики. - student2.ru .

Это свойство определено требованиями правильного исчисления средней, согласно которым конкретные значения варьирующего признака уравниваются без изменения общего объема его и заменяются одним средним числом, которое как постоянный множитель выносится из-под знака суммы. Благодаря этому свойству средняя может быть использована для разного рода плановых и статистических расчетов как представитель или заменитель всех значений варьирующего признака. Так, если средний расход горючего на 1 гектар пахоты составляет 20 литров, а всего надо вспахать 2 млн. га, то всего потребуется 40 млн. литров горючего. Аналогично, если достаточно репрезентативное выборочное обследование показало, что среднегодовой надой молока на одну корову составляет 2500 литров, а всего в районе 15 тыс. коров, то общий надой составит 37,5 млн. литров.

Сумма отклонений вариантов как от простой, так и от взвешенной средней арифметической равна нулю:

История математической статистики. - student2.ru и История математической статистики. - student2.ru

Рассмотренное свойство может быть использовано для проверки правильности исчисления средней. Если при исчислении средней арифметической История математической статистики. - student2.ru и История математической статистики. - student2.ru не равны нулю, это указывает, что средняя неправильно исчислена. А так как в анализе часто приходится пользоваться отклонениями от средней, их удобно использовать и для проверки правильности исчисления средней.

Сумма квадратов отклонений вариантов как от простой, так и от взвешенной средней меньше суммы квадратов отклонений от любой другой произвольной величины а, т. е.

История математической статистики. - student2.ru .

Наши рекомендации