Сравнение полигона относительных частот и нормальной кривой показывает, что построенная кривая удовлетворительно сглаживает полигон
ПУНКТ 8 Интервальные оценки параметров нормального закона распределения
Интервальные оценки параметров нормального закона распределения определяются только в том случае, если подтверждается гипотеза о нормальном распределении. В нашем случае, =33.098 а χ2крит=7.815
Так как условие < χ2крит не выполняется, гипотезу о нормальном распределении стоит отвергнуть, следовательно, оценка параметров нормального закона распределения для случайной величины У(среднегодовое превышение нормы), в данной курсовой работе не проводится.
СТАТИСТИЧЕСКАЯ ОБРАБОТКА СЛУЧАЙНОЙ ВЕЛЕЧИНЫ Х(СТАЖ РАБОТЫ)
ПУНКТ 1 Интервальный и дискретный статистические ряды распределения частот и относительных частот.
Статистическая обработка результатов эксперимента в случае выборки большого объема(n> 50) начинается с группировки выборочных значений, то есть с разбиения наблюдаемых значений СВ на k частичных интервалов равной длины и подсчета частот попаданий значений СВ в частичные интервалы.
Сделаем группировку наблюдаемых значений. Оптимальную длину интервала определим по формуле Стэрджеса:
,
где Хmax , Xmin –соответственно максимальное и минимальное выборочные значения СВ Х(Стаж работы), n—объем выборки.
Для СВ Х(Стаж работы) n=100, Хmax =11, Xmin=6. Следовательно,
В качестве левого конца первого интервала возьмем величину, равную
а1= Xmin-- =6-- =6—0.35=5.65. Если аi-начало i-го интервала, тогда
а2= а1+h=5.65+0.7=6.35 и т д. Составим таблицу (таб.2)
Таблица.2
Вспомогательная таблица для расчета числовых характеристик выборки
интервалы (аi;ai+1) | середины интервалов | подсчет частот | частоты ni | относит. частоты Wi=ni/n | накопительные относительные частоты |
(5.65;6.35] | 0.13 | 0,13 | |||
(6.35;7.05] | 6.7 | 0.2 | 0,33 | ||
(7.05;7.75] | 7.4 | 0,33 | |||
(7.75;8.45] | 8.1 | 0.35 | 0,68 | ||
(8.45;9.15] | 8.8 | 0.18 | 0,86 | ||
(9.15;9.85] | 9.5 | 0,86 | |||
(9.85;10.55] | 10.2 | 0.11 | 0,97 | ||
(10.55;11.25] | 10.9 | 0.03 | 1,00 |
ПУНКТ 2 Гистограмма и полигон относительных частот
Первый и пятый столбцы таблицы 1 составляют интервальный статистический ряд относительных частот, графическое изображение которого—гистограмма относительных частот (ступенчатая фигура на рис.1)
Дискретный статистический ряд относительных частот задается вторым и пятыми столбцами, графическое изображение, которого—полигон относительных частот (изображен на рис.1 ломаной линией)
Рис.1—гистограмма и полигон относительных частот
ПУНКТ 3 Эмпирическая функция распределения и ее график
Эмпирическая функция распределения F*(х) выборки служит для оценки функции распределения F(х) генеральной совокупности.
Функция F*(х) определяет для каждого значения х относительную частоту событий Х<х:
F*(х)= ,
где nx-число выборочных значений, меньших х; n-объем выборки.
Шестой столбец таблицы 1 содержит накопленные частоты, то есть значения эмпирической функции распределения F*(х), они относятся к верхней границе частного интервала.
Эмпирическая функция распределения F*(х) имеет вид:
F*(х)=
График эмпирической функции распределения F*(х) изображен на рис.2
рис.2—График эмпирической функции распределения
ПУНКТ 4 Числовые характеристики выборки
Для вычисления числовых характеристик выборки (х, Дх, Sх*, Эх*) удобно использовать таблицу.3,где в первых двух столбцах приведены сгруппированные исходные данные, а остальные столбцы служат для вычисления числовых характеристик
Таблица 3
Таблица для расчета числовых характеристик выборки
середин интервалов хi | Частоты ni | xi—x | (xi—x )ni | (xi—x )2ni | (xi—x )3ni | (xi—x )4ni |
-1.988 | -25.844 | 51.378 | -102.139 | 203.053 | ||
6.7 | -1.288 | -25.76 | 33.178 | -42.734 | 55.042 | |
7.4 | -0.588 | |||||
8.1 | 0.112 | 3.92 | 0.439 | 0.049 | 0.005 | |
8.8 | 0.812 | 14.616 | 11.868 | 9.637 | 3.478 | |
9.5 | 1.512 | |||||
10.2 | 2.212 | 24.332 | 53.822 | 119.055 | 263.350 | |
10.9 | 2.912 | 8.736 | 25.439 | 74.079 | 215.718 | |
Σ | - | 175.942 | 57.947 | 740.646 |
Выборочное среднее вычисляется по формуле:
,
где m—число интервалов, хi—середины интервалов
Выборочное среднее дает усредненное значение стажа работы для данной выборки.
Выборочную дисперсию для сгруппированных данных вычисляют по формуле:
1.3
Выборочное среднее квадратическое отклонение находят по формуле:
. Для СВ Х Sх=
Оно показывает разброс выборочных значений хi, относительно выборочного среднего х=7.988
Выборочные коэффициенты асимметрии и эксцесса вычисляются по формулам:
Используя суммы из последних строк шестого и седьмого столбцов таблицы 3,
получим:
0 говорит о несимметричности полигона (гистограммы) относительно выборочного среднего х(стажа работы).
Отрицательность выборочного коэффициента эксцесса показывает, что полигон
менее крут, чем нормальная кривая
ПУНКТ 5 Предварительный выбор закона распределения наблюдаемой случайной величины Х(стажа работы)
Мы предварительно предполагаем, что СВ Х(стаж работы) распределена нормально по совокупности следующих признаков.
Вид полигона и гистограммы относительных частот напоминает нормальную кривую (кривую Гаусса)
Выборочные коэффициенты асимметрии и эксцесса
отличаются от значений асимметрии и эксцесса для нормального распределения (которые равны нулю) не более чем на утроенные средние квадратические ошибки
их определения.
,
,
где
Можно предположить, что стаж работы (СВ Х) изменяется под влиянием большого числа факторов, примерно равнозначных по силе.
Итак, по совокупности указанных признаков можно предположить, что распределение СВ Х является нормальным
ПУНКТ 6 Точечный оценки параметров нормального закона распределения
Функция плотности нормального распределения имеет вид
В качестве неизвестных параметров а и σ возьмем их точечные оценки 7.988 и Sх= соответственно. Тогда дифференциальная f(x) и интегральная функции F(x) предполагаемого нормального закона распределения примут вид:
;
ПУНКТ 7 Гипотеза том, что выборка извлечена из генеральной совокупности с предполагаемым нормальным законом распределения
Гипотезу о том, что генеральная совокупность, из которой извлечена выборка, распределена по предлагаемому нормальному закону, назовем нулевой
(Но:Х N(a,σ)), тогда На:Х N(a, σ)
Проверяем ее с помощью критерии согласия χ2 Пирсона.
Согласно критерию Пирсона сравниваются эмпирические ni(наблюдаемые) и теоретические npi(вычисленные в предложении нормального распределения)
частоты. В качестве критерия проверка нулевой гипотезы принимается случайная величина.
По таблице критических точек распределения χ2 по заданному
уровню значимости а и числу степеней свободы v=S-r-1 находим критическое
значение χ2крит(а,v)
Если проверяется гипотеза о нормальном распределении, то вероятности pi рассчитываются с помощи функции Лапласа Ф(х):
где х=7.988, Sx=1.326
Вычисления сведем в таблицу.3 Количество интервалов S=6.
Так как предполагается нормальное распределение имеющее два параметра(математическое ожидание а и среднее квадратические отклонение σ), поэтому r=2, тогда число степеней свободы v=S-r-1=6-2-1=3
|
|
Таблица 3
Расчетная таблица для вычисления
интервалы (хi;хi+1) | частоты эмпирические ni | Вероятности рi | Теоретические частоты npi | |
(-∞;6.35] | 0.10935 | 10.93 | 0.3920 | |
(6.35;7.05] | 0.12335 | 12.34 | 4.7549 | |
(7.05;7.75] | 0.19588 | 19.59 | 19.59 | |
(7.75;8.45] | 0.20825 | 20.83 | 9.6576 | |
(8.45;9.15] | 0.17374 | 17.37 | 0.0228 | |
(9.15;9.85] | 0.10867 | 10.87 | 10.87 | |
(9.85;10.55] | 0.005396 | 5.40 | 5.8074 | |
(10.55;+ ∞] | 0.05396 | 2.68 | 0.0358 | |
Σ | 1.00 | 51.130 |
Значение =51.130
В таблицах критических точек распределения по уровню значимости а=0.05 и числу степеней свободы v=3 найдем критическое значение χ2крит(0.05,3) =7.815
Так как условие < χ2крит не выполняется будем считать, что гипотеза не согласуется с экспериментальными данными и ее надо отвергнуть