Вычисление числовых характеристик выборки
Введение
Математическая статистика-наука, разрабатывающая математические методы систематизации и использования статических данных для научных и практических выводов.
Во многих своих разделах математическая статистика опирается на теорию вероятности , дающую возможность оценить надежность и точность выводов, делаемых на основании ограниченного статического материала (например, оценить необходимый объем выборки для получения результатов требуемой точности при выборочном обследовании.
Исходные данные
Вариант 2
1,70 | 3,33 | 3,67 | 2,31 |
1,08 | -0,02 | 0,50 | -1,17 |
1,17 | 0,97 | 1,62 | 2,05 |
1,56 | 1,28 | -1,25 | -0,23 |
1,60 | 1,40 | -1,90 | 1,84 |
-1,28 | -0,99 | 0,18 | 5,27 |
-0,98 | 2,12 | 0,08 | -1,33 |
0,08 | 3,33 | 1,49 | 2,55 |
1,79 | 0,81 | -0,32 | -2,30 |
5,41 | 4,02 | 4,23 | 2,63 |
1,16 | 2,82 | 0,81 | -1,22 |
1,17 | 3,12 | 0,13 | 1,85 |
2,15 | 2,37 | 1,89 | 1,03 |
1,91 | 1,44 | 0,01 | 3,84 |
1,71 | 3,35 | -1,02 | 0,06 |
2,61 | 1,74 | -2,74 | 0,30 |
-1,16 | -0,50 | -0,06 | 1,46 |
0,21 | -0,31 | 0,08 | -0,47 |
1,06 | 2,36 | 1,78 | 1,51 |
-0,83 | 0,52 | -1,01 | 1,84 |
-1,43 | -3,11 | -0,67 | 2,48 |
-0,42 | 2,50 | 2,11 | 0,01 |
3,56 | -0,33 | -1,60 | 1,13 |
3,68 | 0,79 | -0,21 | 0,53 |
1,93 | -1,51 | 0,67 | 3,79 |
Порядок расчета
Составление вариационного ряда.
Представляем выборку в виде вариационного ряда –последовательности исходных величин ,записанных в возрастающем порядке.
-3,11 | -0,23 | 1,13 | 2,11 |
-2,74 | -0,21 | 1,16 | 2,12 |
-2,30 | -0,06 | 1,17 | 2,15 |
-1,90 | -0,02 | 1,17 | 2,31 |
-1,60 | 0,01 | 1,28 | 2,36 |
-1,51 | 0,01 | 1,40 | 2,37 |
-1,43 | 0,06 | 1,44 | 2,48 |
-1,33 | 0,08 | 1,46 | 2,50 |
-1,28 | 0,08 | 1,49 | 2,55 |
-1,25 | 0,08 | 1,51 | 2,61 |
-1,22 | 0,13 | 1,56 | 2,63 |
-1,17 | 0,18 | 1,60 | 2,82 |
-1,16 | 0,21 | 1,62 | 3,12 |
-1,02 | 0,30 | 1,70 | 3,33 |
-1,01 | 0,50 | 1,71 | 3,33 |
-0,99 | 0,52 | 1,74 | 3,35 |
-0,98 | 0,53 | 1,78 | 3,56 |
-0,83 | 0,67 | 1,79 | 3,67 |
-0,67 | 0,79 | 1,84 | 3,68 |
-0,50 | 0,81 | 1,84 | 3,79 |
-0,47 | 0,81 | 1,85 | 3,84 |
-0,42 | 0,97 | 1,89 | 4,02 |
-0,33 | 1,03 | 1,91 | 4,23 |
-0,32 | 1,06 | 1,93 | 5,27 |
-0,31 | 1,08 | 2,05 | 5,41 |
Составление сгруппированного статического ряда.
Найдены наименьший и наибольший элементы выборки:
Отрезок разбиваем на k равных по длине промежутков. При объеме выборки n=100 рекомендуется брать k=8. Число – частота попадания элементов выборки в j-й промежуток .
Таблица 1
Интер-вал | [-3,5; -2,375] | (-2.375; -1,25] | (-1,25; -0,125] | (-0,125; 1] | (1; 2,125] | (2,125; 3,25] | (3,25; 4,375] | (4,375; 5,5] |
Построение гистограммы выборки.
Для построения гистограммы дополним таблицу 1тремя строками :
, где - длина j –го промежутка ;
- относительная частота попадания элементов выборки в j-й промежуток (таблица 2).
Таблица 2
Интервал | [-3,5; -2,375] | (-2,375; -1,25] | (-1,25; -0,125] | (-0,125; 1] | (1; 2,125] | (2,125; 3,25] | (3,25; 4,375] | (4,375; 5,5] |
1,125 | 1,125 | 1,125 | 1,125 | 1,125 | 1,125 | 1,125 | 1,125 | |
0,02 | 0,08 | 0,17 | 0,2 | 0,3 | 0,11 | 0,1 | 0,02 | |
0,002 | 0,008 | 0,017 | 0,02 | 0,03 | 0,011 | 0,01 | 0,002 |
Рис. 1
Построение графика эмпирической функции распределения.
Для построения график эмпирической функции распределения в таблицу 1 добавляем две строки, в которых следует записать значения
(таблица 3).
Таблица 3
Интервал | [-3,5; -2,375] | (-2.375; -1,25] | (-1,25; -0,125] | (-0,125; 1] | (1; 2,125] | (2,125; 3,25] | (3,25; 4,375] | (4,375; 5,5] |
0,02 | 0,1 | 0,27 | 0,47 | 0,77 | 0,88 | 0,98 |
Значения эмпирической функции распределения равны ,
Если x принадлежит j-му промежутку; , если x≤ ;
и ,если х > . Получим
Рис. 2
Вычисление числовых характеристик выборки.
Для вычисления числовых характеристик выборки строим новый вариационный ряд . Обозначим - середину j-ого промежутка.
Для группированного ряда выборочное среднее и выборочная дисперсия вычисляются по формулам (таблица 4).
Таблица 4
Интервал | ||||
[-3,5; -2,375] | -2,9375 | -5,875 | 17,2578 | |
(-2.375; -1,25] | -1,8125 | -14,5 | 26,2812 | |
(-1,25; -0,125] | -0,6875 | -11,6875 | 8,0351 | |
(-0,125; 1] | 0,5625 | 11,25 | 6,3281 | |
(1; 2,125] | 1,5625 | 46,875 | 73,2421 | |
(2,125; 3,25] | 2,6875 | 29,5625 | 79,4492 | |
(3,25; 4,375] | 3,8125 | 38,125 | 145,3516 | |
(4,375; 5,5] | 4,939 | 9,878 | 48,7874 | |
Сумма | 103.628 | 404,7329 |
Подставляем величины , приведенные в таблице, получим:
Выборочное среднеквадратичное отклонение :
Составляем еще одну таблицу.
Таблица 5
Интервал | |||||
[-3,5; -2,375] | -2,9375 | -3,975 | -125,615 | 499,319 | |
(-2.375; -1,25] | -1,8125 | -2.8525 | -185,681 | 529,654 | |
(-1,25; -0,125] | -0,6875 | -1,7275 | -87,64 | 151,398 | |
(-0,125; 1] | 0,5625 | -0,4775 | -2,177 | 1,039 | |
(1; 2,125] | 1,5625 | 0,5225 | 4,279 | 2,236 | |
(2,125; 3,25] | 2,6875 | 1,6475 | 49,189 | 81,039 | |
(3,25; 4,375] | 3,8125 | 2,7725 | 213,115 | 590,862 | |
(4,375; 5,5] | 4,939 | 3,899 | 118,547 | 462,214 | |
Сумма | -15,983 | 2317,761 |
Коэффициенты асимметрии А и эксцесса Е вычисляются по формулам(с использованием таблицы 5):
Подставляя величины ,приведенные в таблице 5 ,получим:
6. Оценка истинного значения параметра .
Оценку истинного значения α ( математического ожидания) дает доверительный интервал, который для случая большой выборки определяется формулой
где значение находится из условия 2
Для доверительной вероятности (надежности ) по таблице значений функции Лапласа ,находим число 0,4750 наиболее близкое к /2. Это число расположено в строке именованной «1,9» ,и столбце с названием «6». Искомое значение , так как 2 . При и точности оценки с надежностью 0,95 доверительный интервал для математического ожидания (0,7; 1,38).
7. Оценка истинного значения параметра .
Оценку истинного значения σ дает доверительный интервал для среднеквадратического по формулу
По заданной доверительной вероятности по таблице значений Лапласа находим 2 , следовательно . Тогда с надежностью 0,85 доверительный интеграл для среднеквадратического отклонения σ имеет вид (1,56; 1,93).
8.Приверка нулевой гипотезы по критерию Пирсона.
Значения коэффициентов асимметрии A и Е, близкие к нулю, а также вид гистограммы позволяют выдвинуть гипотезу о том, что генеральная совокупность распределена по нормальному закону .
Проверим эту гипотезу с помощью критерия Пирсона.
a) по выборке вычислены точечные оценки математического ожидания и среднеквадратического отклонения
α = 1,04
σ = 1,72
b) Найдены теоретические вероятности попадания вариантов в каждый промежуток по формуле
и вычислим
Вычисления удобно проводить по таблице 6. Предварительно следует изменить таблицу 1,объединив первый интервал со вторым и седьмой интервал с восьмым ,так как в критерии Пирсона предполагается ,что количество вариантов в каждом интервале не меньше пяти. Крайние интервалы расширяются влево и вправо до бесконечности ,причем
c) Просуммировав числа последней строки , получаем
d) количество интервалов r вариационного ряда ,приведенного в таблице 6, равно 6. Число степенней свободы
е) Выбран уровень значимости
В таблице приложения 3 параметрам и соответствует значение
f) при выбранной надежности 0,85 .
Следовательно ,гипотеза отвергается, как маловероятная. Предположение о том, что исследуемая физическая величина распределена по нормальному закону с параметрами
не противоречит результатам измерений.
Значит, можно считать ,что функция плотности вероятности изучаемой физической величины имеет вид
График f(x) изображен на рисунке 3 сплошной линией. Отдельные точки на рисунке соответствуют последней строке таблицы 2, по которой строилась гистограмма. Очевидно, что теоретическое распределение вполне согласуется с результатами выборки.
Рис. 3