Учебное пособие по выполнению

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ

учебное пособие по выполнению - student2.ru ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ

РОССИЙСКИЙ ГОСУДАРСТВЕННЫЙ

ГЕОЛОГОРАЗВЕДОЧНЫЙ УНИВЕРСИТЕТ

Кафедра МАТЕМАТИКИ

учебное пособие по выполнению - student2.ru ЛАБОРАТОРИЯ КОМПЬЮТЕРНЫХ СРЕДСТВ ОБУЧЕНИЯ  

В. А. СИКОРСКИЙ

СТАТИСТИКА

УЧЕБНОЕ ПОСОБИЕ ПО ВЫПОЛНЕНИЮ

ЛАБОРАТОРНЫХ РАБОТ

учебное пособие по выполнению - student2.ru

МОСКВА 2017 г.

Лабораторная работа №1.

Выборочный метод, построение интегральной и дифференциальной функций распределения.

Геолога в первую очередь интересуют приемы сбора и обработки информации, определения статистических характеристик изучаемых признаков.

Определение 1.1

Множество однородных объектов, подлежащих статистическому изучению, называется стати­стической совокупностью.

В качестве статистической совокупности, которую называют генеральной, могут выступать горные породы. Тогда элементами этой совокупности будут образцы горных по­род. Горные породы можно охарактеризовать различными свойствами (признаками). Среди которых могут быть: плотность пород, магнитная восприимчивость, сопротивление, содержание химических элементов и другие.

Изучить всю генеральную совокупность принципиально невозможно или практически нецелесообразно. (Например, если совокупность содержит очень большое число объектов, то провести сплошное обследо­вание физически невозможно. Если обследование объекта связано с его уничтожением или требует больших материальных затрат, то проводить сплошное обследование практически не имеет смысла).

Поэтому прибегают к выборочному методу, суть которого состоит в том, что из генеральной совокупности отбирают сравнительно небольшую выборку объемом N образцов, изучают ее по интересующему исследователя признаку, а затем на основании ана­лиза выборки делают вывод обо всей генеральной совокупности.

Пример:

Дана выборка (объемом N =50) образцов горных пород, в каждом из которых определено содержание Аl2О3 в процентах.

Результаты измерений приведены в таблице:

15.1 18.7 14.3 16.1 12.8
14.7 19.1 15.5 13.5 15.1
16.7 11.2 13.4 12.4 14.7
17.2 13.6 12.7 13.7 17.3
15.2 12.2 16.2 14.9 15.6
14.1 20.6 14.9 13.2 14.2
16.4 18.3 17.4 12.3 16.9
17.8 12.8 21.8 14.8 17.7
9.1 14.6 13.8 10.8 13.1
12.1 15.7 15.4 14.7 15.6

Требуется построить эмпирические дифференциальную и интегральную функции распределения.

Решение поставленной задачи разобьем на этапы:

1) Определим интервал группирования.

Величину частичного интервала группирования можно приближенно оценить формулой Стирлинга.

 
  учебное пособие по выполнению - student2.ru

Здесь

хmax - максимальное значение признака в выборке.

хmin - минимальное значение признака в выборке.

N - объем выборки.

 
  учебное пособие по выполнению - student2.ru

В нашем случае хmax = 21.8 хmin = 9.1 N = 50, тогда:

Поскольку число интервалов выбирается произвольно, ориентируясь на полученное значение, примем в качестве интервала группирования ве­личину близкую, но более удобную, равную двум.

Таким образом: h » 2.

2) Разобьем весь интервал изменения измеренного признака на частичные интервалы длиной h = 2.

Для этого левая граница первого частичного интервала выбирается меньше минимального числа. То есть, например, 8.

Тогда интервалы группирования примут следующие значения:

(8..10)(10..12)(12..14)...(20..22).

 
  учебное пособие по выполнению - student2.ru

Найдем середины интервалов по формуле

Где аi - левая граница соответствующего интервала группирования;

b i - правая граница соответствующего интервала группирования.

3) Вычислим частоту попадания измеряемой величины в каждый ин­тервал n i.

Для этого определим, сколько образцов горных пород имеют значения изучаемого признака

от 8 до 10, таких 1;

от 10 до 12, таких 2;

от 12 до 14, таких 14 и так далее.

учебное пособие по выполнению - student2.ru Сумма всех частот должна быть равна объему выборки согласно фор­муле (11.2).

учебное пособие по выполнению - student2.ru

В нашем случае

m- количество интервалов группирования,

Вычислим относительные частоты, плотность относительных час­тот и накопленные относительные частоты.

учебное пособие по выполнению - student2.ru

Результаты сведём в таблицу:

Интервал x i n i w i v i учебное пособие по выполнению - student2.ru
8..10 10..12 12..14 14..16 0.02 0.04 0.28 0.36 0.01 0.02 0.14 0.18 0.02 0.06 0.34 0.70
16.. 18 0.20 0.10 0.90
18..20 0.06 0.03 0.96
20..22 0.04 0.02 1.0

Sn i =50 Sw i =1.0

4) На основании полученных результатов строим гистограммы.

Определение 1.2

Гистограммой, плотности относительных частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых являются частичные интервалы длиною h, а высотами - плотности от­носительных частот

v i =w i/h (1.1)

По гистограмме плотности относительных частот строят эмпирическую дифференциальную функцию распределения fэ(x), соеди­няя плавной линией середины верхних площадок прямоугольников.

Определение 1.3

Гистограммой накопленных относительных час­тот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых явля­ются частичные интервалы длиною h, а высоты равны значению накопленных относительных час­тот.

учебное пособие по выполнению - student2.ru (1.2)

По гистограмме накопленных относительных частот строят эмпирическую интегральную функцию распределения Fэ (x), соединяя

плавной линией правые верхние углы прямоугольников в соответствии с определением интегральной функции.

Fi учебное пособие по выполнению - student2.ru

учебное пособие по выполнению - student2.ru учебное пособие по выполнению - student2.ru учебное пособие по выполнению - student2.ru учебное пособие по выполнению - student2.ru учебное пособие по выполнению - student2.ru 1.0

0.8

учебное пособие по выполнению - student2.ru 0.6

0.4

учебное пособие по выполнению - student2.ru 0.2

учебное пособие по выполнению - student2.ru

8 10 12 14 16 18 20 22 X

учебное пособие по выполнению - student2.ru Vi

учебное пособие по выполнению - student2.ru учебное пособие по выполнению - student2.ru 0.2

0.15

 
  учебное пособие по выполнению - student2.ru

учебное пособие по выполнению - student2.ru 0.1

0.05

 
  учебное пособие по выполнению - student2.ru

8 10 12 14 16 18 20 22 X

Вопросы к первой лабораторной работе.

1. В чём смысл работы?

2. В чём суть выборочного метода?

3. Написать формулы и дать определения, которые использовались в первой лабораторной работе?.

4.Почему при построении интегральной функции сглаживающую линию проводим через правые точки верхних площадок?

5. Чему равна площадь ограниченная дифференциальной функцией?

Лабораторная работа №2.

Определение 2.3

Оценка называется состоятельной, если она стремится по вероятности к оцениваемому параметру при учебное пособие по выполнению - student2.ru .

Оценками математического ожидания являются:

выборочная средняя, мода и медиана.

Определение 2.4

Выборочной средней называют среднее арифметическое значение признака выборочной совокупности:

учебное пособие по выполнению - student2.ru (2.1),

где:

n- количество интервалов группирования,

i -середина интервала группирования,

n­­i- частота попадания в интервал группирования,

N - объём выборки.

Выборочная средняя есть несмещённая, эффективная и состоятельная оценка математического ожидания.

Определение 2.5

 
  учебное пособие по выполнению - student2.ru

Мода (M0) это абсцисса экстремума эмпирической дифференциальной функции распределения.

Определение 2.6:

 
  учебное пособие по выполнению - student2.ru

Медиана (Me) это абсцисса линии, которая делит площадь ограниченную дифференциальной функцией на две равные части.

 
  учебное пособие по выполнению - student2.ru

Оценками дисперсии являются:выборочная дисперсия и квадрат стандарта.

Определение 2.7

Выборочной дисперсией называют среднее арифметическое квадратов отклонений наблюдаемого значения признака от своего выборочного:

учебное пособие по выполнению - student2.ru (2.2)

Выборочная дисперсия является смещённой оценкой дисперсии, несмещённой оценкой дисперсии является квадрат стандарта:

учебное пособие по выполнению - student2.ru . (2.3)

Оценкой среднеквадратического отклонения является стандарт s .

Для оценки отклонения эмпирического распределения от нормального используют различные характеристики, в том числе асимметрию и эксцесс.

Определение 2.8

Асимметрией называется оценка центрального момента третьего порядка, делённая на s3.

учебное пособие по выполнению - student2.ru . (2.4)

Она характеризует различия в крутизне

склонов графика эмпирической дифференциальной функции распределения.

 
  учебное пособие по выполнению - student2.ru

Если X распределён по нормальному закону, асимметрия A=0. Если A>0, тогда правая ветвь дифференциальной функции пологая, а левая ветвь крутая. Если A<0, тогда правая ветвь дифференциальной функции крутая, а левая ветвь пологая.

Определение2.9

Эксцессом называется оценка центрального момента четвёртого порядка, делённая на s4 и минус 3.

учебное пособие по выполнению - student2.ru . (2.5)

Она характеризует различия в крутизне

вершины графика эмпирической дифференциальной функции распределения.

 
  учебное пособие по выполнению - student2.ru

Если X распределён по нормальному закону, тогда E=0.

Рассмотрим сквозной пример.

Пусть дана генеральная совокупность, из которой извлечена выборка объёмом N=50:

15.1 18.7 14.3 16.1 12.8 14.7 19.1 15.5 13.5 15.5

16.7 11.2 13.4 12.4 14.7 17.2 13.612.7 13.7 17.3

15.2 12.2 16.2 14.9 15.6 14.1 20.6 14.9 13.2 14.2

16.4 18.3 17.4 12.3 16.9 17.8 12.8 21.8 14.8 17.7

9.1 14.6 13.8 10.8 13.1 12.1 15.7 15.4 14.7 15.6

Для этой выборки известны

i -середины интервалов группирования,

n­­i- частота попадания в интервал группирования (см. §1).

Найдём учебное пособие по выполнению - student2.ru , s2, A, E.

Решение:

Найдём выборочную среднюю.

учебное пособие по выполнению - student2.ru

учебное пособие по выполнению - student2.ru

Заполним таблицу:

x­­­­i i- учебное пособие по выполнению - student2.ru =t t2 t3 t4 ni
-6.04 36.48 -220.34 1330.97
-4.04 16.32 -65.93 266.35
-2.04 4.16 -8,49 17,32
0.04 0.0016 0.000064 0.00000256
1.96 3.84 7.53 14.76
3.96 15.68 62.09 245.91
5.9 34.81 205.38 1211.74

Вычислим квадрат стандарта.

учебное пособие по выполнению - student2.ru .

учебное пособие по выполнению - student2.ru

Стандарт равен: учебное пособие по выполнению - student2.ru

Вычислим асимметрию.

учебное пособие по выполнению - student2.ru .

учебное пособие по выполнению - student2.ru

Вычислим эксцесс.

учебное пособие по выполнению - student2.ru .

учебное пособие по выполнению - student2.ru

Вопросы ко второй лабораторной работе.

1. В чём смысл работы?

2. Какие параметры распределения Вы знаете?

3. Какие оценки параметров распределения Вы знаете?

5. Написать формулы для второй лабораторной работы и сказать, что они характеризуют.

6. Дать определения характера оценок из второй лабораторной работы.

7. Показать на графике оценки математического ожидания.

Лабораторная работа №3.

Определение 3.2

Доверительным называется интервал учебное пособие по выполнению - student2.ru который с заданной надёжностью учебное пособие по выполнению - student2.ru включает в себя истинное значение математического ожидания a .

1. Доверительный интервал для математического ожидания нормального распределения признака при неизвестном s.

Пусть X распределён по нормальному закону с параметрами a и учебное пособие по выполнению - student2.ru , которые неизвестны.

Тогда для вероятности попадания истинного значения математического ожидания в интервал можем написать:

учебное пособие по выполнению - student2.ru (3.2)

где значение учебное пособие по выполнению - student2.ru - распределёно по закону Стьюдента и табулировано, его значение можно найти, зная учебное пособие по выполнению - student2.ru и N по таблице Приложения №3 (1).

2. Доверительный интервал для среднеквадратического отклонения s нормально распределённого признака.

Пусть существует генеральная совокупность, в которой изучается признак X, распределённый по нормальному закону учебное пособие по выполнению - student2.ru . Определим доверительный интервал для среднеквадратического отклонения s по заданному уровню значимости учебное пособие по выполнению - student2.ru и стандарту s.

учебное пособие по выполнению - student2.ru

Преобразуем двойное неравенство

учебное пособие по выполнению - student2.ru .

Положив учебное пособие по выполнению - student2.ru =q, получим

учебное пособие по выполнению - student2.ru ,

где q можно найти по таблице значений q = q (g, N) приложения №4, зная учебное пособие по выполнению - student2.ru и объём выборки N.

Смысл полученного выражения состоит в том, что с надёжностью учебное пособие по выполнению - student2.ru можно утверждать, что истинное значение среднеквадратического отклонения s находится в интервале учебное пособие по выполнению - student2.ru .

Рассмотрим сквозной пример.

Пусть признак X распределён по нормальному закону. Известно, что объём выборки N=50, s=2.4, учебное пособие по выполнению - student2.ru . Построить доверительный интервал для математического ожидания a и среднего квадратического отклонения s с заданным уровнем значимости учебное пособие по выполнению - student2.ru =0.95.

Решение:

1. Вычислим доверительный интервал для математического ожидания a:

Зная N=50 и учебное пособие по выполнению - student2.ru =0.95, по таблицам приложения №3 найдём учебное пособие по выполнению - student2.ru =2.009.

учебное пособие по выполнению - student2.ru

15.04- учебное пособие по выполнению - student2.ru <a<15.04+ учебное пособие по выполнению - student2.ru

14.35<a<15.72

Вывод: С надежностью 0.95 можно утверждать, что истинное значение математического ожидания попадет в интервал (14.35; 15.72).

2. Вычислим доверительный интервал для среднего квадратического отклонения s:

Зная N=50 и учебное пособие по выполнению - student2.ru =0.95, по таблицам приложения №4 найдём q=0.21.

учебное пособие по выполнению - student2.ru

учебное пособие по выполнению - student2.ru

учебное пособие по выполнению - student2.ru

Вывод: С надежностью 0.95 можно утверждать, что среднеквадратическое отклонение попадет в интервал (1.89 ; 2.9).

Вопросы к 3-ей лабораторной работе.

1.В чём смысл работы?

2. В чём смысл доверительного интервала?

3. Написать формулы третьей лабораторной работы.

4. Как будет вести себя интервал с увеличением надежности?

Лабораторная работа №4.

Рис. 4.1

Определение 4.2

Ошибкой второго рода называется cобытие, состоящее в том, что мы принимаем нулевую гипотезу в то время, как на самом деле она не верна.

учебное пособие по выполнению - student2.ru

В общем виде:

учебное пособие по выполнению - student2.ru (4.3)

Если х распределен по нормальному закону, и извесны его математическое ожидание учебное пособие по выполнению - student2.ru и среднеквадратическое отклонение учебное пособие по выполнению - student2.ru , то

учебное пособие по выполнению - student2.ru

учебное пособие по выполнению - student2.ru (4.4)

Определение 4.3

(1 – β) называется мощностью крите-

рия.

2. Разделение горных пород на два класса

В геологической практике при поисках и разведке полезных ископаемых постоянно возникает задача классификации объектов на два класса. Это может быть разделение объектов на рудные и безрудные, выделение одной горной породы на фоне другой, выделение геохимических аномалий, связанных с определенными геологическими явлениями среди других геохимических аномалий.

Во всех случаях мы сталкиваемся с задачей разделения объектов на два класса по изучаемому признаку.

Обычно задача классификации состоит из двух этапов.

На первом этапе (этапе обучения) по выборкам из имеющихся двух классов на эталонных объектах, определяется решающее правило, а также ошибки учебное пособие по выполнению - student2.ru и надежность классификации.

На втором этапе классифицируют уже неизвестные объекты по изучаемому признаку, т.е относят их к тому или иному классу в соответствии с выработанным критерием.

Итак, пусть имеется два класса горных пород, в которых изучается какое-либо свойство. И пусть взяты выборки из каждого класса

R1
f2(x)
x
xk
β
α
R2
f1(x)
f(x)
учебное пособие по выполнению - student2.ru на этапе обучения. В результате анализа данных двух выборок построены эмпирические функции плотности распределения каждого класса.

 
  учебное пособие по выполнению - student2.ru

Рис 4.1

При проведении геологических работ необходимо по измеряемому параметру Х отнести образцы горной породы к одному, либо к другому классу.

Таким образом, выдвигаются две гипотезы:

Гипотеза H1 - образец горной породы относится к I классу.

Гипотеза H2 - образец горной породы относится ко 2 классу.

Будем полагать, что нам известны априорные (известные до опыта) вероятности встречи горной породы в районе (вероятности гипотез) P(H1) и P(H2).

P(H1)+P(H2)=1

При выборе xk, т.е. при разделении пространства признака Х на два (R1 и R2) необходимо учитывать, с чем сопряжено совершение ошибок 1 и 2 рода.

Пусть С12- стоимость ошибки первого рода,

С21- стоимость ошибки второго рода,

С11 и С22 - стоимости правильных решений.

Вероятности правильных решений вычисляются по формулам:

учебное пособие по выполнению - student2.ru ; учебное пособие по выполнению - student2.ru

Тогда средняя стоимость, которую приходится платить при многократном распознавании неизвестных объектов, равна сумме стоимостей неправильных и правильных решений с учетом вероятностей их появлений и априорных вероятностей.

учебное пособие по выполнению - student2.ru (4.4)

Определение 4.4

Отношение плотностей вероятностей называется коэффициентом правдоподобия.

учебное пособие по выполнению - student2.ru

Если С11 = С22 = 0, т.е. если нет затрат на правильное решение,

С12 = С1, а С21 = С2, отношение правдоподобия равно:

учебное пособие по выполнению - student2.ru (4.5)

При одинаковых стоимостях ошибок С1 = С2 учебное пособие по выполнению - student2.ru .

Критерий Кательникова

Если же априорные вероятности равны P(H1) = P(H2) = 0.5, то учебное пособие по выполнению - student2.ru

Критерий максимального правдоподобия

Следовательно, в этом случае xk есть абсцисса точки пересечения дифференциальных функций распределения f1(x) и f2(x).

1. Область R1 состоит из значений х, для которых учебное пособие по выполнению - student2.ru <1, при этом x < xk.

2. Область R2 состоит из значений х, для которых учебное пособие по выполнению - student2.ru >1, при этом х > xk.

Определение 4.5

Стратегия решений, при которой критическая точка выбирается так, что минимизирует средний риск (средняя стоимость) называется стратегией Байеса.

Рассмотрим пример разделения горных пород на два класса по изучаемому признаку.

Пусть в некотором районе имеются два класса пегматитов - рудные и безрудные. На хорошо геологически изученных участках из каждого класса пегматитов взяты выборки, в которых изучено какое-либо свойство Х. Полученные данные обработаны: для каждой выборки определены эмпирические функции распределения и функции плотности распределения. Результаты обработки сведены в таблицы.

1 класс.

учебное пособие по выполнению - student2.ru ni Wi Vi Fi
8-10 0,02 0,01 0,02
10-12 0,04 0,02 0,06
12-14 0,28 0,14 0,34
14-16 0,36 0,18 0,70
16-18 0,20 0,10 0,90
18-20 0,06 0,03 0,96
20-22 0,04 0,02 1,00

2 класс

учебное пособие по выполнению - student2.ru ni Wi Vi Fi
8,2-9,4 0,04 0,033 0,04
9,4-10,6 0,18 0,150 0,22
10,6 0,32 0,267 0,54
11,8-13,0 0,28 0,233 0,82
13,0-14,2 0,16 0,133 0,98
14,2-15,4 0,02 0,017 1,00

 
  учебное пособие по выполнению - student2.ru

 
 
xk
 
V2
V2
a
b
β=0,13
учебное пособие по выполнению - student2.ru
b
a
V2
учебное пособие по выполнению - student2.ru
x
Fэ
α=0,24
Vi
x

Vi
 
Рис.4.2

По полученным данным требуется установить решающее правило (критерий разделения пород на два класса по изучаемому признаку) и оценить ошибки диагностики при массовом распознавании образцов пегматитов. Фактически, изучив свойство Х образца, взятого из исследуемого пегматитового тела, следует отнести его к классу рудных пегматитов или к классу безрудных.

Решающее правило будем строить исходя из стратегии Байеса. При равных априорных вероятностях гипотез P(H1) = P(H2) = 0,5 критическая точка хk выбирается как абсцисса точки пересечения эмпирических кривых функции плотности распределения. Рис.1.3.5. Следовательно, если исследуемый образец характеризуется свойством х < xk, его следует отнести к 1 классу, если х > xk - ко второму.

При массовом распознавании мы будем совершать ошибки. Ошибка первого рода учебное пособие по выполнению - student2.ru , а ошибка второго рода учебное пособие по выполнению - student2.ru . Эти ошибки могут быть определены по графикам эмпирических функций распределения. В рассмотренном примере хk = 13,3; учебное пособие по выполнению - student2.ru учебное пособие по выполнению - student2.ru .Общая ошибка диагностики

g = 0,5×0.13+0.5 × 0.24 = 0.185

Вопросы к четвёртой лабораторной работе.

1.В чём смысл работы?

2. В чём суть стратегии Байеса?

3. Дать определения ошибок первого и второго рода, написать формулы и показать на графике.

4. Написать формулы для критерия Котельникова и критерия максимального правдоподобия.

Лабораторная работа №5.

Вопросы к пятой лабораторной работе

1.В чём смысл работы?

2. Из какого предположения выполняем четвёртую лабораторную работу?

3. Написать формулу нормального закона распределения, построить его график.

4. Как выглядит Закон Гаусса (формула, график).

Лабораторная работа №6.

Проверка гипотезы о нормальном законе распределения.

Критерий Неймана –Пирсона

При изучении геологических процессов и явлений часто приходится проверять гипотезу о том, что выборка распределена по нормальному закону.

Будем пользоваться стратегией Неймана-Пирсона, суть которой состоит в том, что критическая точка определяется при заранее заданном уровне значимости учебное пособие по выполнению - student2.ru . При этом минимизируется ошибка второго рода учебное пособие по выполнению - student2.ru .

В качестве критерия проверки гипотезы о нормальном законе распределения будем использовать критерий Пирсона или учебное пособие по выполнению - student2.ru .

Будем сравнивать эмпирические частоты ni , взятые из первой лабораторной работы и теоретические учебное пособие по выполнению - student2.ru частоты, вычисленные по формуле:

учебное пособие по выполнению - student2.ru (6.1)

Оценку расхождения между теоретической кривой нормального распределения и эмпирической кривой, полученной в результате опыта проводят, по величине отклонения учебное пособие по выполнению - student2.ru .

Задача формулируется так: при уровне значимости учебное пособие по выполнению - student2.ru требуется проверить нулевую гипотезу Ho о том, что генеральная совокупность распределена по нормальному закону.

Для проверки нулевой гипотезы о нормальном законе распределения рассмотрим случайную величину учебное пособие по выполнению - student2.ru , наблюдаемое значение которой вычисляются по формуле:

учебное пособие по выполнению - student2.ru (6.2)

Эта величина, как сумма квадратов нормально распределенных величин при учебное пособие по выполнению - student2.ru , распределена по закону учебное пособие по выполнению - student2.ru с числом степеней свободы: k = m - r - 1,

где:

m- число интервалов группирования .

r- число параметров, определяющих закон распределения. (Для нормального закона r = 2)

Построим критическую область из условия заданной ошибки первого рода (уровень значимости) учебное пособие по выполнению - student2.ru .

учебное пособие по выполнению - student2.ru

По таблице распределения c2 приложение №5 (1) находим учебное пособие по выполнению - student2.ru и

при учебное пособие по выполнению - student2.ru делаем вывод о том, что нет оснований отвергать Ho;

при учебное пособие по выполнению - student2.ru - гипотезу Ho отвергаем.

Рассмотрим сквозной пример.

При решении задачи все расчеты запишем в таблицу.

Таблица 6.1

N xi ni n'i=NPi учебное пособие по выполнению - student2.ru
0.33
16,0 0.25
12,0 0.33
0.2
    N=50 N=50 учебное пособие по выполнению - student2.ru

По заданному уровню значимости учебное пособие по выполнению - student2.ru =0,05 и числу степеней свободы k = 7-2-1=4 определяем критическое значение учебное пособие по выполнению - student2.ru . учебное пособие по выполнению - student2.ru = 9,5

Сравнивая учебное пособие по выполнению - student2.ru c учебное пособие по выполнению - student2.ru делаем вывод:

учебное пособие по выполнению - student2.ru , следовательно, нет оснований отвергать нулевую гипотезу Ho.

Таким образом, с надежностью 0.95 можно утверждать, что эмпирические данные не противоречат нормальному закону, т.е. имеющиеся расхождения носят случайный характер.

Вопросы к шестой лабораторной работе.

1.В чём смысл работы?

2. Написать критерий учебное пособие по выполнению - student2.ru

3. Почему, когда учебное пособие по выполнению - student2.ru – мы говорим нет, основания отвергать нулевую гипотезу?

4.В чём суть стратегии Неймана Пирсона?

5. Дать определение ошибки первого рода и написать формулу.

6. Пояснить смысл полученного результата в пятой лабораторной работе.

8. Можно ли с помощью критерия учебное пособие по выполнению - student2.ru проверить гипотезу о другом законе распределения?

Лабораторная работа №7.

Определение 7.3

Угловой коэффициент прямой линии регрессии

Y на X называют выборочным коэффициентом

регрессии Y на X и обозначают r .

учебное пособие по выполнению - student2.ru ( 7.1)

Будем пользоваться методом наименьших квадратов, суть которого состоит в том, что из всех возможных линий на плоскости (из всех возможных значений учебное пособие по выполнению - student2.ru
r и b) нужно выбрать такие, сумма квадратов отклонений (εi)2 , которых от линии регрессии была бы наименьшей.

учебное пособие по выполнению - student2.ru

Рис.7.1

Из рисунка видно, что εi - отклонение наблюдаемого значения yi от линии регрессии учебное пособие по выполнению - student2.ru . Наша задача – найти такое уравнение, чтобы учебное пособие по выполнению - student2.ru ( i =1,2,…N), было бы минимальным.

учебное пособие по выполнению - student2.ru

учебное пособие по выполнению - student2.ru –наблюдаемая ордината, соответствующая хi

Уравнение регрессии Y на X имеет вид:

учебное пособие по выполнению - student2.ru

учебное пособие по выполнению - student2.ru (7. 2)

Аналогично запишем уравнение прямой линии регрессии X на Y: учебное пособие по выполнению - student2.ru (7.3)

 
  учебное пособие по выполнению - student2.ru

Рис. 7..2

Выборочный коэффициент корреляции определяется равенством:

учебное пособие по выполнению - student2.ru (7. 4)

Коэффициент корреляции r изменяется от -1 до 1:

-1 £ r £ 1

Известно, что если величины X и Y независимы, то коэффициент корреляции r = 0; если r = ±1, то X и Y связаны линейной функцианальной зависимостью.

Cледовательно, коэффициент корреляции измеряет силу (тесноту) линейной связи между X и Y.

Выборочный коэффициент корреляции rв является оценкой коэффициента корреляции r генеральной совокупности и поэтому также служит для измерения линейной связи между величинами – количественными признаками X и Y.

Рассмотрим различные примеры вида корреляционного облака и линий регрессии для некоторых значений r. Они приведены на следующих графиках:

 
  учебное пособие по выполнению - student2.ru

 
  учебное пособие по выполнению - student2.ru

 
  учебное пособие по выполнению - student2.ru

Рис.7.3

Пример.

Дана выборка объёмом N = 34

Наши рекомендации

X Y X Y
60.8 5.44 48.4 3.16
58.2 4.13 42.7 3.45
55.4 3.82 52.5 5.28
54.0 0.56 53.2 2.59
44.6 4.61 46.7 1.34
49.5 5.62 37.2 0.69
48.9 0.28 51.4 3.97
35.8 4.10 52.8 3.66
50.6 0.00 43.8 4.30
53.6 0.34 56.0 4.58
44.0 1.15 54.4 3.23