Методы обработки результатов наблюдений
Одним из основных способов изучения окружающего нас мира, средством познания было и остается наблюдение. Под наблюдением принято принимать целенаправленное восприятие свойств процессов и явлений. Опираясь на результаты наблюдения, человек строит физическую модель новых процессов и явлений, выдвигает научные гипотезы, делает открытия, создает теорию, принимает решения. Наблюдения сопровождается приемом, определенным преобразованием и регистрацией человеком информации о свойствах наблюдаемого объекта. Регистрация результатов наблюдения может производится как в памяти ( мозге) человека- наблюдателя, так и на специальных носителях информации ( бумаге, магнитной ленте, полотне художника, фотопленке и т.д.). Характер наблюдения существенным образом зависит от профессиональной направленности наблюдателя.
В то же время от наблюдения до принятия решения получаемая человеком информация претерпевает, как правило, существенные преобразования. Наиболее характерными этапами таких преобразований в большинстве сфер человеческой деятельности являются измерения и обработка результатов измерений.
Измерение состоит в сравнении наблюдаемой величины (свойства объекта) с эталоном и получении в результате этого ее численного значения. Если результаты наблюдений представлены в виде цифр и графиков, то имело место измерение. Иногда, кроме измерения, различают подсчет. Подсчет можно квалифицировать как завершающий этап наблюдения – регистрацию величин дискретного типа (число деталей, обрабатываемых за смену, и т.п.).
Допустим, что в результате n измерений случайной величины Х получена последовательность значений х1,х2,…, хn, которая называется простым статистическим рядом или выборкой. Обычно выборка оформляется в виде таблицы, в первой колонке которой стоит номер опыта i, а во второй значение случайной величины.
Первичная обработка выборки состоит в группировке найденных значений по достаточно малым интервалам, вычислении средних относительных частот для каждого интервала и графическом представлении результатов в виде гистограммы или эмпирической функции распределения. Число интервалов k можно определить по формуле:
k = 1+3,2 lgn.
Полученное значение округляют до ближайшего целого числа. Число интервалов не должно превышать 10-20. Ширина интервалов ∆х выбирается одинаковой и равной:
∆х = (хmax- xmin) /k.
Все значения случайной величины, попавшие в некоторый интервал, относятся к его середине.
Пример 1:Ежесуточный выпуск кузнечным цехом поковок m(т/сут) регистрировался в течении n=36 сут. Необходимо построить статический ряд, гистограмму и эмпирическую функцию распределения случайной величины m. Данные в таблице:
I | |||||||||
M | 1,8 | 32,7 | 3,6 | 1,9 | 25,1 | 25,4 | 5,3 | 6,6 | 24,7 |
I | |||||||||
M | 6,9 | 7,7 | 25,2 | 8,8 | 23,0 | 9,7 | 11,3 | 20,7 | 21,2 |
I | |||||||||
M | 21,8 | 12,7 | 21,5 | 13,3 | 21,8 | 13,0 | 14,5 | 15,8 | 14,1 |
I | |||||||||
M | 15,2 | 17,2 | 16,3 | 17,9 | 13,5 | 16,6 | 15,1 | 17,0 | 15,0 |
Решение:k= 1+3,2 lgn= 1=3,2∙lg36≈7 – число интервалов, на которые разбивается диапазон наблюдений.
Находим ширину интервала от 0 до 35 т/сут.
∆m=(mmax- mmin)/k= 35-0/7= 5 т/сут.
Результаты наблюдений можно свести в представленный ниже статистический ряд:
Параметр | Значения параметра по номеру интервала | ||||||
Интервал ∆m,т/сут | 0…5 | 5…10 | 10…15 | 15…20 | 20…25 | 25…30 | 30…35 |
Среднее ,т/сут | 2,5 | 7,5 | 12,5 | 17,5 | 22,5 | 27,5 | 32,5 |
Число наблюдений ni | 7,5 | 8,5 | |||||
Частота ni/n | 0,0833 | 0,1666 | 0,2084 | 0,2362 | 0,1944 | 0,0833 | 0,0278 |
Построение гистограммы: по оси абсцисс откладываем интервалы, и на каждом из них, как на основании, строится прямоугольник, площадь которого равна частоте данного интервала (с тем, чтобы площадь всей гистограммы была равна 1). В нашем случае все интервалы имеют одинаковую ширину и поэтому высоты прямоугольников равны соответствующим частотам (рис. 1).
Рис.1. Гистограмма ежесуточного выпуска поковок
Для построения эмпирической функции распределения достаточно несколько точек, в качестве которых удобно взять границы интервалов:
F(0)=0
F(5)= F(0)+n1/n= 0+0,0833= 0,0833
F(10)= F(5)+n2/n= 0,0833+0,1666= 0,2499
F(15)= F(10)+n3/n=0,2499+0,2084=0,4583
F(20)= F(15)+n4/n= 0,4583+0,2362=0,6945
F(25)= F(20)+n5/n= 0,6945+0,1944= 0,8889
F(30)= F(25)+n6/n= 0,8889+0,0833= 0,9722
F(35)= F(30)+n7/n= 0,9722+0,0278= 1.
График эмпирической функции распределения приведен на рис.2.
Рис. 2. Эмпирическая функция распределения ежесуточного выпуска поковок; штриховой линией показана кривая для нормального закона распределения
Важнейшими характеристиками эмпирического распределения являются среднее арифметическое значение (выборочное среднее) и среднее квадратичное отклонение (выборочная дисперсия)
; s2 .
При увеличении числа наблюдений n среднее арифметическое значение будет приближаться к математическому ожиданию, а среднее квадратичное отклонение – к дисперсии, т.е. при n→∞ справедливы соотношения: →M и s2→D .
Пример 2. Найти математическое ожидание, дисперсию и среднеквадратичное отклонение случайной величины, рассмотренной в примере 1.
Решение:
M =1/36(1,8+32,7+…+15,0) = 15,4 т/сут;
D = 1/35(1/8-15,4)2+(32,7-15,4)2+…+(15,0-15,4)2= 53,2(т/сут)2;
σ ≈ s = т/сут.
Пример 3 .Записать в виде вариационного и статистического рядов
выборку 5, 3, 7, 10, 5, 5, 2, 10, 7, 2, 7, 7, 4, 2, 4.
Решение. Объем выборки n = 15. Упорядочив элементы выборки по
величине, получим вариационный ряд
2, 2, 2, 3, 4, 4, 5, 5, 5, 7, 7, 7, 7, 10, 10 .
Статистический ряд записывается в виде таблицы
xi | ||||||
ni |
Пример 4.Определить выборочные среднее, дисперсию, моду и ме-
диану для выборки: 5, 6, 8, 2, 3, 1, 4, 1 .
Решение. Представим данные в виде вариационного ряда: 1, 1, 2, 3, 4,
5, 6, 8. Выборочное среднее находим по формуле (13.1).
= 1/8 (1+1+2+3+4+5+6+8) = 3,75.
Для расчета выборочной дисперсии воспользуемся формулой (13.3).
D ~ =8/7 ( 1/8 (1+1+4+9+16+25+36+64) - 3,752 ) = 6,21 .
Все элементы входят в выборку по одному разу, кроме 1, следовательно,
выборочная мода d X~= 1. Так как n = 8, то медиана hX~= 0,57 (3+4) =3,5.
Ответ: ; s2=6,21; dx=1; hx=3,5.