Определение остаточного ресурса трубопровода методами математической статистики
Цели работы: ознакомиться с основами математической статистики; научиться определять остаточный ресурс трубопроводов по результатам замеров толщины стенки; решить приведенную задачу.
Краткие теоретические сведения
1. Случайные величины и законы распределения.
Под случайной величиной понимают такую величину, значение которой принципиально нельзя предсказать исходя из условий проведения опыта. Случайная величина обладает целым набором допустимых значений, но в результате каждого отдельного опыта принимает лишь какое-то одно из них. Непредсказуемость значений случайной величины обусловлена наличием случайных факторов, влияние которых на результаты опыта не поддается точной оценке.
Случайные величины бывают дискретные и непрерывные. Возможные значения дискретных случайных величин можно перечислить заранее. Для непрерывных случайных величин можно указать только диапазон их возможных значений. Например, можно точно перечислить количество элементов трубопровода, которые выйдут из строя в течение года (от 0 до n элементов), но нельзя перечислить значения скорости их износа или время выхода из рабочего состояния.
Дискретную случайную величину Х можно задать вероятностным рядом, указав вероятность рi для каждого значения хi:
хi | x1 | x2 | х3 | . . . | xn | ||
рi | p1 | p2 | p3 | . . . | pn |
Соотношение, устанавливающее связь между возможными значениями случайной величины и соответствующими им вероятностями, называется законом распределения.
Распределение непрерывной случайной величины нельзя задать при помощи вероятностей отдельных значений. Число значений настолько велико, что вероятность появления большинства из них равна нулю. Для непрерывных случайных величин изучается вероятность того, что в результате опыта значение случайной величины попадет в некоторую заранее намеченную совокупность чисел. Если принять, что х – произвольное действительное число, а Х – случайная величина, то вероятность появления Х < х является функцией от х и называется функцией распределения случайной величины,
Р(Х < х) = F(x). (1)
В виде функции распределения можно задать распределение как непрерывной, так и дискретной случайной величины (рис. 1, а, б). Ордината кривой F(x), соответствующая точке х1, представляет вероятность того, что случайная величина окажется меньше х1. Разность ординат, соответствующая точкам х1 и х2, дает вероятность того, что значения случайной величины будут лежать в интервале между х1 и х2.
а б
Рис. 1. Функции распределения непрерывной а и дискретной б случайных величин
Р(х1 £ Х £ х2)= F(x2) – F(x1). (2) |
Значения функции при предельных значениях аргумента соответственно равны 0 и 1:
F(–¥) = 0; F(+¥) = 1. (3) |
Производная функции распределения называется плотностью распределения случайной величины Х (рис. 2).
Функция f(x) так же, как и F(x), полностью определяет случайную величину. Площадь, ограниченная осью х, прямыми х = х1 и х = х2, и кривой плотности распределения, равна вероятности того, что случайная величина примет значения из интервала х1 ¸ х2:
. (4)
Рис. 2. Плотность распределения непрерывной
случайной величины
Полная площадь под кривой плотности распределения определяется как
. (5) |
2. Числовые характеристики.
В большинстве прикладных задач оперируют не с законами распределения, а с числовыми характеристиками, выражающими характерные особенности случайной величины. Числовые характеристики бывают интегральными (моменты) и точечными (квантили). Квантилем хр распределения случайной величины Х с функцией распределения F(x) (рис. 3) называется решение уравнения
F(xp) = p, (6)
т.е. хр такое значение случайной величины, при котором
Р(Х < хр) = р. (7)
Если известны два квантиля хр и хq, то
Р(хр £ Х £ хq) = q – р. (8)
Наиболее важное значение имеет квантиль х0,5, называемый медианой распределения. Ордината медианы рассекает кривую вероятности пополам. Если распределение симметрично, то х0,5 = mх.
Квантили хр и хр–1 называют симметричными. Для симметричного относительно нуля распределения всегда
хр = –х1–p . (9)
Рис. 3. Квантили распределения случайной величины
3. Нормальное распределение.
Случайная величина Х называется распределенной по нормальному закону, если ее плотность распределения имеет вид
, (10)
где –¥ < x < ¥.
Функция распределения соответственно запишется как
. (11)
Плотность и функция распределения нормированной случайной величины соответственно определяются как
, (12)
. (13)
Нормальное распределение нормированной случайной величины называется стандартным.
Графики плотности и функции нормального распределения нормированной случайной величины приведены на рис. 4, а, б.
а б
Рис. 4. Плотность а и функция б распределения нормированной случайной величины
Нормальное распределение часто встречается на практике и теоретически наиболее полно разработано. Нормальный закон распределения широко используется при обработке наблюдений.
4. Доверительные интервалы и доверительная вероятность.
На практике всегда располагают ограниченным числом значений случайной величины, представляющим собой некоторую выборку из генеральной совокупности. Под генеральной совокупностью понимают все допустимые значения случайной величины. Выборка является репрезентативной (представительной), если она дает достаточное представление об особенностях генеральной совокупности. Если о генеральной совокупности ничего не известно, единственной гарантией репрезентативности является случайный отбор. Выборочные параметры являются случайными величинами, их отклонения от генеральных также будут случайными. Оценка этих отклонений носит вероятностный характер, т.е. можно лишь указать вероятность той или иной погрешности. Для оценки отклонений в математической статистике пользуются доверительными интервалами и доверительными вероятностями. Доверительная вероятность характеризует надежность полученной оценки.
Пусть имеется выборка объема n значений случайной величины. Наилучшей оценкой для математического ожидания mx является среднее выборки :
. (14)
Тогда доверительный интервал для математического ожидания будет иметь вид
, (15)
где – квантиль стандартного нормального распределения, р – уровень значимости.
Другими словами, с заданной вероятностью регламентируется, что mx (истинное среднее значение) отличается от среднего выборочного значения на величину не более .
Стандартное нормальное распределение симметрично относительно нуля, поэтому
, (16)
В случае односторонней оценки математического ожидания, т.е. оценки только сверху или только снизу квантили берутся для вероятности и соответственно.
Определить доверительный интервал описанным выше способом можно только в том случае, если известна генеральная дисперсия . Получить генеральную дисперсию из наблюдений нельзя, ее можно только оценить при помощи выборочной дисперсии s2. Ошибка от замены генеральной дисперсии выборочной будет уменьшаться с увеличением объема выборки. На практике эту погрешность не учитывают при n ³ 50 и в формуле (15) для доверительного интервала генеральный параметр заменяют выборочным стандартом.
При небольших объемах выборки для построения доверительного интервала используют распределение Стьюдента или t-распределение. Распределение Стьюдента имеет случайная величина t:
. (17)
Плотность вероятности t-распределения имеет вид
, –¥ < t < ¥, (18)
где Г – гамма-функция; f – число степеней свободы выборки. Если дисперсия s2 и среднее определяются по одной и той же выборке, то f = n – 1.
Таким образом, распределение Стьюдента зависит только от числа степеней свободы f, с которым была определена выборочная дисперсия. На рис. 5 приведены графики плотности t-распределения для f = 1, f = 5 и f = 50.
Рис. 5. Плотность распределения Стьюдента
Из рисунка видно, что при f = 50 распределение Стьюдента практически совпадает с нормальным распределением (см. рис. 4, а). Так же, как и нормальное, распределение Стьюдента является симметричным.
Доверительный интервал для математического ожидания распределения имеет вид
, (19)
где – квантиль распределения Стьюдента; s – среднеквадратическое отклонение, определенное по данным выборки.
5. Определение общей дисперсии для серии параллельных опытов.
Общая дисперсия всех опытов определяется как средневзвешенное значение частных дисперсий, где в качестве весов берутся степени свободы:
. (20)
Учитывая, что число степеней общей дисперсии
, (21)
а частные дисперсии определяются по формуле
, (22)
окончательно имеем
. (23)
где n – количество серий опытов; j – порядковый номер серии опытов (j = 1, …, n); mj – количество опытов в j-й серии; i – порядковый номер опыта внутри j-й серии (i = 1, …, mj); – значения параметров внутри j-й серии опытов; – среднее значение параметра в j-й серии опытов.
Число степеней свободы общей дисперсии воспроизводимости, определяемой по формуле (23), всегда больше, чем у каждой дисперсии в отдельности. Поэтому общая дисперсия намного точнее оценивает дисперсию генеральной совокупности .
6. Оценка дисперсии нормально распределенной случайной величины.
Дисперсию генеральной совокупности нормально распределенной случайной величины можно оценить, если известно распределение ее оценки – выборочной дисперсии . Распределение выборочной дисперсии можно получить с помощью распределения Пирсона или -расп-ределения. В этом случае доверительные двусторонние границы для генеральной дисперсии определяются выражением
. (24)
Для односторонней доверительной оценки используются соответственно квантили и . Значения квантилей распределения Пирсона приведены в приложении 5.
При числе степеней свободы f ≥ 30 доверительные границы для генерального стандарта определяются неравенством
. (25)
7. Проверка однородности результатов измерений.
При выполнении измерений могут встретиться результаты, значительно отличающиеся от других аналогичных. Причинами отличий могут быть неаккуратность выполнения замеров, поломка приборов, действительное отклонение параметра от среднестатистического (например, при язвенной коррозии материала) и т.п. Наличие грубой ошибки (или отклонения) в выборке значений случайной величины нарушает характер распределения и изменяет его параметры, т.е. нарушает однородность наблюдений. Поэтому выявление грубых ошибок можно трактовать как проверку однородности наблюдений, т.е. проверку гипотезы о том, что все элементы выборки получены из одной и той же генеральной совокупности.
Если какой-либо результат измерения хi лежит за пределами интервала (xmin ¸ xmax), то он будет считаться не принадлежащим к данной выборке и должен быть исключен из последующих расчетов. Значения xmin и xmax определяются по формулам
(26)
Значения параметра для различных уровней значимости и степеней свободы приведены в приложении 3.
Задача
По результатам замеров толщины стенки, выданных преподавателем, определить среднюю скорость износа и остаточный ресурс трубопровода.
Ход работы:
1. Получить у преподавателя результаты замеров толщины стенки трубопровода.
2. Определить средние значения толщины стенки по годам диагностирования:
.
3. Определить частные выборочные значения дисперсии и стандарта для средней толщины стенки по годам диагностирования:
; .
4. Используя результаты вычислений для 10 %-ного (здесь и далее р = 10 %) уровня значимости, выполненные по формулам
; ,
проверить на однородность результаты замеров толщины стенки по годам диагностирования. При выявлении неоднородных замеров их требуется исключить из первоначальной выборки и повторить расчет, начиная с п. 2. Значение числа степеней свободы при проверке однородности результатов замеров определяется по формуле f = nj – 2.
5. Определить общие выборочные значения дисперсии и стандарта :
, ,
где .
6. Оценить генеральную дисперсию замеров толщины стенки и определить среднеквадратическое отклонение (значения квантилей распределения Пирсона приведены в приложении 5):
- при по формулам ; .
- при по формуле .
7. Определить интервальную оценку толщины стенки, учитывающую доверительный интервал, определенный по критерию Стьюдента и оценку генеральной дисперсии, определенную по п. 6 (значения квантилей распределения Стьюдента для числа степеней свободы fo брать в приложении 4, квантилей нормального распределения в приложении 6):
.
8. Определить коэффициенты уравнения характеризующего закон износа:
; .
9. Определить гамма-процентный остаточный ресурс трубопровода:
.
10. Построить графические зависимости: средней толщины стенки ; расчетной толщины стенки и расчетной толщины стенки, взятой с учетом интервальной оценки от срока службы трубопровода Т.
11. Написать вывод по работе.
Условные обозначения:
j – порядковый номер диагностирования трубопровода (j = 0, …, N), где j = 0 соответствует дате монтажа трубопровода;
N – количество диагностирований;
Тj – дата диагностирования соответствующая j,год;
nj – количество замеров в j-м диагностировании;
Sj,i – i-езначение толщины стенки в j-м диагностировании (i = 1, …, nj), мм;
Scpj– средняя толщина стенки в j-м диагностировании, мм;
Soт – отбраковочная толщина стенки, мм;
, – частные выборочные значения дисперсии и стандарта соответственно;
– верхняя и нижняя границы однородных значений толщины стенки, соответствующих j-му диагностированию.
fo – общее число степеней свободы;
, – общие выборочные значения дисперсии стандарта соответственно;
∆S – интервальная оценка средней толщины стенки;
– квантиль распределения Пирсона;
– квантиль распределения Стьюдента;
– квантиль нормального распределения.
Лабораторная работа № 6