Некоторые положения математической статистики
Параметры, определяющие технологический процесс ОМД или работу оборудования, являются величинами случайными.
Допустим, что необходимо измерить неизвестную величину Х. Проводя измерения, обнаруживаем, что между результатами отдельных измерений существуют некоторые расхождения.
Генеральной совокупностью случайной величины Х называется все множество возможных измерений. Как правило, для параметров, связанных с обработкой металлов давлением, такое множество можно считать бесконечным: например сопротивление деформации материала определенной марки, сила штамповки некоторой поковки при крупносерийном производстве и т.д.При проведении экспериментов ограничиваются определенным числом измерений n.Совокупность (Х1,Х2,...,Хn) nнезависимых случайных величин Хi, распределенных по одному и тому же закону, совпадающему с законом распределения случайной величины Х, называется выборкой объема n из генеральной совокупности Х. Задача математической статистики на основании знания свойств выборки сделать вывод о генеральной совокупности. Если(Х1,…,Хn) выборка, то последовательность чисел(х1,...,хn) называется реализацией этой выборки.
Рисунок 25. Типовая гистограмма
Получив экспериментальным путем выборку Хi, представим ее на графике в следующем виде (рисунок 25). Рассмотрим небольшие равные интервалы подсчитаем число результатов измерений, попадающих в каждый из этих интервалов. График зависимости числа результатов измерений, попадающих в каждый интервал, от средних значений Х для каждого интервала называется гистограммой. Чем больше результатов измерений будет снято, тем меньший интервал можно взять, и в пределе получим некоторую плавную кривую, называемую кривой распределения, или кривой плотности вероятности (рисунок 26).
Наиболее часто встречается распределение Гаусса, или нормальное распределение. Оно имеет место, если:
1) окончательная ошибка любого измерения представляет собой результат большого числа очень малых ошибок, распределенных случайным образом;
2) положительные и отрицательные отклонения относительного значения равновероятны.
Для распределения Гаусса частота появления отклонения y как функция величины отклонения x:
y= ,
где частота появления нулевого отклонения; x0 – точное (или среднее) значение измеряемой величины; постоянная, характеризующая данное нормальное распределение, называемая модулем, или показателем, точности.
Рисунок 26. Кривая плотности вероятности
Если функция распределения неизвестна, можно на основе реализации(x1,...xn) выборки объема n из генеральной совокупности Х построить некоторое приближение к F(х) с помощью функции
Wn(x)=n(x)/n,
где n(x)–число значений Хi, меньше, чем Х.
Функция W(x) называется реализацией эмпирической функции распределения.
Пусть (Х1,...Хn) –некоторая выборка, а(x1,...xn) –реализация этой выборки. Функция n переменных xi
=y(Х1,...Хn)
называется выборочной функцией, а ее конкретное значение для реализации выборки
=y(x1,...xn)
называется реализацией выборочной функции.
Конкретные выборочные функции.
1. – выборочное среднее;
– реализация выборочного среднего.
2. – выборочная дисперсия;
– реализация выборочной дисперсии.
Выборочная средняя, выборочная дисперсия и эксцесс (смещение максимума кривой плотности вероятности от среднего значения) называются моментами случайной величины. Среднее значение, определенное для генеральной совокупности, называется также математическим ожиданием.
Проверка статических гипотез
Статическая гипотеза – предположение о законах и параметрах распределения, проверяемое по выборке. Пусть f(Х, )–закон распределения случайной величины Х, зависящий от одного параметра ϴ. Предположим, что необходимо проверить гипотезу ϴ=ϴ0. Назовем эту гипотезу нулевой и обозначим Н0.
Гипотеза ϴ=ϴ1 считается конкурирующей и называется альтернативной или альтернативой. Обозначим ее Н1. Всё возможное множество выборок объема n можно разбить на два непересекающихся подмножества: Д–гипотеза принимается, и К–гипотеза отвергается. ПодмножествоК называется критической областью, Д–областью допустимых значений.
Правило, устанавливающее условие, при котором проверяемая гипотеза принимается или отвергается, называется статическим критериемK.
Проверка статической гипотезы основывается на принципе, в соответствии с которым маловероятные события считаются невозможными, а события, имеющие большую вероятность, считаются достоверными. Перед анализом выборки фиксируется некая малая вероятность a, называемая уровнем значимости, которая определяет размер критической области К. Эта область может быть слева, справа и с двух сторон.
Далее необходимо:
1) выбрать статистику (закон распределения)x критерия для проверки гипотезы Н0;
2) определить выборочное распределение статистики x при условии, что верна гипотеза Н0;
3)в зависимости от формулировки альтернативной истории определить критическую область К одним из неравенств: x>x1-a; x<xa или x>x1-a/2; x>xa/2;
4)получить выборку наблюдений и вычислить выборочное значение xв статистики критерия;
5)принять статистическое решение: если xв , отклонить гипотезу.
Проверка гипотез о законе распределения. Критерий согласия χ2 -Пирсона.
Разобъем всю область изменения Х на lинтервалов D1,D2,...Dlи подсчитаем число элементовmi, попавших в каждый из интервалов Di:
Предполагается известным теоретический закон распределения F(х). Например, распределение Гаусса:
F(x)=
Определяем Pi–вероятность попадания случайной величины х в интервал Di(вычисляя интеграл или по таблице):
P(a<х<b)= .
Теоретическое значение величины х в интервале Di равно nPi.
Вводим критерий
2=
c числом степеней свободы k=l- -1, где x–число параметров распределения F(x), рассчитанных по выборке; здесь x=2(среднее арифметическое и среднеквадратическое отклонение).
Выбрав a, по таблице χ2, определяют 2в. Если 2, рассчитанное по выборке, > 2в, то гипотезу Н0 отвергают. При анализе величин, используемых в теории обработки металлов давлением, уровень значимости обычно принимают равным 0,05.
χ2-распределение при уровне значимости α=0,05
k | |||||||
2в | 3,841 | 5,991 | 7,815 | 9,488 | 11,070 | 12,592 | 14,067 |
В каждом интервале должно быть минимум 5–10 наблюдений.
Интервальные оценки параметров распределения
При небольшом объеме выборки пользуются интервальными оценками. Доверительным интервалом для параметра ϴ называется интервал(ϴ1, ϴ2), содержащий истинное значение параметра с заданной вероятностью р=1-a. Значение a называется уровнем значимости.
Доверительный интервал для математического ожидания при нормальном распределениипри известием
Для этого случая
2Ф(
где Ф–функция Лапласа, d– точность оценки(2d–доверительный интервал); n– объем выборки, р=1-a. По таблице, используя Ф, находят , а затем d.
Нанесение доверительного интервала на графиках, построенных экспериментальным путем, является обязательным условием грамотной обработки результатов экспериментов.
Нахождение параметров эмпирической зависимости методом наименьших квадратов
Рассмотрим величину, которая в процессе измерений меняется вследствие непостоянства другой величины, от которой она зависит. Получаем ряд точек на поле у=у(х). Наилучшим приближением будет такая кривая, для которой сумма квадратов расстояний по вертикали от точек до кривой будет минимальной.
Предположим, что искомая зависимость выражается функцией
у=f(х, А1,А2,...Аm),
где Аi–параметры, которые подлежат определению.
Находим среднеквадратическое отклонение
σ= ,
где – экспериментальные значения; – значения, полученные по формуле.
Затем составляем систему алгебраических уравнений
=0,
решение которой дает искомые параметры фунуции.
Планирование эксперимента
Задачи планирования
1. Необходимость описания многофакторной системы; при проведении однофакторных экспериментов получают частичные зависимости, которые не всегда можно объединить в одну.
2. Для выполнения однофакторных экспериментов требуется проведение большого числа опытов и значительное время, в течение которого влияние неконтролируемых факторов может измениться, что приведет к несопоставимости результатов;
3. При решении экспериментальных задач многие опыты не нужны, так как получены они для области, далекой от экстремума.