Статистический анализ экспериментальных данных

Статистический анализ используется для оценки параметров (статистик) распределений опытных данных, подбора закона их распределения, проверки статистических гипотез.

Метод достаточно подробно разработан в математической статистике [3, 8, 9]. Для определения параметров распределения используются:

1. Метод моментов.

2. Метод максимального правдоподобия.

Рассмотрим метод максимального правдоподобия, который может применяться только при известном законе распределения случайной величины. Метод максимального правдоподобия был предложен Гауссом и обобщен Р. Фишером.

В основе метода лежит функция правдоподобия. Метод даёт наиболее точные оценки, но они могут быть смещёнными. Смещение, однако, может быть устранено введением поправок или увеличением объёма эксперимента (объема выборки).

Правдоподобие определённой системы наблюдаемых величин есть вероятность получения таких величин, основанная на заданной теоретической модели с определёнными параметрами q₁, q₂, …, q_k. Тогда оценки максимума правдоподобия Статистический анализ экспериментальных данных - student2.ru есть те величины определённых параметров q₁, q₂, …, q_k, которые максимизируют правдоподобие, т.е. те величины параметров q_j, которые представляются наиболее вероятными на основе представленных данных. Суть метода заключается в составлении функции правдоподобия, которая представляет собой произведение вероятностей. Она составляется для дискретных и непрерывных случайных величин.

При составлении функции правдоподобия для дискретных случайных величин в качестве закона распределения используется зависимость вероятности наступления события р(x_i,q):

Статистический анализ экспериментальных данных - student2.ru ,

где x_i — значения дискретной случайной величины X, которая в результате проведения опытов приняла значения x₁, x₂, …, x_n;

q — неизвестный параметр теоретического закона распределения, который необходимо оценить.

При составлении функции правдоподобия для непрерывной случайной величины в качестве закона распределения используется плотность распределения случайной величины f(x_i, q₁, q₂, …, q_k):

Статистический анализ экспериментальных данных - student2.ru

где n — количество измеренных значений случайной величины x_i(объём выборки);

Статистический анализ экспериментальных данных - student2.ru — неизвестный параметр теоретического распределения, который следует оценить;

k — количество неизвестных параметров распределения.

В обоих случаях за оценку q принимается такое точечное значение Статистический анализ экспериментальных данных - student2.ru , которое обеспечивает максимум функции правдоподобия. Это имеет место в том случае, когда частная производная от функции правдоподобия будет равна нулю, т.е.

Статистический анализ экспериментальных данных - student2.ru .

Таким образом, неизвестные параметры q_j функции распределения, которые необходимо оценить, определяются там, где L — функция достигает максимума. Это положение необходимо проверить путём взятия частной производной второго порядка Статистический анализ экспериментальных данных - student2.ru , которая в случае точки максимума должна быть отрицательной.

Однако дифференцирование произведения, имеющего большое число сомножителей, крайне затруднительно. Поэтому находят не максимум функции L, а максимум функции lnL, т.е. берут производную от логарифма функции правдоподобия

Статистический анализ экспериментальных данных - student2.ru .

Количество уравнений равно k, что позволяет определить k неизвестных параметров q. Для проверки принадлежности найденной оценки максимуму функции lnL необходимо взять вторую производную Статистический анализ экспериментальных данных - student2.ru , которая должна быть отрицательной.