Несмщенная точечная оценка генеральной совокупности.
Пусть выборка объема n представлена в виде вариационного ряда. Назовем выборочной средней величину
Величина называется относительной частотой значения признака xi. Если значения признака, полученные из выборки не группировать и не представлять в виде вариационного ряда, то для вычисления выборочной средней нужно пользоваться формулой
.
Естественно считать величину выборочной оценкой параметра Mx. Выборочная оценка параметра, представляющая собой число, называетсяточечной оценкой.
Выборочную дисперсию
можно считать точечной оценкой дисперсии Dx генеральной совокупности.
Приведем еще один пример точечной оценки. Пусть каждый объект генеральной совокупности характеризуется двумя количественными признаками x и y. Например, деталь может иметь два размера – длину и ширину. Можно в различных районах измерять концентрацию вредных веществ в воздухе и фиксировать количество легочных заболеваний населения в месяц. Можно через равные промежутки времени сопоставлять доходность акций данной корпорации с каким-либо индексом, характеризующим среднюю доходность всего рынка акций. В этом случае генеральная совокупность представляет собой двумерную случайную величину x,h. Эта случайная величина принимает значения x, y на множестве объектов генеральной совокупности. Не зная закона совместного распределения случайных величин x иh, мы не можем говорить о наличии или глубине корреляционной связи между ними, однако некоторые выводы можно сделать, используя выборочный метод.
Выборку объема n в этом случае представим в виде таблицы, где
i-тый отобранный объект (i= 1,2,...n)представлен парой чисел xi, yi :
x1 | x2 | ... | xn |
y1 | y2 | ... | yn |
Выборочный коэффициент корреляции рассчитывается по формуле
Здесь
, ,
.
Выборочный коэффициент корреляции можно рассматривать как точечную оценку коэффициента корреляции rxh, характеризующего генеральную совокупность.
51. Метод максимального правдоподобия
Ме́тод максима́льного правдоподо́бия или метод наибольшего правдоподобия (ММП, ML, MLE — англ. maximum likelihood estimation) в математической статистике — это метод оценивания неизвестного параметра путём максимизации функции правдоподобия[1]. Основан на предположении о том, что вся информация остатистической выборке содержится в функции правдоподобия
Пусть есть выборка из распределения , где — неизвестные параметры. Пусть — функция правдоподобия, где .Точечная оценка
называется оце́нкой максима́льного правдоподо́бия параметра . Таким образом оценка максимального правдоподобия — это такая оценка, которая максимизирует функцию правдоподобия при фиксированной реализации выборки.
Часто вместо функции правдоподобия используют логарифмическую функцию правдоподобия . Так как функция монотонно возрастаетна всей области определения, максимум любой функции является максимумом функции , и наоборот. Таким образом,
,
Если функция правдоподобия дифференцируема, то необходимое условие экстремума — равенство нулю ее градиента:
- Оценки максимального правдоподобия, вообще говоря, могут быть смещёнными (см. примеры), но являются состоятельными, асимптотически эффективными и асимптотически нормальными оценками. Асимптотическая нормальность означает, что
где - асимптотическая информационная матрица
Асимптотическая эффективность означает, что асимптотическая ковариационная матрица является нижней границей для всех состоятельных асимптотически нормальных оценок.
- Если — оценка метода максимального правдоподобия, параметров , то является оценкой максимального правдоподобия для , где g-непрерывная функция (функциональная инвариантность). Таким образом, законы распределения данных можно параметризовать различным образом.
у́нкция правдоподо́бия в математической статистике — это совместное распределение выборки из параметрического распределения, рассматриваемое как функция параметра. При этом используется совместная функция плотности (в случае выборки из непрерывного распределения) либо совместная вероятность (в случае выборки из дискретного распределения), вычисленные для данных выборочных значений. Если распределение вероятности зависит от параметра, то с одной стороны можно рассматривать вероятность некоторых событий при заданном параметре, а с другой стороны — вероятность заданного события при различных значениях параметра. То есть в первом случае имеем функцию, зависящую от события, а во втором — от параметра при фиксированном событии. Последний вариант является функцией правдоподобия и показывает, насколько правдоподобен выбранный параметр при заданном событии. Неформально: если вероятность позволяет нам предсказывать неизвестные результаты, основанные на известных параметрах, то правдоподобие позволяет нам оценивать неизвестные параметры, основанные на известных результатах.
,
52. Интервальное оценивание. Основные понятия