Противоречия между несмещенностью и минимальной дисперсией

В данном обзоре мы уже выяснили, что для оценки желательны несмещенность и наименьшая возможная дисперсия. Эти критерии совершенно различны, и иногда они могут противоречить друг другу. Может случиться так, что имеются две оценки теоретической характеристики, одна из которых является несмещенной ( Противоречия между несмещенностью и минимальной дисперсией - student2.ru на рис. A.8), другая же смещена, но имеет меньшую дисперсию ( Противоречия между несмещенностью и минимальной дисперсией - student2.ru ).

Противоречия между несмещенностью и минимальной дисперсией - student2.ru

Рис. A.8.

Оценка Противоречия между несмещенностью и минимальной дисперсией - student2.ru хороша своей несмещенностью, но преимуществом оценки Противоречия между несмещенностью и минимальной дисперсией - student2.ru является то, что ее значения практически всегда близки к истинному значению. Какую из них вы бы выбрали?

Данный выбор зависит от обстоятельств. Если возможные ошибки вас не очень тревожат при условии, что за длительный период они «погасят» друг друга, то, по-видимому, вы выберете Противоречия между несмещенностью и минимальной дисперсией - student2.ru . С другой стороны, если для вас приемлемы малые ошибки, но неприемлемы большие, то вам следует выбрать Противоречия между несмещенностью и минимальной дисперсией - student2.ru .

Формально говоря, выбор определяется функцией потерь, стоимостью сделанной ошибки как функцией ее размера. Обычно выбирают оценку, дающую наименьшее ожидание потерь, и делается это путем взвешивания функции потерь по функции плотности вероятности. (Если вы не любите риск, то можете также пожелать учесть дисперсию потерь.)

Влияние увеличения размера выборки на точность оценок

Будем по-прежнему предполагать, что мы исследуем случайную переменную Противоречия между несмещенностью и минимальной дисперсией - student2.ru с неизвестным математическим ожиданием Противоречия между несмещенностью и минимальной дисперсией - student2.ru и теоретической дисперсией Противоречия между несмещенностью и минимальной дисперсией - student2.ru и что для оценивания Противоречия между несмещенностью и минимальной дисперсией - student2.ru используется Противоречия между несмещенностью и минимальной дисперсией - student2.ru . Каким образом точность оценки Противоречия между несмещенностью и минимальной дисперсией - student2.ru зависит от числа наблюдений Противоречия между несмещенностью и минимальной дисперсией - student2.ru ?

Ответ неудивителен: при увеличении Противоречия между несмещенностью и минимальной дисперсией - student2.ru оценка Противоречия между несмещенностью и минимальной дисперсией - student2.ru , вообще говоря, становится более точной. В единичном эксперименте большая по размеру выборка необязательно даст более точную оценку, чем меньшая выборка, – всегда может присутствовать элемент везения, – но общая тенденция должна быть именно такой. Поскольку дисперсия Противоречия между несмещенностью и минимальной дисперсией - student2.ru выражается формулой Противоречия между несмещенностью и минимальной дисперсией - student2.ru (доказательство этого факта мы опускаем), она тем меньше, чем больше размер выборки, и, значит, тем сильнее «сжата» функция плотности вероятности для Противоречия между несмещенностью и минимальной дисперсией - student2.ru .

Это показано на рис. A.9. Мы предполагаем, что Противоречия между несмещенностью и минимальной дисперсией - student2.ru нормально распределена со средним 25 и стандартным отклонением 50. Если размер выборки равен 25, то стандартное отклонение величины Противоречия между несмещенностью и минимальной дисперсией - student2.ru , равное Противоречия между несмещенностью и минимальной дисперсией - student2.ru , составит: Противоречия между несмещенностью и минимальной дисперсией - student2.ru . Если размер выборки равен 100, то это стандартное отклонение равно 5. На рис. А.9 показаны соответствующие функции плотности вероятности. Вторая ( Противоречия между несмещенностью и минимальной дисперсией - student2.ru ) выше первой в окрестности Противоречия между несмещенностью и минимальной дисперсией - student2.ru , что говорит о более высокой вероятности получения с ее помощью аккуратной оценки. За пределами этой окрестности вторая функция всюду ниже первой.

Противоречия между несмещенностью и минимальной дисперсией - student2.ru

Рис. A.9.

Чем больше размер выборки, тем уже и выше будет график функции плотности вероятности для Противоречия между несмещенностью и минимальной дисперсией - student2.ru . Если Противоречия между несмещенностью и минимальной дисперсией - student2.ru становится действительно большим, то график функции плотности вероятности будет неотличим от вертикальной прямой, соответствующей Противоречия между несмещенностью и минимальной дисперсией - student2.ru . Для такой выборки случайная составляющая Противоречия между несмещенностью и минимальной дисперсией - student2.ru становится действительно очень малой, и поэтому Противоречия между несмещенностью и минимальной дисперсией - student2.ru обязательно будет очень близкой к Противоречия между несмещенностью и минимальной дисперсией - student2.ru . Это вытекает из того факта, что стандартное отклонение Противоречия между несмещенностью и минимальной дисперсией - student2.ru , равное Противоречия между несмещенностью и минимальной дисперсией - student2.ru , становится очень малым при больших Противоречия между несмещенностью и минимальной дисперсией - student2.ru .

В пределе, при стремлении Противоречия между несмещенностью и минимальной дисперсией - student2.ru к бесконечности, Противоречия между несмещенностью и минимальной дисперсией - student2.ru стремится к нулю и Противоречия между несмещенностью и минимальной дисперсией - student2.ru стремится в точности к Противоречия между несмещенностью и минимальной дисперсией - student2.ru .

Состоятельность

Вообще говоря, если предел оценки по вероятности равен истинному значению характеристики генеральной совокупности, то эта оценка называется состоятельной. Иначе говоря, состоятельной называется такая оценка, которая дает точное значение для большой выборки независимо от входящих в нее конкретных наблюдений.

В большинстве конкретных случаев несмещенная оценка является и состоятельной. Для этого можно построить контрпримеры, но они, как правило, будут носить искусственный характер.

Иногда бывает, что оценка, смещенная на малых выборках, является состоятельной (иногда состоятельной может быть даже оценка, не имеющая на малых выборках конечного математического ожидания). На рис. A.10 показано, как при различных размерах выборки может выглядеть распределение вероятностей. Тот факт, что при увеличении размера выборки распределение становится симметричным вокруг истинного значения, указывает на асимптотическую несмещенность. То, что в конечном счете оно превращается в единственную точку истинного значения, говорит о состоятельности оценки.

Противоречия между несмещенностью и минимальной дисперсией - student2.ru

Рис. A.10.

Оценки, типа показанных на рис. A.10, весьма важны в регрессионном анализе. Иногда невозможно найти оценку, несмещенную на малых выборках. Если при этом вы можете найти хотя бы состоятельную оценку, это может быть лучше, чем не иметь никакой оценки, особенно если вы можете предположить направление смещения на малых выборках.

Нужно, однако, иметь в виду, что состоятельная оценка в принципе может на малых выборках работать хуже, чем несостоятельная (например, иметь большую среднеквадратичную ошибку), и поэтому требуется осторожность. Подобно тому, как вы можете предпочесть смещенную оценку несмещенной, если ее дисперсия меньше, вы можете предпочесть состоятельную, но смещенную оценку несмещенной или несостоятельную оценку им обеим (также в случае меньшей дисперсии).

Приложение B

Тестовые задания

Наши рекомендации