Точность и надежность статистических оценок

Наблюдаемые численности исходов при общепопуляционном формировании выборки

Проверяемый диагностический тест (ПДТ) Эталон сравнения Всего
Результат:
[+] [-]
Результат: [+] Точность и надежность статистических оценок - student2.ru Точность и надежность статистических оценок - student2.ru Точность и надежность статистических оценок - student2.ru
[-] Точность и надежность статистических оценок - student2.ru Точность и надежность статистических оценок - student2.ru Точность и надежность статистических оценок - student2.ru
Всего Точность и надежность статистических оценок - student2.ru Точность и надежность статистических оценок - student2.ru Точность и надежность статистических оценок - student2.ru

Статистическими оценками разрешающей и предсказательной способностей ПКЛДТ являются соответствующие наблюдаемые частоты.

Статистическое оценивание

Одной из основных задач статистики является статистическое оценивание числовых характеристик (параметров) обследуемой популяции. Цель – по возможности точно и надежно определить (вычислить) значение той или иной числовой характеристики (параметра). Материалом для этого служат имеющиеся статистические данные.

При оценивании параметров на основе варьирующих данных нельзя ограничиваться одним числом. Обязательно нужны еще оценки их варьирования.

Два основных типа статистических оценок

Точечное оценивание – оценка одним числом.

Интервальное оценивание – оценка интервалом.

Для интервального оценивания в статистике используются Доверительные Интервалы. Доверительный интервал — это такой интервал, который содержит (накрывает) оцениваемый параметр с заданной вероятностью. Такая вероятность называется Доверительной Вероятностью или Уровнем Доверия. Уровень Доверия выбирается исследователем.

Основная логика статистического оценивания: точечные оценки

В биомедицинских исследованиях обычно вероятности P (или иные параметры) нам неизвестны. Мы их оцениваем по наблюдаемым численностям.

Например, разумной и интуитивно понятной точечной оценкой для распространенности болезни Точность и надежность статистических оценок - student2.ru по данным общепопуляционного (одномоментного поперечно-срезового) исследования может служить наблюдаемая частота

Точность и надежность статистических оценок - student2.ru

т.е. доля числа больных Точность и надежность статистических оценок - student2.ru , выявленных золотым стандартом, от общего числа n обследованных.

Основная логика статистического оценивания: интервальные оценки

Легко представить, что если мы многократно повторим извлечение выборок из данной популяции, то наблюдаемые частоты Точность и надежность статистических оценок - student2.ru неизбежно будут варьировать. Поэтому задача математиков – вывести математический закон (вероятностное распределение), которому подчиняется варьирование этой частоты. Если такой закон найден, то тогда можно получить доверительные интервалы (ДИ) для оценки распространенности болезни Точность и надежность статистических оценок - student2.ru с заданной доверительной вероятностью Точность и надежность статистических оценок - student2.ru .

Доверительные интервалы

Доверительный Интервал (ДИ) есть такой интервал, который с заданной (доверительной) вероятностью Точность и надежность статистических оценок - student2.ru накрывает искомое оцениваемое значение параметра. Синонимы: Интервал Доверия или Интервал Накрытия.

Принципиально важно понимать, что ДИ является случайным. Это означает, что от опыта к опыту его границы будут колебаться, варьировать.

Точность и надежность статистических оценок

Чем ýже ДИ, тем оценка точнее. Чем больше доверительная вероятность Точность и надежность статистических оценок - student2.ru , тем оценка надежнее. Однако ДИ с доверительной вероятностью 100% - бессмыслен. Например, 100%-й ДИ для доли будет содержать все значения в границах от 0 до 1: [0, 1].

Надежность доверительных интервалов (ДИ)

Уровень доверия Точность и надежность статистических оценок - student2.ru Степень надёжности ДИ
<95% Практически неприемлемая
95% Приемлемая
99% Удовлетворительная
99,9% Высокая

Например, 99%-й ДИ означает, что если мы многократно (бесконечное число раз) повторим наши наблюдения, то в 99% случаев получаемые интервалы накроют (неизвестное) значение оцениваемой вероятности P (или иного параметра θ). Но в 1% случаев мы можем «промахнуться»: вычисленный интервал не накроет искомое значение. И промах этот может случиться как раз с данной конкретной выборкой.

Отсюда мы приходим к выводу о неизбежной необходимости многократно повторять опыты (или наблюдения).

Наши рекомендации