Вопрос 29. Робастное статистическое оценивание

При статистическом исследовании часто встречаются данные, которые по своим значениям сильно отклоняются от основного массива. Они, как правило, называются выбросами, засорением или грубыми ошибками.

Подобные выбросы искажают структуру статистической совокупности и вносят смещения в интегральные параметра (среднее, дисперсия).

Причины выбросов:

1. Статистическая особенность распределения, например нормальное распределение с минимальное вероятностью допускает сколь угодно больших значений (т.е. величина на самом деле не является ошибкой).

2. Неправильное причисление данных к исследуемой совокупности (ошибки группировки, типологической классификации).

3. Ошибка при регистрации и обработке исходной информации (ошибка оператора). Является одной из самых распространенных причин появления выбросов.

Решением проблем нахождения, устранения выбросов и получения адекватных оценок статистических показателей занимается робастное (устойчивое) оценивание.

1. Выявление грубых ошибок.

Методы:

1. Т-критерий Смирнова-Граббса).

Для нетипичного значения рассчитывают:

Вопрос 29. Робастное статистическое оценивание - student2.ru

Вопрос 29. Робастное статистическое оценивание - student2.ru – выборочное среднее

Вопрос 29. Робастное статистическое оценивание - student2.ru – выборочное среднеквадратичное отклонение

Вопрос 29. Робастное статистическое оценивание - student2.ru – нетипичное значение

Tсравнивается с критическим значением Вопрос 29. Робастное статистическое оценивание - student2.ru метода Смирнова-Граббса на уровне значимости Вопрос 29. Робастное статистическое оценивание - student2.ru . В исходах сравнения выделяют следующие случаи:

Вопрос 29. Робастное статистическое оценивание - student2.ru - наблюдение не нарушает однородности выборки;

Вопрос 29. Робастное статистическое оценивание - student2.ru - наблюдение грубо нарушает однородность выборки и является нетипичным;

Вопрос 29. Робастное статистическое оценивание - student2.ru - требуются дополнительные аргументы для классификации наблюдения.

Дисперсионный критерий Граббса

проверяет на аномомальность отдельное значение.

Совокупность Вопрос 29. Робастное статистическое оценивание - student2.ru выстраивается в ряд Вопрос 29. Робастное статистическое оценивание - student2.ru .

возможные грубые ошибки концентрируются на хвостах ряда.

Для проверки аномальности минимального значения по ряду X вычисляются следующие показатели:

· выборочное среднее Вопрос 29. Робастное статистическое оценивание - student2.ru

· усеченное выборочное среднее Вопрос 29. Робастное статистическое оценивание - student2.ru

· статистика критерия Граббса Вопрос 29. Робастное статистическое оценивание - student2.ru

Для проверки аномальностимаксимального значения по ряду X вычисляются следующие показатели:

· выборочное среднее Вопрос 29. Робастное статистическое оценивание - student2.ru

· усеченное выборочное среднее Вопрос 29. Робастное статистическое оценивание - student2.ru

· статистика критерия Граббса Вопрос 29. Робастное статистическое оценивание - student2.ru

Значение статистик Вопрос 29. Робастное статистическое оценивание - student2.ru и Вопрос 29. Робастное статистическое оценивание - student2.ru варьируются в интервале от 0 до 1. Чем ближе значение к 1, тем меньше отличие между усеченной и исходной выборками.

сравнивается с критическим значением Вопрос 29. Робастное статистическое оценивание - student2.ru на уровне Вопрос 29. Робастное статистическое оценивание - student2.ru .

Вопрос 29. Робастное статистическое оценивание - student2.ru - наблюдение не нарушает однородности выборки;

Вопрос 29. Робастное статистическое оценивание - student2.ru - наблюдение грубо нарушает однородность выборки и является нетипичным;

Вопрос 29. Робастное статистическое оценивание - student2.ru - требуются дополнительные аргументы для классификации наблюдения.

L-критерий Титьена-Мура.

Предназначен для выявления групп из k>1 выбросов.

Для проверки аномальности нескольких минимальных значений по ряду X вычисляются следующие показатели:

· выборочное среднее Вопрос 29. Робастное статистическое оценивание - student2.ru

· усеченное выборочное среднее Вопрос 29. Робастное статистическое оценивание - student2.ru

· статистика критерия Вопрос 29. Робастное статистическое оценивание - student2.ru

Для проверки аномальности нескольких максимальных значений по ряду X вычисляются следующие показатели:

· выборочное среднее Вопрос 29. Робастное статистическое оценивание - student2.ru

· усеченное выборочное среднее Вопрос 29. Робастное статистическое оценивание - student2.ru

· статистика критерия Граббса Вопрос 29. Робастное статистическое оценивание - student2.ru

Полученные значения сравниваются с критическими значениями Вопрос 29. Робастное статистическое оценивание - student2.ru аналогично критерию Граббса.

Наши рекомендации