Откорректированная на отношение
n
n −
, то есть 2 2
S n
n
σ = ×
−
; при
Увеличении n 1
n
n
→
−
, поэтому в выборках, объемом больше 30 единиц
Наблюдения, указанным отношением можно пренебречь.
Аналогично, точечной оценкой генерального среднеквадратического
Отклонения является выборочное среднеквадратическое отклонение,
Откорректированное на
n
n −
, то есть
S n
n
σ = ×
−
.
В этом случае точечные оценки генеральной дисперсии и
Генерального среднеквадратического отклонения являются
Состоятельными и несмещенными.
Основным недостатком точечных оценок является то, что они не
Учитывают ошибки выборки, то есть не являются эффективными. Поэтому
Более предпочтительными являются интервальные оценки параметров
Генеральной совокупности, в которых эти ошибки учитываются.
Интервальные оценки соответствуют всем трем требованиям качества
Статистической оценки.
В математической статистике доказывается, что:
• Интервальной оценкой генеральной доли является ее
выборочная доля с учетом ошибки выборочной доли, то есть d ω ≈ω ±μ ,
где ω μ - ошибка выборочной доли.
• Интервальной оценкой генеральной средней является
Выборочная средняя с учетом ошибки выборочной средней, то есть
%
%x x ≈ x ± μ , где x% μ - ошибка выборочной средней.
Применение интервальных оценок означает, что характеристики
Генеральной совокупности укладываются в определенный диапазон
Значений. Чтобы их получить, необходимо рассчитать соответствующие
Ошибки выборки.
Ошибки выборки
При правильном формировании выборки величину ее ошибки можно
Рассчитать заранее. В общем случае под ошибкой выборки понимают
Объективно возникающее расхождение между характеристиками выборки
И генеральной совокупности.
Ошибки выборки подразделяются на ошибки регистрации и
Ошибки репрезентативности.
Ошибки регистрации возникают из-за неправильных или неточных
Сведений. Их источником является невнимательность регистратора,
Неправильное заполнение формуляров, описки или же непонимание
Существа исследуемого вопроса.
Ошибки репрезентативности возникают вследствие несоответствия
Структуры выборки структуре генеральной совокупности. Источником их
Существования является разная вариация признака у статистических
Единиц, в результате которой распределение единиц в выборочной
Совокупности отличается от распределения единиц в генеральной
Совокупности.
Ошибки репрезентативности делятся на систематические и
Случайные.
Систематические ошибки репрезентативности возникают из-за
Неправильного формирования выборки, при котором нарушается основной
принцип научно организационной выборки – принцип случайности.
Случайные ошибки репрезентативности означают, что даже при
Соблюдении принципа случайности отбора единиц, расхождения между
Характеристиками выборки и генеральной совокупности все же имеют
Место.
Сущность случайной ошибки репрезентативности рассмотрим на
следующем примере: сравниваются данные об успеваемости студентов по
факультету в целом (генеральная совокупность) и по двум 10%-ным
Случайным выборкам. Данные приведены в таблице 8.1.
Таблица 8.1.
Данные об успеваемости студентов
Объем генеральной совокупности N составил1000 студентов, объем
каждой выборки составляет 10% от N, то есть n=0,1·1000=100 человек.
Так как исходные данные представлены дискретными рядами
Распределения студентов по уровню успеваемости, то средний балл
Рассчитаем по формуле средней арифметической взвешенной. Он
составляет:
По генеральной совокупности 100 2 3 500 4 380 5 10 3,82
x × + × + × + ×
= = ;
По первой выборке 3,93
~ 2 9 3 50 4 30 5 21
1 =
× + × + × + ×
x = ;
По второй выборке 3,76
~ 2 13 3 49 4 32 5 15
2 =
× + × + × + ×
x = .
Доля студентов, получивших оценки «хорошо» и «отлично», равна:
Оценка Количество студентов, чел.
Генеральная
Совокупность
Первая
Выборка
Вторая
Выборка
(неудовлетворитель
Но)
100 9 13
(удовлетворительно
)
500 50 49
Хорошо) 380 30 32
Отлично) 120 21 15
Всего 1000 100 100