Показатели формы распределения (центральные моменты, показатели асимметрии, показатель эксцесса)
Асимметрия.
Эксцесс.
Асимметрия НР=0 и Эксцесс=0
Более вытянутая вершина графика эксцесс >0, более пологий график эксцесс<0
6.4. Z-распределение
Стандартизованные значения (Z-значения)
Стандартизованная (Стандартная) теоретическая кривая НР:
Кривая НР симметрична относительно вертикальной оси.
Таблица нормального распределения = таблица Z-значений
6.5. Стандартная ошибка среднего (простая, для малой ГС, для стратифицированной выборки)
При использовании больших выборок, сформированных из больших генеральных совокупностей, величина ошибки выборки подчиняется нормальному закону, который устанавливает связь между величиной вероятности и значением t.
Если анализируемая выборка малого объема, то распределение ошибок выборки не подчиняется нормальному закону распределения. Поэтому проблема малой выборки длительное время оставалась нерешенной.
Проблема малой выборки была решена английским математиком и статистиком по фамилии Госсет, который вошел в историю под псевдонимом Стьюдент.
1908 г – доказал, что распределение ошибок в условиях малой выборки подчиняется особому закону распределения, который и получил его имя – t-распределение Стьюдента.
Распределение Стьюдента, как и нормальное распределение, симметрично, однако ветви кривой распределения Стьюдента медленнее приближаются к оси абсцисс. То есть вероятность появления больших отклонений от средней величины в распределении Стьюдента выше, чем в нормальном распределении.
По t-распределению Стьюдента составлены таблицы, в которых (в отличии от нормального распределения) вероятность связана не только с величиной t, но и с числом степеней свободы, которое определяется
d.f. = n – 1 (n – объем совокупности)
При объеме выборки n ≥ 100 значения в таблицах нормального распределения и распределения Стьюдента полностью совпадают, при 30 ≤ n ≤ 100 - расхождения незначительные, при n < 30 - существенные расхождения.
Безусловно малой выборкой считается выборка объемом меньше 30 единиц. Поэтому при работе с выборками таких объемов в формуле предельной ошибки выборки используется величина t из таблицы t-распределения Стьюдента.
В формуле расчета средней ошибки выборки мы не можем игнорировать сомножитель, корректирующий величину выборочной дисперсии.
- в условиях малой выборки
, где
S - выборочная дисперсия.
То есть дисперсия делится не на объем выборки, а на число степеней свободы.
Ошибка выборки – разность между выборочной и генеральной статистиками.
Следует отметить, что при использовании выборочного метода
генеральные статистики частично или полностью неизвестны.
Для оценки результатов выборочного наблюдения используется особый показатель, который называется средней ошибкой выборки(т.е. дисперсия).
Mx” = σ0/√n => M2x = σ02/n
σ02 – среднее квадратическое отклонение
σ02 = ∑(x – x’)2/n
а практике для определения средней ошибки выборки генеральную дисперсию заменяют на выборочную. Следует отметить, что непосредственная замена возможна лишь для выборок достаточно большого объема, тогда M = σв / σn
В основу обработки результатов выборочного наблюдения положен принцип о том, что выборочные средние, вычисленные по выборкам нормального объема, распределены по нормальному закону. Если выборки большие, то они ведут себя по нормальному закону
(вероятность того, что средняя не отклонится от нормальной).
Для бесповторная отбора: M = √σ2/n, n→N
При увеличении объема выборки получаем 0.
Из этой формулы: n = t2σ2N/∆2N + t2σ2
На основе понятия средней ошибки выборки и нормальности распределения выборочных средних строится понятие предельной ошибки выборки. Δ = tμ
Предельная ошибка выборки определяется пределом возможных отклонений выборочной средней от генеральной, который не будет превзойден с заданной доверительной вероятностью.
t – кратная средняя ошибка выборки, параметр нормального распределения, связывает значение предельной ошибки выборки с доверительной вероятность.
t = 1 p [|x” – x’| ≤ tμ] = 0.683
t = 2 p [|x” – x’| ≤ 2μ] = 0.954
t = 3 p [|x” – x’| ≤ 3μ] = 0.9973
t = 4 p [|x” – x’| ≤ 4μ] = 0.99993
Это получается из того, что выборочные средние распределены по
нормальному закону распределения.