Распределение стьюдента

ОШИБКА РЕПРЕЗЕНТАТИВНОСТИ

Выборочные характеристики – средняя арифметическая (хn сред), среднее квадратическое отклонение (s n ) и другие величины случайные, варьирующие вокруг своих генеральных параметров (параметров генеральной совокупности) – генеральной средней (х N сред), дисперсии ( sN2) или стандартного отклонения (sN).

Выборочные характеристики рассматриваются как приближённые значения соответствующих генеральных параметров, которые, как правило, остаются неизвестными. Так выборочная средняя (хn сред) служит оценкой генеральной средней (хN сред),выборочная дисперсия (sn2) является оценкой дисперсии генеральной (sN2), а среднее квадратическое отклонение (sn) рассматривается в качестве оценки стандартного отклонения (sN) – генеральной совокупности, которая мыслится как совокупность неограниченно большого объёма.

Как правило, выборочные характеристики не совпадают по абсолютной величине с соответствующими генеральными параметрами, это связанно с применением выборочного метода исследования, когда по выборке судят о всей генеральной совокупности.

Представления о расхождении между выборочными и генеральными параметрами можно получить непосредственно из данных выборки, для этого существует стандартная мера.

Ошибка репрезентативности – это стандартная мера возможного отклонения выборочного параметра от параметра генеральной совокупности.

Ошибка репрезентативности (представительности), или статистическая ошибка (+ - m или s) – своей величиной показывает, насколько выборочные данные измерений ошибочно представляют, в среднем, отклонение рассчитанное по ним параметра (показателя) от истинного значения на генеральной совокупности данных.

Статистические ошибки – это не ошибки, допущенные при измерении. Они возникают исключительно во время отбора вариант из генеральной совокупности и к ошибкам измерений отношения не имеют. Единственная причина возникновения ошибки репрезентативности – не сплошной, а выборочный характер исследования (n # N), и единственный способ уменьшения ошибки – увеличение объёма выборки.

Величина ошибки репрезентативности измеряется средним квадратическим отклонением, которая является не только характеристикой варьирования того или иного признака, но и служит мерой «ошибки» отдельных вариант, если они используются в качестве оценки генеральных параметров.

Ошибка репрезентативности может быть рассчитана для каждого статистического параметра:

1. Ошибка репрезентативности для средней арифметической величины + - mx сред = s / Ö n , где s - истинное стандартное отклонение, n - объём выборки, или число измерений;

2. Ошибка репрезентативности для среднего квадратического отклонения + - ms = s / Ö 2n.

Если по величине среднего квадратического отклонения можно судить о величине отдельных показателей (вариант) от выборки хn сред + - sn , то по величине ошибки репрезентативности возможно оценить отклонение показателей выборки от генеральной совокупности: хn сред + - mx сред.

Таким образом, ошибка репрезентативности не есть разность хN сред – хn сред , это стандартный промежуток , позволяющий оценить интервал, в котором находится истинный параметр генеральной совокупности (хN сред).

Статистические ошибки характеризуют варьирование выборочных показателей вокруг их генеральных параметров. Они обладают теми же свойствами, что и среднее квадратическое отклонение. Лишь одно свойство специфично для ошибок репрезентативности: они уменьшаются при увеличении объёма выборки, т.е. при n стремящемся к бесконечности, mх сред – стремится к нулю. Это свойство статистических ошибок обусловлено действием закона больших чисел, по которому наиболее вероятный результат получается при наибольшем числе испытаний. Отсюда понятно значение ошибки: она указывает на точность, с какой выборочные показатели репрезентируют генеральные параметры. Чем меньше ошибка, тем ближе выборочная характеристика к величине генерального параметра, и, наоборот, чем больше ошибка, тем менее точно репрезентирует выборочная характеристика её генеральный параметр. Следовательно, по свойству статистической ошибки, которая при n стремящемся к бесконечности стремится к нулю, можно судить о состоятельности оценок.

РАСПРЕДЕЛЕНИЕ СТЬЮДЕНТА

Практическое применение формулы Гаусса-Лапласа, описывающей закон нормального распределения, затрудняется тем, что в неё в качестве аргументов входят генеральные параметры хN сред и sN, которые обычно остаются неизвестными.

Английский учёный Вильям Госсет (1908), печатавшийся под псевдонимом Стьюдент, нашёл закон распределения величин t = (хn сред – хN сред) / sN / Ö n, в которых генеральный параметр sN заменён на его выборочную оценку sn , т.е. tst = (xn сред – xN сред ) / sn / Ö n Þ tst = (xn сред – xN сред) / mx сред , где xn сред – выборочная средняя, xNсред – истинная (генеральная средняя), mx сред – ошибка репрезентативности. Для конструкции tst Стьюдент установил формулу теоретического распределения, предполагая, что сами выборочные параметры распределяются по закону Стьюдента: W( t ) = C (1 + t2 / n-1) – (n-1 / 2)где С – константа, зависящие только от числа степеней свободы (n-1).

Закон Стьюдента, в дальнейшем уточнённый Фимером (закон Стьюдента – Фимера) – основа «теории малой выборки», он характеризует распределение выборочных средних в нормальной генеральной совокупности в зависимости от объёма выборки, а t – распределение зависит только от двух величин: нормированного отклонения t и числа степеней свободы (n-1). С увеличением числа наблюдений, t – распределение приближается к нормальному с параметрами sN = 0 и sN = 1, и уже при n >= 30 не отличается от него. Это наглядно может быть представлено на рисунке, где на фоне нормальной кривой (сплошная линия) нанесены кривые t – распределения при n = 30 (пунктирная линия) и при n = 3 (штриховая линия).

 
  распределение стьюдента - student2.ru

W (t)

 
  распределение стьюдента - student2.ru

-3t –2t -t X=0 t 2t 3t

tst – График распределения Стьюдента.

W ( t ) – плотность вероятности появления t в конкретной выборке;

T – распределение Стьюдента представляет частный случай нормального распределения, оно симметрично и отражает специфику распределения малой выборки по нормальному закону в зависимости от её объёма n. Для выборок n >=30 величина t распределяется нормально, тогда как при n < 30 распределение t зависит от числа наблюдений n, т.е. следует закону Стьюдента. Для практического использования t – распределения составлена специальная таблица: «Критические значения t – критерия Стьюдента для трёх уровней значимости (0,05; 0,01; 0,001) и чисел степеней свободы». В данной таблице содержатся критические значения t для разных уровней значимости (Р0) и чисел степеней свободы (n-1). Как пользоваться этой таблицей при использования t- критерия при проверке статистических гипотез, будет показано при рассматривании приведённых ниже примеров.

Наши рекомендации