Статистические оценки и их характеристика.
Статистической оценкой неизвестного параметра теоретического распределения называют функцию от наблюдаемых случайных величин. Статистическая оценка неизвестного параметра генеральной совокупности одним числом называется точечной. Рассмотрим следующие точечные оценки: смещенные и несмещенные, эффективные и состоятельные.
Несмещенной называют статистическую оценку , математическое ожидание которой равно оцениваемому параметру θ, то есть .Смещенной называют статистическую оценку , математическое ожидание которой не равно оцениваемому параметру.Однако ошибочно считать, что несмещенная оценка всегда дает хорошее приближение оцениваемого параметра. Действительно, возможные значения могут быть сильно рассеяны вокруг своего среднего значения, т. е. дисперсия величины может быть значительной. В этом случае найденная по данным одной выборки оценка, например , может оказаться удаленной от своего среднего значения , а значит, и от самого оцениваемого параметра . Приняв в качестве приближенного значения , мы допустили бы ошибку. Если потребовать, чтобы дисперсия величины была малой, то возможность допустить ошибку будет исключена. Поэтому к статистической оценке предъявляются требования эффективности. Эффективной называют статистическую оценку, которая (при заданном объеме выборки n) имеет наименьшую возможную дисперсию. При рассмотрении выборок большого объема к статистическим оценкам предъявляется требование состоятельности.Состоятельной называют статистическую оценку, которая при стремится по вероятности к оцениваемому параметру. Например, если дисперсия несмещенной оценки при стремится к нулю, то такая оценка оказывается также состоятельной.Рассмотрим вопрос о том, какие выборочные характеристики лучше всего в смысле несмещённости, эффективности и состоятельности оценивают генеральную среднюю и дисперсию.Пусть изучается дискретная генеральная совокупность относительно количественного признака. Генеральной средней называется среднее арифметическое значений признака генеральной совокупности. Она вычисляется по формуле или , где — значения признака генеральной совокупности объема N; — соответствующие частоты, причем
Пусть из генеральной совокупности в результате независимых наблюдений над количественным признаком извлечена выборка объема n со значениями признака . Выборочной средней называется среднее арифметическое значений признака выборочной совокупности и вычисляется по формуле или , где — значения признака генеральной совокупности объема n; — соответствующие частоты, причем Если генеральная средняя неизвестна и требуется оценить ее по данным выборки, то в качестве оценки генеральной средней принимают выборочную среднюю, которая является несмещенной и состоятельной оценкой. Отсюда следует, что если по нескольким выборкам достаточно большого объема из одной и той же генеральной совокупности будут найдены выборочные средние, то они будут приближенно равны между собой. В этом состоит свойство устойчивости выборочных средних.Если дисперсии двух совокупностей одинаковы, то близость выборочных средних к генеральным не зависит от отношения объема выборки к объему генеральной совокупности. Она зависит- от объема выборки: чем больше объем выборки, тем меньше выборочная средняя отличается от генеральной.Для того чтобы охарактеризовать рассеяние значений количественного признака X генеральной совокупности вокруг своего среднего значения, вводят сводную характеристику — генеральную дисперсию. Генеральной дисперсией называется среднее арифметическое квадратов отклонений значений признака генеральной совокупности от их среднего значения , которое вычисляется по формуле или . Для того чтобы охарактеризовать рассеяние наблюденных значений количественного признака выборки вокруг своего среднего значения , вводят сводную характеристику — выборочную дисперсию. Выборочной дисперсией называется среднее арифметическое квадратов отклонений наблюденных значений признака от их среднего значения , которое вычисляется по формуле или . Кроме дисперсии для характеристики рассеяния значений признака генеральной (выборочной) совокупности вокруг своего среднего значения используют сводную характеристику — среднее квадратическое отклонение. Генеральным средним квадратическим отклонением называют квадратный корень из генеральной дисперсии: . Выборочным средним квадратическим отклонением называют квадратный корень из выборочной дисперсии: . Пусть из генеральной совокупности в результате nнезависимых наблюдений над количественным признаком Xизвлечена выборка объема n. Требуется по данным выборки оценить неизвестную генеральную дисперсию . Если в качестве оценки генеральной дисперсии принять выборочную дисперсию, то эта оценка приведет к систематическим ошибкам, давая заниженное значение генеральной дисперсии. Объясняется это тем, что выборочная дисперсия является смещенной оценкой . Другими словами, математическое ожидание выборочной дисперсии не равно оцениваемой генеральной дисперсии, а равно . Легко исправить выборочную дисперсию так, чтобы ее математическое ожидание было равно генеральной дисперсии. Для этого нужно умножить на дробь . В результате получим исправленную дисперсию, которая будет несмещенной оценкой генеральной дисперсии: .Наряду с точечным оцениванием, статистическая теория оценивания параметров занимается вопросами интервального оценивания. Задачу интервального оценивания можно сформулировать так: по данным выборки построить числовой интервал, относительно которого с заранее выбранной вероятностью можно сказать, что внутри него находится оцениваемый параметр. Интервальное оценивание особенно необходимо при малом количестве наблюдений, когда точечная оценка малонадежна.
11. Нуль-гипотеза и принцип ее проверки.
Нулева́я гипо́теза — гипотеза, которая проверяется на согласованность с имеющимися выборочными данными. Часто в качестве нулевой гипотезы выступают гипотезы об отсутствии взаимосвязи или корреляции между исследуемыми переменными, об отсутствии различий в распределениях двух и/или более выборках. В стандартном научном подходе проверки гипотез исследователь пытается показать несостоятельность нулевой гипотезы, несогласованность её с имеющимися опытными данными, то есть отвергнуть гипотезу. При этом подразумевается, что должна быть принята другая, альтернативная, исключающая нулевую, гипотеза. Альтернативная гипотеза, утверждающая наличие различий между величинами или связи между переменными. Статистическая проверка гипотезы состоит в том, чтобы на основании некоторого численного критерия определить, следует ли принять Н.-Г. или отклонить ее, что равносильно принятию альтернативной Г. Н.-Г. при этом играет роль теоретического утверждения, которое следует отклонить, если найдется противоречащий ему пример, но нельзя считать доказанным, если такого примера нет. Таким образом, отклонение Н.-Г. "более важно", чем ее принятие. Статистическая проверка Г. является разделом математической статистики, позволяющим распространять результаты выборочного исследования на генеральную совокупность. Утверждения, сформулированные в Н.-Г. и альтернативной Г., относятся к параметрам генеральной совокупности, в то время как решение принять или отклонить Н.-Г. принимается на основе численного критерия, рассчитанного по выборке. В силу случайности выборочного метода решение может быть принято как правильно, так и ошибочно. Ошибка, состоящая в том, чтобы отклонить Н.-Г., которая на самом деле верна, называется ошибкой первого рода; ошибка, заключающаяся в том, чтобы принять Н.-Г., которая на самом деле неверна, - ошибкой второго рода. Однако как обстоят дела в генеральной совокупности, как правило, неизвестно. Поэтому любое из решений не исключает возможных ошибок, и задача состоит в том, чтобы оценить вероятность каждой из ошибок. Вероятность ошибки первого рода называется уровнем значимости, вероятность ошибки второго рода - мощностью критерия.