Понятие статистической гипотезы
Нормальное распределение и его параметры.
Нормальное распределение, также называемое распределением Гаусса, — распределение вероятностей, которое играет важнейшую роль во многих областях знаний, особенно в физике. Физическая величина подчиняется нормальному распределению, когда она подвержена влиянию огромного числа случайных помех. Ясно, что такая ситуация крайне распространена, поэтому можно сказать, что из всех распределений, в природе чаще всего встречается именно нормальное распределение — отсюда и произошло одно из его названий.
Нормальное распределение зависит от двух параметров — смещения и масштаба, то есть, является, с математической точки зрения, не одним распределением, а целым их семейством. Значения параметров соответствуют значениям среднего (математического ожидания) и разброса (стандартного отклонения).
Дискретный статистический ряд распределения.
Дискретные ряды распределения основаны на дискретных (прерывных) признаках, имеющих только целые значения (например, тарифный разряд рабочих, число детей в семье).
Для построения дискретного ряда с небольшим числом вариантов выписываются все встречающиеся варианты значений признака , а затем подсчитывается частота повторения варианта. Ряд распределения принято оформлять в виде таблицы, состоящей из двух колонок (или строк), в одной из которых представлены варианты, а в другой - частоты. Для построения ряда распределения непрерывно изменяющихся признаков, либо дискретных, представленных в виде интервалов, необходимо установить оптимальное число групп (интервалов), на которые следует разбить все единицы изучаемой совокупности.
Интервальный статистический ряд распределения.
Интервальный статистический ряд содержит в качестве значений интервалы (могут быть равными или неравными) и частоты значений, попадающих в этот интервал.
Интервальные ряды распределения базируются на непрерывно изменяющемся значении признака, принимающем любые (в том числе и дробные) количественные выражения, т.е. значение признаков таких рядах задается в виде интервала. При наличии достаточно большого количества вариантов значений признака первичный ряд является труднообозримым, и непосредственное рассмотрение его не дает представления о распределении единиц по значению признака в совокупности. Поэтому первым шагом в упорядочении первичного ряда является его ранжирование – расположение всех вариантов в возрастающем (убывающем) порядке.
Графический метод представления статистических данных.
Графический метод — это метод условных изображений при помощи линий, точек, геометрических фигур и других символов.
Основными элементами графика являются поле графика, графический образ, масштаб, масштабная шкала, экспликация графика:
• Поле графика — пространство, на котором размещаются графические символы.
• Графические образы — составляют основу графика. В качестве графических символов используются геометрические знаки.
• Масштаб — это мера перевода числовой величины в графическую.
• Масштабная шкала — линия с нанесенными на нее масштабными отметками и их числовыми значениями. Шкалы могут быть равномерными и неравномерными (логарифмические шкалы), прямолинейными и криволинейными (круговые).
• Экспликация графика — пояснения содержания графика, относящиеся к его заголовку, единицам измерения.
Понятие статистической гипотезы
Проверка статистических гипотез является содержанием одного из обширных классов задач математической статистики. Статистическая гипотеза — предположение о виде распределения и свойствах случайной величины, которое можно подтвердить или опровергнуть применением статистических методов к данным выборки.
• Формулировка основной гипотезы и конкурирующей гипотезы.
• Задание уровня значимости, на котором в дальнейшем и будет сделан вывод о справедливости гипотезы. Он равен вероятности допустить ошибку первого рода.
• Расчёт статистики критерия такой, что:
• её величина зависит от исходной выборки;
• по её значению можно делать выводы об истинности гипотезы;
• статистика, как функция случайной величины, также является случайной величиной и подчиняется какому-то закону распределения.
• Построение критической области. Из области значений выделяется подмножество таких значений, по которым можно судить о существенных расхождениях с предположением. Его размер выбирается таким образом, чтобы выполнялось равенство. Это множество и называется критической областью.
• Вывод об истинности гипотезы. Наблюдаемые значения выборки подставляются в статистику и по попаданию (или непопаданию) в критическую область выносится решение об отвержении (или принятии) выдвинутой гипотезы.