Перечень примерных вопросов к экзамену (зачету) по математической статистике
1.Измерение социальных явлений и процессов. Измерительные шкалы: номинальные, ранговые (порядковые) и интервальные.
2.Выборочный метод статистического исследования. Генеральная и выборочная совокупности. Репрезентативность выборочной совокупности.
3.Случайный отбор и его виды. Простой случайный бесповторный отбор и простой случайный повторный отбор. Типический, механический и серийный отбор
4.Вариационный ряд. Эмпирическая функция распределения. Гистограмма и полигон.
5.Выборочные характеристики. Среднее значение выборочной случайной величины. Выборочная дисперсия и среднеквадратическое отклонение.
6.Интервальные оценки неизвестных параметров распределения по выборке. Доверительная вероятность. Доверительные интервалы.
7.Задачи интервального оценивания параметров нормального закона распределения.
8.Расчет объема выборочной совокупности.
9.Проверка статистических гипотез. Понятие статистической гипотезы. Уровень значимости. Нулевая гипотеза.
Статистическая гипотеза — это определённое предположение о распределении вероятностей, лежащем в основе наблюдаемой выборки данных.
Проверка статистической гипотезы — это процесс принятия решения о том, противоречит ли рассматриваемая статистическая гипотеза наблюдаемой выборке данных.
Рассмотрим этапы проверки гипотезы и используемые при этом понятия.
Этап 1. Располагая выборочными данными и руководствуясь конкретными условиями рассматриваемой задачи, формулируют гипотезу Но, которую называют основной или нулевой, и гипотезу Н1конкурирующую с гипотезой Н0. Термин «конкурирующая» означает, что являются противоположными следующие два события:
по выборке будет принято решение о справедливости для генеральной совокупности гипотезы Н0;
по выборке будет принято решение о справедливости для генеральной совокупности гипотезы Н1.
Этап 2. Задаются вероятностью a , которую называют уровнем значимости. Поясним ее смысл.Решение о том, можно ли считать высказывание Н0 справедливым для генеральной совокупности, принимается по выборочным данным, т. е. по ограниченному ряду наблюдений, следовательно, это решение может быть ошибочным. При этом может иметь место ошибка двух родов:
отвергают гипотезу Но, или, иначе, принимают альтернативную гипотезу H1, тогда как на самом деле гипотеза Н0 верна; это ошибка первого рода;
принимают гипотезу Н0 , тогда как на самом деле высказывание Но неверно, т. е. верной является гипотеза Н1 это ошибка второго рода.
Так вот уровень значимости a—это вероятность ошибки первого рода, т. е. вероятность того, что будет принята гипотеза Н1 , если на самом деле в генеральной совокупности верна гипотеза Но. Вероятность a задается заранее малым числом, используют некоторые стандартные значения: 0,05; 0,01; 0,005; 0,001.
Этап 3. Находят величину j такую, что:ее значения зависят от выборочных данных, т. е. для которой справедливо равенство
- ее значения позволяют судить о «расхождении выборки с гипотезой Н0»;
- и которая, будучи величиной случайной в силу случайности выборки, подчиняется при выполнении гипотезы Но некоторому известному закону распределения.Величину j называют критерием.
Этап 4. Далее рассуждают так. Так как значения критерия позволяют судить о «расхождении выборки с гипотезой Но», то из области допустимых значений критерия j следует выделить подобласть wтаких значений, которые свидетельствовали бы о существенном расхождении выборки с гипотезой Но и, следовательно, о невозможности принять гипотезу Но.
Подобласть w называют критической областью.
Допустим, что критическая область выделена. Тогда руководствуются следующим правилом: если вычисленное по выборке значение критерия j попадает в критическую область, то гипотеза Но отвергается и принимается гипотеза Н1. При этом следует понимать, что такое решение может оказаться ошибочным:на самом деле гипотеза Но может быть справедливой. Таким образом, ориентируясь на критическую область, можно совершить ошибку первого рода, вероятность которой задана заранее и равна a. Отсюда вытекает следующее требование к критической области w:вероятность того, что критерий j примет значениеизкритической области w , должна быть равна заданному числу a, т. е.
Уровень значимости статистического теста — допустимая для данной задачи вероятность ошибки первого рода (ложноположительного решения, false positive), то есть вероятность отклонить нулевую гипотезу, когда на самом деле она верна.
Другая интерпретация: уровень значимости — это такое (достаточно малое) значение вероятности события, при котором событие уже можно считать неслучайным.Уровень значимости обычно обозначают греческой буквой (альфа).
НУЛЕВАЯ ГИПОТЕЗА — термин математический статистики, предварительная гипотеза, которая должна быть опровергнута или не опровергнута при решении вопроса о близости фактического распределения к теоретическому распределению или вопроса о различиях между выборочными совокупностями .Состоит либо в предположении, что различия или сходства двух рядов значений наблюденного признака носят совершенно случайный характер, либо, наоборот, что они представляют собой две случайные выборки из одной и той же совокупности.
Нулева́я гипо́теза — гипотеза, которая проверяется на согласованность с имеющимися выборочными (эмпирическими) данными. Часто в качестве нулевой гипотезы выступают гипотезы об отсутствии взаимосвязи или корреляции между исследуемыми переменными, об отсутствии различий (однородности) в распределениях (параметрах распределений) двух и/или более выборках. В стандартном научном подходе проверки гипотез исследователь пытается показать несостоятельность нулевой гипотезы, несогласованность её с имеющимися опытными данными, то есть отвергнуть гипотезу. При этом подразумевается, что должна быть принята
10.Проверка гипотезы о равенстве средних.
Гипотеза о равенстве средних может рассматриваться как гипотеза о связи, еслисопоставляются средние величины, обусловленные действием какого-либо фактора. Например,сравнивается средняя заработная плата рабочих двух специальностей. Нулевая гипотезасостоит в том, что специальность рабочего не влияет на заработок. Если окажется, что tфакт > tкрит, нулевую гипотезу отклоняют и делают вывод о том, что специальность оказываетвлияние на заработную плату. Случай проверки гипотезы о средних величинах при неизвестных дисперсиях, равенствокоторых не предполагается, здесь не рассматривается ввиду его недостаточной теоретическойразработанности.
11.Проверка гипотезы о законе распределения.
В приложениях статистики чаще всего используется нормальное (гауссовское) распределение. Непрерывная случайная величина Х называетсяраспределенной по нормальному закону с параметрами ______, если ее плотность распределения есть
12.Ранговый критерий проверки статистических гипотез Ван-дер-Вардена.
Критерий Ван дер Вардена(Van der Waerden criteria) — непараметрический статистический критерий, используемый для оценки различий между двумя выборками по признаку, измеренному в количественной или порядковой шкале. Критерий является ранговым, поэтому он инвариантен по отношению к любому монотонному преобразованию шкалы измерения. Существует обобщение критерия Ван дер Вардена для выявления различий между несколькими выборками. Описание критерия
Заданы две выборки .
Дополнительные предположения:
§ обе выборки простые, объединённая выборка независима;
§ выборки взяты из неизвестных непрерывных распределений и соответственно.
Нулевая гипотеза .
Статистика критерия:
1. Построить общий вариационный ряд объединённой выборки и найти ранги элементов первой выборки в общем вариационном ряду.
2. Статистика критерия Ван дер Вардена вычисляется по формуле:
, где — квантиль уровня стандартного нормального распределения
Критерий (при уровне значимости ):
§ двусторонний критерий — против альтернативы
если , то нулевая гипотеза отвергается;
§ односторонний критерий -- против альтернативы
если , то нулевая гипотеза отвергается;
Здесь -- это -квантиль табличного распределения статистики Ван дер Вардена с параметрами .