Понятие нулевой и альтернативной гипотезы

Величина зависимости тесно связана с понятием статистическая значимость результата, которое представляет собой оцененную меру уверенности в его "истинности" - a -уровень - это показатель, находящийся в убывающей зависимости от надежности результата. Более высокий a-уровень соответствует более низкому уровню доверия к найденной в выборке зависимости между переменными. Именно, a-уровень представляет собой вероятность ошибки, связанной с распространением наблюдаемого результата на всю генеральную совокупность. Например, a-уровень = 0.05 показывает, что имеется 5% вероятность, что найденная в выборке связь между переменными является лишь случайной особенностью данной выборки. Другими словами, если данная зависимость в генеральной совокупности отсутствует, а вы многократно проводили бы подобные эксперименты, то примерно в одном из двадцати повторений эксперимента можно было бы ожидать такой же или более сильной зависимости между переменными. Однако указанная связь между зависимостью и значимостью имеет место только при фиксированном объеме выборки, поскольку при различных объемах выборки одна и та же зависимость может оказаться как высоко значимой, так и незначимой вовсе.

Чем слабее зависимость между переменными, тем большего объема требуется выборка, чтобы значимо ее обнаружить.

Конечная цель большинства статистических критериев состоит в оценивании зависимости между переменными.

Поскольку статистика как метод исследования имеет дело с данным, в которых интересующие исследователя закономерности искажены различными случайными факторами, большинство статистических вычислений сопровождается проверкой некоторых предположений или гипотез об источнике этих данных.

Статистическая гипотеза – это предположение о свойствах случайных величин или событий, которое мы хотим проверить по имеющимся данным. Примеры статистических гипотез в исследованиях:

Гипотеза 1. Прирост древесины стохастически (вероятностно) зависит от уровня осадков.

Гипотеза 2. Приживаемость саженцев не имеет существенных различий у различных пород при одинаковых условиях.

Гипотеза 3. Сортиментная технология лесозаготовок эффективнее по сравнению с традиционной - хлыстовой.

Нулевая гипотеза – этоосновное проверяемое предположение, которое обычно формулируется как отсутствие различий, отсутствие влияние фактора, отсутствие эффекта, равенство нулю значений выборочных характеристик и т.п. Примером нулевой гипотезы является утверждение о том, что различие в приросте древесины на 2 пробных площадях вызвано лишь случайными причинами.

Другое проверяемое предположение (не всегда строго противоположное или обратное первому) называется конкурирующейили альтернативнойгипотезой. Так, для упомянутого выше примера гипотезы Н0 в лесном хозяйстве одна из возможных альтернатив Н1 будет определена как прирост древесины на 2 пробных площадях различен и это различие определяется влиянием неслучайных факторов, например, лесохозяйственных мероприятий.

Выдвинутая гипотеза может быть правильной или неправильной, поэтому возникает необходимость проверить ее. Так как проверку производят статистическими методами, то данная проверка называется статистической.

При проверке статистических гипотез возможны ошибки (ошибочные суждения) двух видов:

— можно отвергнуть нулевую гипотезу, когда она на самом деле верна (так называемая ошибка первого рода);

— можно принять нулевую гипотезу, когда она на самом деле не верна (так называемая ошибка второго рода).

Ошибка, состоящая в принятии нулевой гипотезы, когда она ложна, качественно отличается от ошибки, состоящей в отвержении гипотезы, когда она истинна. Эта разница очень существенна вследствие того, что различна значимость этих ошибок. Проиллюстрируем вышесказанное на следующем примере.[2]

Пример 1. Процесс производства некоторого медицинского препарата весьма сложен. Несущественные на первый взгляд отклонения от технологии вызывают появление высокотоксичной побочной примеси. Токсичность этой примеси может оказаться столь высокой, что даже такое ее количество, которое не может быть обнаружено при обычном химическом анализе, может оказаться опасным для человека, принимающего это лекарство. В результате, прежде чем выпускать в продажу вновь произведенную партию, ее подвергают исследованию на токсичность биологическими методами. Малые дозы лекарства вводятся некоторому количеству подопытных животных, например, мышей, и результат регистрируют. Если лекарство токсично, то все или почти все животные гибнут. В противном случае норма выживших велика.

Исследование лекарства может привести к одному из возможных способов действия: выпустить партию в продажу (а1), вернуть партию поставщику для доработки или, может быть, для уничтожения (а2).

Ошибки двух видов, связанные с действиями а1 и а2 совершенно различны, различна и важность избежать их. Сначала рассмотрим случай, когда применяется действие а1, в то время когда предпочтительнее а2. Лекарство опасно для пациента, в то время как оно признано безопасным. Ошибка этого вида может вызвать смерть пациентов, употребляющих этот препарат. Это ошибка первого рода, так как нам важнее ее избежать.

Рассмотрим случай когда предпринимается действие а2, в то время когда а1 является более предпочтительным. Это означает, что вследствие неточностей в проведении эксперимента партия нетоксичного лекарства классифицировалась как опасная. Последствия ошибки могут выражаться в финансовом убытке и в увеличении стоимости лекарства. Однако случайное отвержение совершенно безопасного лекарства, очевидно, менее нежелательно, чем, пусть даже изредка происходящие гибели пациентов. Отвержение нетоксичной партии лекарства – ошибка второго рода.

Допустимая вероятность ошибки первого рода (Ркр) может быть равна 5% или 1% (0.05 или 0.01).

Уровень значимости – это вероятность ошибки первого рода при принятии решения (вероятность ошибочного отклонения нулевой гипотезы).

Альтернативные гипотезы принимаются тогда и только тогда, когда опровергается нулевая гипотеза. Это бывает в случаях, когда различия, скажем, в средних арифметических экспериментальной и контрольной групп настолько значимы (статистически достоверны), что риск ошибки отвергнуть нулевую гипотезу и принять альтернативную не превышает одного из трех принятых уровней значимости статистического вывода:

первый уровень — 5% (р=5%); где допускается риск ошибки в выводе в пяти случаях из ста теоретически возможных таких же экспериментов при строго случайном отборе испытуемых для каждого эксперимента;

второй уровень — 1%, т. е. соответственно допускается риск ошибиться только в одном случае из ста;

третий уровень — 0,1%, т. е. допускается риск ошибиться только в одном случае из тысячи.

Последний уровень значимости предъявляет очень высокие требования к обоснованию достоверности результатов эксперимента и потому редко используется. В лесных исследованиях, не нуждающихся в очень высоком уровне достоверности, представляется разумным принять 5% уровень значимости.

Всякое правило, на основе которого отклоняется или принимается нулевая гипотеза называется критериемдля проверки данной гипотезы. Статистический критерий (критерий) – это случайная величина, которая служит для проверки статистических гипотез.

Критическая область – совокупность значений критерия, при котором нулевую гипотезу отвергают. Область принятия нулевой гипотезы (область допустимых значений) – совокупность значений критерия, при котором нулевую гипотезу принимают.

Основы теории вероятностей

Понятие случайной величины

Специалист лесного хозяйства имеет дело со случайными величинами. Любой биометрический признак деревьев в пределах древостоя (диаметр, высота, объем и т.д.) - случайные величины, меняющие свое значение от объекта к объекту в пределах однородной совокупности. Причем заранее предсказать каждое из этих значений случайной величины невозможно. Случайные величины, возможные значения которых можно заранее перечислить, называются дискретными. Если же возможные значения случайных величин непрерывно заполняют некоторый промежуток, то они называются непрерывными.

Все значения, которые может принимать случайная величина, составляют генеральную совокупность. Она может состоять из конечного числа случайной величины или быть бесконечной. Во всех случаях в одну генеральную совокупность объединяются случайные величины, сходные по своей внутренней природе. Они должны представлять собой биологическое единство, которое сформировалось под воздействием одинаковых внешних и внутренних факторов среды. Нельзя, например, объединять в одну генеральную совокупность древостои двух разных поколений леса, хотя и произрастающих совместно.

1.3.2. Классическое и статистическое определения вероятности события

Вероятностью появления какого-либо события называется отношение числа случаев, благоприятствующих появлению этого события (M), к общему числу всех возможных случаев (N):

P=M/N. (1.1)

Пример 1.1. На пробной площади 300 деревьев. Из них 100 поражены грибом. Вероятность того, что наудачу взятое дерево окажется пораженным, равна P=100/300=1/3, а здоровым (300-100)/300=2/3.

Событие достоверно, если его вероятность равна 1, т.е. все шансы благоприятны. Событие вероятно, если вероятность его более 0,5. Событие маловероятно, если его вероятность меньше 0,5. Сумма вероятностей всех событий, взаимоисключающих друг друга, в пределах совокупности равна 1.

Понятие вероятности относят только к генеральной совокупности. Так как в практике можно установить только значения частот и частостей, то вероятность можно оценить только с некоторой долей надежности. На основе теории вероятностей разработан метод оценки результатов наблюдений, т.е. оценки степени надежности вывода - коэффициент достоверности t.

Глава 2.

Наши рекомендации