Использовать двусторонний критерий

Если же есть дополнительная информация, например, из предшествующих экспериментов,

На основании которой можно сделать предположение, что один из параметров больше или

Меньше другого, то используется односторонний критерий.

Когда имеются основания для применения одностороннего критерия, его следует

Предпочесть двустороннему, потому что односторонний критерий полнее использует

Информацию об изучаемом явлении и поэтому чаще дает правильные результаты.

Риск одностороннего критерия в том, что он может назвать значимой переменную, которая

не является значимой на самом деле. Односторонний критерий – это шанс назвать вашу

Переменную значимой, когда двусторонний критерий не срабатывает.

Двусторонние тесты более строгие в отличие от односторонних. Коэффициент может быть

Незначим при двустороннем тесте и значим при одностороннем, поэтому использование

Односторонних тестов может оказаться полезным, так как хочется иметь значимые

Коэффициенты.

Если односторонний тест не позволил отвергнуть нулевую гипотезу, то есть значимость

Коэффициента обосновать не удалось, то более строгий двусторонний тест также не отвергнет

Нулевую гипотезу, и коэффициент является незначимым.

Тема 4. Свойства описательных статистик (Часть 1)

Глава 1. Основные понятия статистики и дескриптивный анализ.

Перейдем теперь к рассмотрению первичных методов статистической обработки данных –

описательной статистике.

К описательным статистикам обычно относят числовые характеристики распределения

измеренного на выборке признака. Основное назначение каждой из первичных описательных

статистик - замена множества значений признака, измеренного на выборке, одним числом

(например, средним значением как мерой центральной тенденции). Компактное описание

группы при помощи первичных статистик позволяет интерпретировать результаты измерений,

в частности, путем сравнения первичных статистик разных групп.

Мера центральной тенденции - это число, характеризующее выборку по уровню выраженности

измеренного признака.

Существуют три способа определения «центральной тенденции», каждому из которых

соответствует своя мера: мода, медиана и выборочное среднее.

Наиболее просто получаемой мерой центральной тенденции является мода.

Мода- это такое значение из множества измерений, которое встречается наиболее часто. Моде,

или модальному интервалу признака, соответствует наибольший подъем (вершина) графика

распределения частот. Если график распределения частот имеет одну вершину, то такое

распределение называется унимодальным.

ПРИМЕР - когда два соседних значения встречаются одинаково часто и чаще, чем любое

другое значение, мода есть среднее этих двух значений.

Распределение может иметь и не одну моду. Когда все значения встречаются одинаково часто,

принято считать, что такое распределение не имеет моды.

Если распределение имеет несколько мод, то говорят, что оно мультимодально или

многомодально (имеет два или более «пика»). Мультимодальность распределения дает важную

информацию о природе исследуемой переменной.

ПРИМЕР - в социологических опросах, если переменная представляет собой предпочтение или

отношение к чему-то, то мультимодальность может означать, что существуют несколько

определенно различных мнений.

Мультимодальность также служит индикатором того, что выборка не является однородной и

наблюдения, возможно, порождены двумя или более «наложенными» распределениямиc2у.

Медиана- это такое значение признака, которое делит упорядоченное (ранжированное)

множество данных пополам так, что одна половина всех значений оказывается меньше

медианы, а другая - больше. Таким образом, первым шагом при определении медианы является

упорядочивание (ранжирование) всех значений по возрастанию или убыванию. Далее медиана

определяется следующим образом:

- если данные содержат нечетное число значений (8, 9, 10, 13, 15), то медиана есть центральное

значение;

- если данные содержат четное число значений (5, 8, 9, 11), то медиана есть точка, лежащая

посередине между двумя центральными значениями.

Среднее (выборочное среднее, среднее арифметическое)- определяется как сумма всех

значений измеренного признака, деленная на количество суммированных значений.

Среднее множества данных предполагает в основном арифметические операции. На величину

среднего влияют значения всех результатов.

Каждая мера центральной тенденции обладает характеристиками, которые делают ее ценной в

определенных условиях.

Для номинальных данных, разумеется, единственной подходящей мерой центральной

тенденции является мода, или модальная категория - та градация номинальной переменной,

которая встречается наиболее часто.

Для порядковых и метрических переменных, распределение которых унимодальное и

симметричное, мода, медиана и среднее совпадают. Чем больше отклонение от

симметричности, тем больше расхождение между значениями этих мер центральной тенденции.

По этому расхождению можно судить о том, насколько симметрично или асимметрично

распределение.

Однако использование среднего ограничивается тем, что на его величину влияет каждое

отдельное значение. Таким образом, среднее значение весьма чувствительно к «выбросам» -

экстремально малым или большим значениям переменной.

Наши рекомендации