L - критерий Колмогорова-Смирнова

Назначение критерия.

Критерий предназначен для сопоставления двух распределений: а) эмпирического с теоретическим; б) одного эмпирического распределения с другим эмпирическим распределением.

Критерий позволяет найти точку, в которой сумма накопленных расхождений между двумя распределениями является наибольшей и оценить достоверность этого расхождения.

Описание критерия.

Здесь сопоставляются сначала частоты по первому разряду, потом по сумме первого и второго разрядов, потом по сумме первого, второго и третьего разрядов, и т.д. Таким образом, мы сопоставляем всякий раз накопленные к данному разряду частоты.

Если различия между данными распределениями существенны, то в какой-то момент разность накопленных частот достигнет критического значения, и мы сможем признать различия статистически достоверными. В формулу критерия λ включается эта разность. Чем больше эмпирическое значение λ, тем более существенны различия.

Еще один пример использовакния критерия.

Пример маркетологический.

L - критерий Колмогорова-Смирнова - student2.ru

Рисунок 10-а

Пусть мы производим некий товар и имеем четырех конкурентов, выпускающих такое же изделие с близкими свойствами, продающих его по сопоставимой цене. Иными словами, наш товар и аналоги конкурентов приблизительно одинаковы по всем свойствам и по подходу к его продаже. Спрашивается: с равной ли вероятностью покупаются все разновидности этого изделия? То есть, с одинаковой ли частотой покупатели приобретают товар, выпускаемый нами и каждым конкурентом? Если это окажется не так, и распределение покупаемости товаров будет отличаться от равномерного, - стало быть, какой-то образец по какому-то параметру предпочтительнее. Дальнейшая задача – определять, что же это за параметр, и ответ на такой вопрос выходит за пределы стастического исследования, но первая стадия задачи решается именно методом Колмогорова-Смирнова (можно и Пирсона).

Эксперимент организовывался бы при этих условиях так: N респондентов просили бы расставить все товары в порядке предпочтения (то есть – проранжировать).

Для каждого товара тогда производим отдельный расчет и рисуем отдельную гистограмму. На такой гистограмме следует отложить:

- в первом столбце – сколько раз наш (или конкурирующий) товар был избран на первое место?

- во втором столбце – сколько – на первое и второе вместе?

- в третьем столбце – сколько – на первое + второе + третье?

- в четвертом столбце – а сколько – на первое + второе + третье + четвертое?

- в пятом столбце – и, наконец, - сколько – на первое + второе + третье + четвертое + пятое место?

Вторично эта процедура проводится для идеального случая, в котором мы исходим их предположения, что все товары избираются на первое место (то есть – покупаются) одинаково часто. Гистограмма тогда выглядела бы лесенкой, у которой все ступеньки возрастают на одинаковую величину.

Заключительный этап – сопоставление разницы между каждой парой столбцов гистограммы. Наибольшая разница и укажет, число d max.

***

Ограничения критерия.

Критерий требует достаточно большой выборки при сопоставлении двух эмпирических распределений (больше или равно 50). При сопоставлении эмпирического распределения с теоретическим допускается n больше или равно 5.

9.

Критерий j* - угловое преобразование Фишера.

Назначение критерия.

Критерий предназначен для сопоставления двух выборок по частоте встречаемости интересующего исследователя эффекта.

Описание критерия.

Критерий оценивает достоверность различий между процентными долями двух выборок, в которых зарегистрирован интересующий нас эффект. Суть углового преобразования Фишера состоит в переводе процентных долей в величины центрального угла, выраженные в радианах. Большей процентной доле будет соответствовать большее значение угла φ, и наоборот. Поскольку в уравнение включена тригонометрическая функция, зависимость между φ и процентной долей будет нелинейной. Она выражается уравнением:

φ = 2 arcsin (√ P)(арксинус корень из P)

Ограничения критерия.

1. Ни одна из сопоставляемых долей не должна быть равной нулю.

2. Число элементов выборки не ограничено сверху. Нижний предел – 2 наблюдения в одной из выборок, при условии соблюдения соотношений:

Первая выборка Вторая выборка
Не менее 30
Не менее 7
Не менее 5
При n1; n2 больше или равно 5 возможны любые сочетания.

Наши рекомендации