L - критерий Колмогорова-Смирнова
Назначение критерия.
Критерий предназначен для сопоставления двух распределений: а) эмпирического с теоретическим; б) одного эмпирического распределения с другим эмпирическим распределением.
Критерий позволяет найти точку, в которой сумма накопленных расхождений между двумя распределениями является наибольшей и оценить достоверность этого расхождения.
Описание критерия.
Здесь сопоставляются сначала частоты по первому разряду, потом по сумме первого и второго разрядов, потом по сумме первого, второго и третьего разрядов, и т.д. Таким образом, мы сопоставляем всякий раз накопленные к данному разряду частоты.
Если различия между данными распределениями существенны, то в какой-то момент разность накопленных частот достигнет критического значения, и мы сможем признать различия статистически достоверными. В формулу критерия λ включается эта разность. Чем больше эмпирическое значение λ, тем более существенны различия.
Еще один пример использовакния критерия.
Пример маркетологический.
Рисунок 10-а
Пусть мы производим некий товар и имеем четырех конкурентов, выпускающих такое же изделие с близкими свойствами, продающих его по сопоставимой цене. Иными словами, наш товар и аналоги конкурентов приблизительно одинаковы по всем свойствам и по подходу к его продаже. Спрашивается: с равной ли вероятностью покупаются все разновидности этого изделия? То есть, с одинаковой ли частотой покупатели приобретают товар, выпускаемый нами и каждым конкурентом? Если это окажется не так, и распределение покупаемости товаров будет отличаться от равномерного, - стало быть, какой-то образец по какому-то параметру предпочтительнее. Дальнейшая задача – определять, что же это за параметр, и ответ на такой вопрос выходит за пределы стастического исследования, но первая стадия задачи решается именно методом Колмогорова-Смирнова (можно и Пирсона).
Эксперимент организовывался бы при этих условиях так: N респондентов просили бы расставить все товары в порядке предпочтения (то есть – проранжировать).
Для каждого товара тогда производим отдельный расчет и рисуем отдельную гистограмму. На такой гистограмме следует отложить:
- в первом столбце – сколько раз наш (или конкурирующий) товар был избран на первое место?
- во втором столбце – сколько – на первое и второе вместе?
- в третьем столбце – сколько – на первое + второе + третье?
- в четвертом столбце – а сколько – на первое + второе + третье + четвертое?
- в пятом столбце – и, наконец, - сколько – на первое + второе + третье + четвертое + пятое место?
Вторично эта процедура проводится для идеального случая, в котором мы исходим их предположения, что все товары избираются на первое место (то есть – покупаются) одинаково часто. Гистограмма тогда выглядела бы лесенкой, у которой все ступеньки возрастают на одинаковую величину.
Заключительный этап – сопоставление разницы между каждой парой столбцов гистограммы. Наибольшая разница и укажет, число d max.
***
Ограничения критерия.
Критерий требует достаточно большой выборки при сопоставлении двух эмпирических распределений (больше или равно 50). При сопоставлении эмпирического распределения с теоретическим допускается n больше или равно 5.
9.
Критерий j* - угловое преобразование Фишера.
Назначение критерия.
Критерий предназначен для сопоставления двух выборок по частоте встречаемости интересующего исследователя эффекта.
Описание критерия.
Критерий оценивает достоверность различий между процентными долями двух выборок, в которых зарегистрирован интересующий нас эффект. Суть углового преобразования Фишера состоит в переводе процентных долей в величины центрального угла, выраженные в радианах. Большей процентной доле будет соответствовать большее значение угла φ, и наоборот. Поскольку в уравнение включена тригонометрическая функция, зависимость между φ и процентной долей будет нелинейной. Она выражается уравнением:
φ = 2 arcsin (√ P)(арксинус корень из P)
Ограничения критерия.
1. Ни одна из сопоставляемых долей не должна быть равной нулю.
2. Число элементов выборки не ограничено сверху. Нижний предел – 2 наблюдения в одной из выборок, при условии соблюдения соотношений:
Первая выборка | Вторая выборка |
Не менее 30 | |
Не менее 7 | |
Не менее 5 | |
При n1; n2 больше или равно 5 возможны любые сочетания. |