Критерий Краскела — Уоллиса предназначен для проверки равенства медиан нескольких выборок. Данный критерий является многомерным обобщением критерия Уилкоксона — Манна — Уитни. Критерий Краскела — Уоллиса является ранговым, поэтому он инвариантен по отношению к любому монотонному преобразованию шкалы измерения.
Известен также под названиями: H-критерий Краскела — Уоллиса, однофакторный дисперсионный анализ Краскела — Уоллиса (англ. Kruskal — Wallis one-way analysis of variance), тест Крускала — Уоллиса (англ. Kruskal — Wallis test). Назван в честь американских математиков Уильяма Краскела и Аллена Уоллиса.
Примеры задач
Проходит чемпионат мира по футболу. Первая выборка — опрос болельщиков с вопросом «Каковы шансы на победу сборной России?» до начала чемпионата. Вторая выборка — после первой игры, третья — после второго матча и т. д. Значения в выборках — шансы России на победу по десятибалльной шкале (1 — «никаких перспектив», 10 — «отвезти в Россию кубок — дело времени»). Требуется проверить, зависят ли результаты опросов от хода чемпионата.
Описание критерия
Заданы
выборок:
.
Объединённая выборка будет иметь вид:

Дополнительные предположения:
- все выборки простые, объединённая выборка независима;
- выборки взяты из неизвестных непрерывных распределений
.
Проверяется нулевая гипотеза
при альтернативе
.
Упорядочим все
элементов выборок по возрастанию и обозначим
ранг
-го элемента
-й выборки в полученном вариационном ряду.
Статистика критерия Краскела — Уоллиса для проверки гипотезы о наличии сдвига в параметрах положения двух сравниваемых выборок имеет вид:

,
где
;
.
Гипотеза сдвига отклоняется на уровне значимости
, если
, где
— критическое значение, при
и
вычисляемое по таблицам. При бо́льших значениях применимы различные аппроксимации.
Аппроксимация Краскела — Уоллиса
Пусть
;
;
;
.
Тогда статистика
будет иметь при отсутствии сдвига
-распределение с
и
степенями свободы. Таким образом, нулевая гипотеза отклоняется на уровне значимости
, если
.
Аппроксимация Имана — Давенпорта
В соответствии с ней нулевая гипотеза сдвига отклоняется с достоверностью
, если
, где
;
,
и
— соответственно критические значения статистик Фишера и хи-квадрат с соответствующими степенями свободы.
Это более точная аппроксимация, чем аппроксимация Краскела — Уоллиса. При наличии связанных рангов (то есть когда совпадают значения величин из разных выборок и им присваиваются одинаковые средние ранги) необходимо использовать модифицированную статистику
, где
;
— размер
-й группы одинаковых элементов;
— количество групп одинаковых элементов. При
справедлива аппроксимация распределения статистики
;
-распределением с
степенями свободы, то есть нулевая гипотеза отклоняется, если
.
См. также
Для проверки гипотезы об однородности средних может использоваться ряд параметрических критериев: сравнения двух выборочных средних при известных дисперсиях; сравнения двух выборочных средних при неизвестных, но равных дисперсиях (критерий Стьюдента); сравнения двух выборочных средних при неизвестных и неравных дисперсиях; F-критерий проверки однородности средних, k-выборочный вариант критерия Стьюдента. В этих же целях может применяться целая совокупность непараметрических критериев, к которым относится критерий Краскела–Уоллиса, критерий Уилкоксона, критерий Манна–Уитни, критерий Ван дер Вардена, k-выборочный критерий Ван дер Вардена и др.
Можно отметить относительную устойчивость параметрических критериев к нарушению предположения о нормальности анализируемых выборок. Но и выигрыш в мощности параметрических критериев перед непараметрическими оказывается относительно незначительным. Более подробно со свойствами упомянутых критериев можно ознакомиться в руководстве:
- Лемешко Б. Ю. Критерии проверки гипотез об однородности. Руководство по применению : монография. – 2-е изд., перераб. и доп. – Москва : ИНФРА-М, 2021. – 248 с. – (Научная мысль). – DOI 10.12737/986695 https://znanium.ru/read?id=367822
Литература
- Kruskal W. H., Wallis W. A. Use of ranks in one-criterion variance analysis. // Journal of the American Statistical Association. — 1952, 47 № 260. — pp. 583–621.
- Ликеш И., Ляга Й. Основные таблицы математической статистики. — М.: Финансы и статистика, 1985.
- Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006. — 466—468 с.
Ссылки