U-критерій Манна-Уітні (англ.Mann — Whitney U-test) — непараметричний статистичний критерій, що використовується для оцінки різниці між двома вибірками за рівнем будь-якої ознаки, виміряної якісно. Дозволяє виявити відмінності в значенні параметра між малими вибірками.
Інші назви: критерій Манна — Уітні — Уілкоксона (англ.Mann — Whitney — Wilcoxon, MWW), критерій суми рангів Уілкоксона (англ.Wilcoxon rank — sum test) або критерій Уілкоксона — Манна — Уітні (англ.Wilcoxon — Mann — Whitney test).
Історія
Цей метод виявлення відмінностей між вибірками був запропонований у 1945 році Френком Уілкоксоном (F. Wilcoxon). У 1947 році він був істотно перероблений і розширений Г. Б. Манном (H. B. Mann) і Д. Р. Уітні (D. R. Whitney), на честь яких сьогодні зазвичай і називається.
Цей метод визначає, чи досить мала зона значень, що перехрещуються, між двома рядами (ранжованим рядом значень параметра в першій вибірці і таким же в другій вибірці). Чим менше значення критерію, тим імовірніше, що відмінності між значеннями параметра у вибірках достовірні.
Обмеження застосованості критерію
У кожній з вибірок повинно бути не менше 3 значень ознаки. Допускається, щоб в одній вибірці були два значення, але в другій тоді не менше п'ять.
У вибіркових даних не повинно бути збігів значень (усі числа — різні) або таких збігів повинно бути дуже мало.
Використання критерію
Для застосування U-критерію Манна — Уітні треба зробити такі операції:
Скласти єдиний ранжований ряд з обох вибірок, що зіставляються, розставивши їхні елементи за мірою наростання ознаки і приписавши меншому значенню менший ранг. Загальна кількість рангів вийде рівною:
де — кількість одиниць в першій вибірці, а — кількість одиниць в другій вибірці.
Розділити єдиний ранжований ряд на два, що складаються відповідно з одиниць першої і другої вибірок. Підрахувати окремо суму рангів, що припали на долю елементів першої вибірки, і окремо — на долю елементів другої вибірки. Визначити більшу з двох рангових сум (), таку, що відповідає вибірці з одиниць.
Визначити значення U -критерію Манна — Уітні за формулою:
За таблицею для обраного рівня статистичної значущості визначити критичне значення критерію для даних і . Якщо набуте значення менше табличного або дорівнює йому, то визнається наявність істотної відмінності між рівнем ознаки в даних вибірках (приймається альтернативна гіпотеза). Якщо ж набуте значення більше за табличне, приймається нульова гіпотеза. Достовірність відмінностей тим вище, чим менше значення .
При справедливості нульової гіпотези критерій має математичне сподівання і дисперсію і при достатньо великому об'ємі вибіркових даних розподілений практично нормально.
Mann H. B., Whitney D. R. On a test of whether one of two random variables is stochastically larger than the other. // Annals of Mathematical Statistics. — 1947. — № 18. — P. 50—60. (англ.)
Wilcoxon F. Individual Comparisons by Ranking Methods. // Biometrics Bulletin 1. — 1945. — P. 80-83. (англ.)
Гублер Е. В., Генкин А. А. Применение непараметрических критериев статистики в медико-биологических исследованиях. — Л., 1973. (рос.)