Співвідношення шансів

Співвідно́шення ша́нсів (СШ, англ. odds ratio, OR) — це статистика, яка кількісно оцінює силу пов'язаності двох подій A та B. Співвідношення шансів визначають як співвідношення шансів настання події A за наявності B з шансами настання A за відсутності B. Через симетричність, співвідношення шансів навзаєм розраховує й співвідношення шансів настання B за наявності A з шансами настання B за відсутності A. Дві події незалежні тоді й лише тоді, коли СШ дорівнює 1, тобто шанси однієї події однакові незалежно від наявності чи відсутності іншої. Якщо СШ більше за 1, то A і B пов'язані (корельовані) в тому сенсі, що, порівняно з відсутністю B, наявність B підвищує шанси настання A, і симетрично — наявність A підвищує шанси B. І навпаки, якщо СШ менше за 1, то A і B негативно корельовані, і наявність однієї події знижує шанси настання іншої.

Зверніть увагу, що співвідношення шансів симетричне щодо двох подій і не вказує причинності (корелювання не означає спричинювання): СШ понад 1 не доводить, що B спричинює A, чи що A спричинює B.[1]

Дві подібні статистики, які також часто використовують для кількісного оцінювання пов'язаності, — це відносний ризик (ВР) і абсолютне зниження ризику(інші мови) (АЗР). Часто найцікавішим параметром є саме ВР — співвідношення ймовірностей, аналогічне до шансів, які використовують у СШ. Проте доступні дані часто не дозволяють обчислити ВР чи АЗР, але дозволяють обчислити СШ, як у дослідженнях «випадок—контроль», про що йдеться нижче. З іншого боку, якщо одна з подій (A або B) достатньо рідкісна (в епідеміології це називають припущенням рідкісності захворювання(інші мови)), то СШ приблизно дорівнює відповідному ВР.

СШ відіграє важливу роль у логістичній моделі.

Визначення та основні властивості

Інтуїтивне пояснення на прикладі для нефахівців

Якщо підкинути симетричну монету, ймовірність випадіння аверса і ймовірність випадіння реверса однакові — обидві становлять 50 %. Уявімо тепер, що ми маємо несиметричну монету, таку що ймовірність випадіння аверса вдвічі більша за ймовірність реверса (тобто шанси подвоюються: з 1:1 до 2:1). Нові ймовірності становитимуть 6613 % для аверса і 3313 % для реверса.

Пояснювальний приклад у контексті припущення рідкісності захворювання(інші мови)

Припустімо, що витік радіації в селі з 1000 мешканців підвищив частоту випадків рідкісного захворювання. Загальна кількість осіб, які зазнали впливу радіації, становила з яких захворіли, а залишилися здоровими. Загальна кількість осіб, які не зазнали впливу, становила з яких захворіли, а залишилися здоровими. Це можливо подати у вигляді таблиці спряженості:

Ризик захворіти за умови впливу становить , а ризик захворіти за відсутності впливу — . Один очевидний спосіб порівняти ці ризики — скористатися їхнім співвідношенням, тобто відносним ризиком:

Співвідношення шансів дає інше значення. Шанси захворіти за наявності впливу становлять , а шанси за відсутності впливу — Співвідношення шансів — це частка цих двох величин:

Як показано в цьому прикладі, у випадку рідкісного захворювання(інші мови) відносний ризик і співвідношення шансів майже збігаються. За визначенням, рідкісне захворювання означає, що і . Отже, знаменники у формулах відносного ризику і співвідношення шансів майже однакові ( і .

Відносний ризик піддається розумінню легше, ніж співвідношення шансів, проте одна з причин користуватися співвідношенням шансів полягає в тому, що зазвичай дані про всю сукупність відсутні, й доводиться використовувати випадкову вибірку. У наведеному прикладі, якщо було би дуже дорого опитати мешканців села і з'ясувати, чи зазнали вони впливу радіації, то поширеність впливу радіації залишалась би невідомою, як і значення та . Можливо було би відібрати випадкову вибірку з 50 мешканців, проте цілком можливо, що в ній не виявилося би жодного хворого, оскільки захворіли лише 2,6 % населення. Замість цього доцільно застосувати дослідження «випадок—контроль»,[2] у якому опитують усіх 26 хворих мешканців, а також випадкову вибірку з 26 здорових. Результати можуть бути такими («можуть», бо це випадкова вибірка):

У цій вибірці шанси захворіти за умови впливу становлять 20/10, а шанси захворіти за відсутності впливу — 6/16. Отже, співвідношення шансів становить , досить близько до співвідношення шансів, обчисленого для всього села. Відносний ризик, проте, обчислити неможливо, оскільки це співвідношення ризиків захворювання, для якого потрібно знати та . Оскільки дослідження було побудоване з урахуванням хворих людей, половина учасників вибірки хворі, і це більше, ніж поширеність хвороби в загальній сукупності. Таким чином кількості хворих і здорових серед тих, хто зазнали впливу, та кількості хворих і здорових серед тих, хто не зазнали впливу, не підсумовні.

У медичній літературі загальноприйнято обчислювати співвідношення шансів і потім, користуючись припущенням рідкісності захворювання (яке зазвичай обґрунтоване), вважати, що відносний ризик приблизно дорівнює співвідношенню шансів. Це не лише дозволяє використовувати дослідження «випадок—контроль», а й спрощує врахування змішувальних змінних (як-от ваги або віку) в регресійному аналізі, а також має бажані властивості, описані в інших розділах цієї статті: інваріантність і нечутливість до типу вибірки.[3]

Визначення через шанси в групах

Співвідношення шансів — це співвідношення шансів настання події в одній групі з шансами її настання в іншій групі. Цей термін також використовують для позначення оцінок цього співвідношення на основі вибірки. Такі групи можуть бути, наприклад, чоловіки й жінки, експериментальна група і контрольна група, або будь-який інший дихотомний поділ. Якщо ймовірності події в кожній з груп — p1 (для першої групи) й p2 (для другої групи), то співвідношення шансів становить

де qx = 1 − px. Співвідношення шансів, що дорівнює 1, вказує на те, що досліджувана умова або подія однаково ймовірна в обох групах. Співвідношення шансів понад 1 вказує, що ця умова або подія ймовірніша в першій групі. Співвідношення шансів менше за 1 вказує, що ця умова або подія менш імовірна в першій групі. Якщо співвідношення визначене, воно не може бути від'ємним. Воно невизначене, якщо дорівнює нулю, тобто якщо або .

Визначення через спільні та умовні ймовірності

Співвідношення шансів також можливо визначити через спільний розподіл імовірності двох бінарних випадкових величин. Спільний розподіл бінарних випадкових величин X і Y можливо записати як

де p11, p10, p01 і p00 — невід'ємні «ймовірності комірок», що в сумі дають одиницю. Шанси для Y у двох підсукупностях, визначених як X = 1 і X = 0, визначаються через умовні ймовірності за X, тобто P(Y|X):

Отже, співвідношення шансів становить:

Зверніть увагу, що співвідношення шансів також дорівнює добутку ймовірностей «узгоджених комірок(інші мови)» (X = Y), поділеному на добуток імовірностей «неузгоджених комірок(інші мови)» (XY). Втім, у деяких застосуваннях позначення категорій як нуль та одиниця є довільним, тож у таких випадках узгоджені й неузгоджені значення не мають особливого сенсу.

Симетричність

Якби ми обчислювали співвідношення шансів на основі умовних імовірностей за Y, тобто

то отримали би те саме значення:

Інші міри розміру ефекта(інші мови) для бінарних даних(інші мови), як-от відносний ризик, цієї властивості симетричності не мають.

Зв'язок зі статистичною незалежністю

Якщо X та Y незалежні, то їхні спільні ймовірності можливо виразити через їхні відособлені ймовірності px =  P(X = 1) та py =  P(Y = 1) наступним чином:

У цьому випадку співвідношення шансів дорівнює одиниці, й навпаки: співвідношення шансів дорівнює одиниці лише тоді, коли спільні ймовірності можливо розкласти таким чином. Отже, співвідношення шансів дорівнює 1 тоді й лише тоді, коли X та Y незалежні.

Встановлення ймовірностей комірок на основі співвідношення шансів та відособлених імовірностей

Співвідношення шансів — це функція ймовірностей комірок, і навпаки: ці ймовірності можливо встановити, якщо відоме співвідношення шансів R та відособлені ймовірності P(X = 1) = p11 + p10 та P(Y = 1) = p11 + p01. Якщо співвідношення шансів R відрізняється від 1, то

де p1• = p11 + p10,  p•1 = p11 + p01, а

У випадку, коли R = 1, ми маємо незалежність, тож p11 = p1•p•1.

Після обчислення p11 решту трьох комірок імовірностей можливо легко встановити з відособлених імовірностей.

Приклад

Графік, що показує, як логарифм співвідношення шансів відповідає ймовірностям настання події X у двох групах, позначених через A та B. Показаний тут логарифм співвідношення шансів ґрунтується на шансах настання події в групі B відносно шансів її настання в групі A. Тому, коли ймовірність X у B більша за її ймовірність в A, співвідношення шансів перевищує  1, а логарифм співвідношення шансів перевищує  0.

Припустімо, що у вибірці зі 100 чоловіків (M) 90 вживали вино (D) протягом минулого тижня (а 10 — ні), тоді як у вибірці з 80 жінок лише 20 вживали вино (а 60 — ні). Це дає таблицю спряженості

Співвідношення шансів (СШ, англ. OR) можливо обчислити безпосередньо з цієї таблиці:

Іншими словами, шанси вживання вина серед чоловіків — 90 до 10, тобто 9:1, тоді як шанси вживання вина серед жінок — 20 до 60, тобто 1:3 = 0,33. Співвідношення шансів відтак становить 9 / 0,33, або 27, що показує, що чоловіки значно ймовірніше вживали вино, аніж жінки. Докладні обрахунки:

Цей приклад також ілюструє, що співвідношення шансів іноді чутливіші за відносний ризик: у цій вибірці чоловіки вживали вино у (90/100)/(20/80) = 3,6 раза частіше, а відповідні шанси вищі в 27 разів. Логарифм співвідношення шансів, різниця логітів імовірностей, пом'якшує цей ефект і забезпечує симетричність щодо впорядкування груп. Наприклад, при використанні натуральних логарифмів співвідношення шансів 27/1 відображається в 3,296, а співвідношення шансів 1/27 — у −3,296.

Статистичне висновування

Графік, що показує мінімальне значення статистики ви́біркового логарифму співвідношення шансів, необхідне для встановлення його значущості на рівні 0,05 для заданого обсягу вибірки. Три лінії відповідають різним постановкам відособлених імовірностей у таблиці спряженості 2×2 (у цьому графіку відособлені ймовірності рядків і стовпців однакові).

Було розроблено декілька підходів до статистичного висновування для співвідношень шансів.

Один із них використовує великі ви́біркові наближення вибіркового розподілу логарифму співвідношення шансів (натурального логарифму співвідношення шансів). Якщо користуватися визначеним вище записом спільної ймовірності, то сукупнісний логарифм співвідношення шансів становить

Якщо спостерігати дані у вигляді таблиці спряженості

то ймовірності у спільному розподілі можливо оцінити як

де ︿pij = nij / n, а n = n11 + n10 + n01 + n00 — сума кількостей усіх чотирьох комірок. Тоді вибірковий логарифм співвідношення шансів становить

.

Розподіл логарифма співвідношення шансів приблизно нормальний, де

Стандартна похибка логарифма співвідношення шансів становить приблизно

.

Це асимптотичне наближення, й воно не даватиме змістовного результату, якщо в одній з комірок дуже мала кількість спостережень. Якщо L — це вибірковий логарифм співвідношення шансів, то приблизний 95 %-вий довірчий інтервал для сукупнісного логарифма співвідношення шансів становить L ± 1,96SE.[4] Його можливо відобразити до exp(L − 1,96SE), exp(L + 1,96SE) для отримання 95 %-вого довірчого інтервалу для самого співвідношення шансів. Якщо перевіряти гіпотезу, що сукупнісне співвідношення шансів дорівнює одиниці, то двобічне p-значення становить 2P(Z < −|L|/SE), де P позначує ймовірність, а Z — стандартно нормально розподілена випадкова величина.

Інший підхід до висновування для співвідношень шансів розглядає розподіл даних, обумовлений відособленими частотами змінних X та Y. Перевагою цього підходу є те, що вибірковий розподіл співвідношення шансів можливо виразити точно.

Роль у логістичній регресії

Логістична регресія дозволяє узагальнити поняття співвідношення шансів поза межі двох бінарних змінних. Припустімо, що є бінарна змінна відгуку Y та бінарний передбачувач X, а на додачу й інші передбачувачі Z1, …, Zp, які можуть бути як бінарними, так і ні. Якщо здійснювати множинну логістичну регресію, моделюючи Y через X, Z1, …, Zp, то оцінюваний коефіцієнт для X пов'язаний із умовним співвідношенням шансів. Зокрема, на рівні сукупності виконується:

тому є оцінкою цього умовного співвідношення шансів. Інтерпретація  — оцінка величини співвідношення шансів між Y та X при незмінних значеннях Z1, …, Zp.

Нечутливість до типу вибірки

Якщо дані утворюють «сукупнісну вибірку» (англ. "population sample"), то ймовірності комірок інтерпретують як частоти кожної з чотирьох груп у сукупності, визначених значеннями X та Y. У багатьох випадках отримати сукупнісну вибірку неможливо, тому використовують добірну вибірку (англ. selected sample). Наприклад, можна вирішити вибрати одиниці(інші мови) з X = 1 із заданою ймовірністю f, незалежно від їхньої частоти в популяції (що вимагало би вибирання одиниць з X = 0 із імовірністю 1 − f). У такому випадку наші дані відповідатимуть таким спільним імовірностям:

Співвідношення шансів p11p00 / p01p10 для цього розподілу не залежить від f. Це свідчить про те, що співвідношення шансів (а отже і логарифм співвідношення шансів) інваріантне щодо невипадкової вибірки на основі однієї з досліджуваних змінних. Проте зверніть увагу, що стандартна похибка логарифма співвідношення шансів залежить від f.[джерело?]

Цей факт застосовують у двох важливих випадках:

  • Припустімо, що отримати сукупнісну вибірку незручно або неможливо, але доступна зручна вибірка(інші мови) одиниць із різними значеннями X, така, що в межах X = 0 та X = 1 підвибірки значень Y репрезентативні для сукупності (тобто вони слідують правильним умовним імовірностям).
  • Припустімо, що відособлений розподіл однієї змінної, скажімо, X, дуже асиметричний. Наприклад, при вивченні зв'язку між високим споживанням алкоголю та раком підшлункової залози захворюваність дуже низька, і вимагатиме дуже великої сукупнісної вибірки. Проте можливо скористатися даними з лікарень, щоби звернутися до більшості або всіх пацієнтів із раком у лікарнях, а потім випадково вибрати стільки же індивідів без раку підшлункової залози (це називають дослідженням «випадок—контроль»).

В обох цих постановках співвідношення шансів можливо обчислити за добірною вибіркою без зміщення результату відносно того, який було би отримано на сукупнісній вибірці.

Застосування у кількісних дослідженнях

Завдяки широкому використанню логістичної регресії, співвідношення шансів активно застосовують у багатьох галузях досліджень у медицині та суспільних науках. Його широко використовують в опитувальних дослідженнях(інші мови), епідеміології та для подання результатів деяких клінічних випробувань, зокрема в дослідженнях «випадок—контроль». У звітах часто вживають скорочення «СШ» (англ. "OR"). Коли об'єднують дані з декількох досліджень, його часто подають як «об'єднане СШ» (англ. "pooled OR").

Зв'язок із відносним ризиком

Відносний ризик і співвідношення шансів

Як пояснено в розділі «Пояснювальний приклад», відносний ризик (ВР, англ. relative risk, RR) зазвичай кращий за співвідношення шансів для розуміння зв'язку між ризиком та деякою змінною, як-от радіація чи нові ліки. У тому ж розділі пояснюється, що якщо справджується припущення рідкісності захворювання(інші мови), то співвідношення шансів є добрим наближенням відносного ризику[5] і має деякі переваги перед ним. Якщо ж припущення рідкісності захворювання не справджується, то нескориговане співвідношення шансів буде більшим за відносний ризик,[6][7][8] але існують новаторські методи, які можуть легко використовувати ті самі дані для оцінювання відносного ризику, різниці ризиків, базових імовірностей та інших показників.[9]

Якщо відомий абсолютний ризик у групі, яка не зазнала впливу впливу, то перехід між цими двома обчислюється як[6]

де RC — абсолютний ризик у групі, яка не зазнала впливу.

Якщо припущення рідкісності захворювання не справджується, співвідношення шансів може істотно відрізнятися від відносного ризику, і його не слід інтерпретувати як такий.

Розгляньмо смертність чоловіків і жінок серед пасажирів під час корабельної катастрофи.[3] Із 462 жінок загинули 154, а вижили 308. Із 851 чоловіка загинули 709, а вижили 142. Очевидно, чоловік мав більший шанс загинути, ніж жінка, але наскільки більший? Оскільки загинуло понад половину пасажирів, припущення рідкісності явно не справджується.

Щоб обчислити співвідношення шансів, зазначмо, що для жінок шанси загинути становили 1 до 2 (154/308). Для чоловіків — 5 до 1 (709/142). Співвідношення шансів становить 9,99 (4,99/0,5). Тобто шанси загинути в чоловіків були вдесятеро вищими, ніж у жінок.

Ймовірність смерті для жінок становила 33 % (154/462). Для чоловіків — 83 % (709/851). Відносний ризик смерті становить 2,5 (0,83/0,33). Тобто ймовірність смерті для чоловіка була в 2,5 раза вищою, ніж для жінки.

Плутанина та перебільшення

Співвідношення шансів у медичній літературі часто плутають із відносним ризиком. Для нестатистиків співвідношення шансів є складним для розуміння поняттям і водночас часто дає більш вражаючий показник ефекту.[10] Натомість більшість авторів вважає, що відносний ризик легший для розуміння.[11] В одному дослідженні члени національної організації хворих на певне захворювання були насправді в 3,5 раза частіше обізнаними про поширений метод лікування, порівняно з не членами, проте співвідношення шансів становило 24, і в публікації заявили, що члени «у понад 20 разів частіше чули про» це лікування.[12] Інше дослідження праць, опублікованих у двох журналах, показало, що 26 % статей, які використовували співвідношення шансів, тлумачили його як відносний ризик.[13]

Це може відображати просто обирання авторами з браком розуміння найбільш вражаючих цифр.[11] Проте іноді використання співвідношення шансів може бути оманливим цілеспрямовано.[14] Було запропоновано подавати співвідношення шансів як розмір ефекту(інші мови) лише коли співвідношення ризику неможливо оцінити прямо,[10] проте з новими методами оцінити співвідношення ризику можливо завжди, і саме його слід використовувати натомість.[9]

Хоча відносні ризики потенційно простіше пояснювати загальній аудиторії, існують математичні й концептуальні переваги використання співвідношення шансів замість відносного ризику, зокрема в регресійних моделях. Через це в епідеміології та біостатистиці немає консенсусу, чи віддавати перевагу відносним ризикам, чи співвідношенням шансів, коли справедливими є обидва, як-от у клінічних випробуваннях та когортних дослідженнях.[15]

Оборотність та інваріантність

Співвідношення шансів має ще одну унікальну властивість — воно безпосередньо математично оборотне, незалежно від того, чи СШ аналізують як уникання захворівання, чи як захворівання — де СШ для уникання є оберненим значенням 1/СШ для ризику. Це відоме як «інваріантність співвідношення шансів» (англ. 'invariance of the odds ratio'). Натомість відносний ризик не має цієї математичної властивості оборотності при дослідженні уникання чи настання захворівання. Це явище оборотності СШ й необоротності ВР найкраще ілюструється наступним прикладом:

Припустімо, що в клінічному дослідженні ризик побічної реакції становить 4/100 у групі з препаратом і 2/100 у групі плацебо… що дає ВР = 2 та СШ = 2,04166 для ризику побічної реакції препарат—плацебо. Проте якщо аналізувати навпаки й розглядати побічні реакції як одужання без них, то в групі препарату частка становитиме 96/100, а в групі плацебо — 98/100, що дає для одужання препарат—плацебо ВР = 0,9796, але СШ = 0,48979. Як видно, ВР 0,9796 явно не є оберненням ВР 2. Натомість СШ 0,48979 дійсно є прямим оберненням СШ 2,04166.

Це, знову-таки, те, що називають «інваріантністю співвідношення шансів», і чому ВР для одужання не те ж саме, що й ВР для ризику, тоді як СШ має цю властивість симетричності при аналізі як одужання, так і ризику побічних реакцій. Небезпека для клінічного тлумачення СШ виникає тоді, коли побічні реакції не рідкісні, через що СШ перебільшує відмінності, коли припущення рідкісності не справджується. З іншого боку, коли хвороба рідкісна, використання ВР для одужання (наприклад, ВР = 0,9796 з наведеного прикладу) може клінічно приховати важливе подвоєння ризику побічних ефектів, пов'язаних із препаратом або впливом.[джерело?]

Оцінювачі співвідношення шансів

Вибіркове співвідношення шансів

Ви́біркове співвідно́шення ша́нсів (англ. sample odds ratio) n11n00 / n10n01 легко обчислювати, і для помірних і великих вибірок воно добре працює як оцінювач сукупнісного співвідношення шансів. Коли одна або більше комірок у таблиці спряженості можуть мати малі значення, вибіркове співвідношення шансів може бути зміщеним(інші мови) і проявляти велику дисперсію.

Альтернативні оцінювачі

Задля подолання обмежень вибіркового співвідношення шансів було запропоновано низку альтернативних оцінювачів співвідношення шансів. Один із них — оцінювач умовною максимальною правдоподібністю, який при формуванні функції правдоподібності для максимізування обумовлюється сумами рядків і стовпців (як у точному критерії Фішера(інші мови)).[16] Ще одна альтернатива — оцінювач Ментела — Генцеля(інші мови).[джерело?]

Числові приклади

У наступних чотирьох таблицях спряженості подано спостережені частоти в комірках, а також відповідні вибіркові співвідношення шансів (СШ) та вибіркові логарифми співвідношень шансів (ЛСШ):

СШ = 1, ЛСШ = 0 СШ = 1, ЛСШ = 0 СШ = 4, ЛСШ = 1,39 СШ = 0,25, ЛСШ = −1,39
Y = 1 Y = 0 Y = 1 Y = 0 Y = 1 Y = 0 Y = 1 Y = 0
X = 1 10 10 100 100 20 10 10 20
X = 0 5 5 50 50 10 20 20 10

У наступних спільних розподілах імовірностей подано сукупнісні ймовірності комірок, а також відповідні сукупнісні співвідношення шансів (OR) та логарифми співвідношення шансів (LOR):

СШ = 1, ЛСШ = 0 СШ = 1, ЛСШ = 0 СШ = 16, ЛСШ = 2,77 СШ = 0,67, ЛСШ = −0,41
Y = 1 Y = 0 Y = 1 Y = 0 Y = 1 Y = 0 Y = 1 Y = 0
X = 1 0,2 0,2 0,4 0,4 0,4 0,1 0,1 0,3
X = 0 0,3 0,3 0,1 0,1 0,1 0,4 0,2 0,4

Числовий приклад

Приклад зниження ризику
Показник Експериментальна група (Е) Контрольна група (К) Разом
Випадки (В) ЕВ = 15 КВ = 100 115
Не випадки (Н) ЕН = 135 КН = 150 285
Усього суб'єктів (С) ЕС = ЕВ + ЕН = 150 КС = КВ + КН = 250 400
Частота випадків (ЧВ) ЕЧВ(інші мови) = ЕВ / ЕС = 0,1 або 10 % КЧВ(інші мови) = КВ / КС = 0,4 або 40 %
Змінна Скорочення Формула Значення
Абсолютне зниження ризику(інші мови) АЗР, ARR КЧВЕЧВ 0,3 або 30 %
Кількість, яку необхідно пролікувати КНП, NNT 1 / (КЧВЕЧВ) 3,33
Відносний ризик (співвідношення ризику) ВР, RR ЕЧВ / КЧВ 0,25
Відносне зниження ризику(інші мови) ВЗР, RRR (КЧВЕЧВ) / КЧВ, або 1 − ВР 0,75 або 75 %
Відворотна частка серед незазналих(інші мови) ВЧн, PFu (КЧВЕЧВ) / КЧВ 0,75
Співвідношення шансів СШ, OR (ЕВ / ЕН) / (КВ / КН) 0,167

Пов'язані статистики

Існують різні інші зведені статистики для таблиць спряженості, які вимірюють пов'язаність двох подій, як-от Y Юла(інші мови) та Q Юла(інші мови); ці дві унормовані так, що дорівнюють 0 для незалежних подій, 1 для ідеальної позитивної кореляції та −1 для ідеальної негативної кореляції. Е. В. Ф. Едвардс(інші мови) досліджував ці статистики й стверджував, що ці міри пов'язаності мусять бути функціями співвідношення шансів, яке він називав подвійним співвідношенням (англ. cross-ratio).[17]

Співвідношення шансів у дослідженні «випадок–контроль» із добиранням

Дослідження «випадок—контроль» передбачає відбір репрезентативних вибірок випадків захворювання й контрольних випадків, які відповідно мають і не мають певне захворювання. Зазвичай ці вибірки незалежні одна від одної. У піддослідних з обох вибірок фіксують попередню поширеність впливу певного чинника ризику. Це дозволяє оцінити співвідношення шансів наявності захворювання в осіб, які зазнали впливу, порівняно з тими, хто не зазнав впливу, як описано вище.[18] Проте іноді доцільно добирати контрольних суб'єктів до випадків за однією або кількома змішувальними змінними.[19] У цьому разі для кожного випадку та її/його відповідного контрольного суб'єкта фіксують попередню наявність досліджуваного впливу. Ці дані можливо звести до такої таблиці.

Таблиця 2×2 добору

Пари випадок—контроль Контроль зазнав впливу Контроль не зазнав впливу
Випадок зазнав впливу
Випадок не зазнав впливу

У цій таблиці наведено стан впливу в добраних парах піддослідних. Маємо пар, де і випадок, і його контроль зазнали впливу; пар, де впливу зазнав випадок, але не контроль; пар, де впливу зазнав контроль, але не випадок; та пар, де впливу не зазнав жоден. Вплив у парі випадок—контроль є корельованим через подібні значення їхніх спільних змішувальних змінних.

Наступне виведення належить Бреслоу(інші мови) та Дею(інші мови).[19] Розглядаємо кожну пару як належну до страти з однаковими значеннями змішувальних змінних. За умов належності до однієї страти, стани впливу випадку й контролю незалежні один від одного. Для будь-якої пари випадок—контроль у межах однієї страти нехай

 — імовірність того, що випадок зазнав впливу,
 — імовірність того, що контроль зазнав впливу,
 — імовірність того, що випадок не зазнав впливу, і
 — імовірність того, що контроль не зазнав впливу.

Тоді ймовірність того, що випадок зазнав впливу, а контроль — ні, дорівнює , а ймовірність того, що контроль зазнав впливу, а випадок — ні, дорівнює . Унутрішньостратове співвідношення шансів впливу для випадків щодо контролів дорівнює

Припускаємо, що ψ стале над усіма стратами.[19]

Тепер узгоджені пари, в яких або і випадок, і контроль зазнали впливу, або жоден не зазнав, нічого не повідомляють нам про шанси впливу в групі випадків порівняно з шансами впливу серед контролів. Імовірність того, що випадок зазнав впливу, а контроль — ні, за умови, що пара неузгоджена, становить

Розподіл за заданої кількості неузгоджених пар є біноміальним:  ~ B, а оцінкою максимально правдоподібною π є

Домноження обидвох сторін цього рівняння на і віднімання дає

, отже
.

Тепер  — це оцінка максимальною правдоподібністю π, а ψ — монотонна функція від . Отже,  — умовна оцінка максимальною правдоподібністю за заданої кількості неузгоджених пар. Ротман(інші мови) зі співавт.[20] подають альтернативне виведення , показуючи, що це — окремий випадок оцінки Ментела — Генцеля внутрішньостратового співвідношення шансів для стратифікованих таблиць 2×2.[20] Вони також посилаються на Бреслоу і Дея[19] як на авторів наведеного тут виведення.

За нульової гіпотези, що .

Отже, ми можемо перевірити нульову гіпотезу , перевіряючи нульову гіпотезу . Це здійснюється за допомогою критерію Мак-Немара(інші мови).

Існує низка способів обчислення довірчого інтервалу(інші мови) для π. Нехай та позначують відповідно нижню й верхню межі довірчого інтервалу для π. Оскільки , відповідний довірчий інтервал для ψ становить

.

Таблиці 2×2 добору також можна аналізувати з використанням умовної логістичної регресії(інші мови).[21] Ця методика має перевагу, оскільки дозволяє моделювати стан «випадок—контроль» залежно від кількох чинників ризику з добраних даних випадків—контролю.

Приклад

Мак-Евой зі співавт.[22] досліджували використання мобільних телефонів водіями як чинник ризику дорожньо-транспортних пригод у дослідженні випадків з перехресними (англ. case-crossover study).[18] Усі піддослідні були учасниками дорожньо-транспортних пригод, які вимагали ушпиталення. Користування мобільним телефоном кожного водія на момент аварії порівнювали з його ж користуванням телефоном у контрольний проміжок часу такого ж дня тижнем раніше. Очікується, що користування мобільним телефоном у момент аварії корелюватиме з користуванням телефоном тижнем раніше. Порівняння використання телефону під час аварії й у контрольний проміжок дозволяє скоригувати на особисті характеристики водія, час доби та день тижня. Ці дані можливо звести до такої таблиці.

Пари випадок—контроль Телефон використовували в контрольний час Телефон не використовували в контрольний час
Телефон використовували під час аварії 5 27
Телефон не використовували під час аварії 6 288

Було 5 водіїв, які користувалися телефоном в обох проміжках, 27 — під час аварії, але не в контрольний час, 6 — у контрольний час, але не під час аварії, і 288 — не користувалися телефоном ані під час аварії, ані в контрольний час. Співвідношення шансів аварії під час користування телефоном до водіння без користування телефоном становить

.

Перевірка нульової гіпотези еквівалентна перевірці нульової гіпотези за наявності 27 з 33 неузгоджених пар, де водій користувався телефоном у момент аварії. Критерій Мак-Немара(інші мови) . Ця статистика має один ступінь свободи й дає P-значення 0,0003. Це дозволяє нам відкинути гіпотезу, що користування мобільним телефоном не впливає на ризик дорожньо-транспортних пригод () на високому рівні статистичної значущості.

Із застосуванням методу Вілсона(інші мови), 95 %-вий довірчий інтервал для π становить (0,6561; 0,9139). Отже, 95 %-вий довірчий інтервал для ψ становить

(Мак-Евой зі співавт.[22] аналізували свої дані за допомогою умовної логістичної регресії(інші мови) й отримали результати, майже ідентичні наведеним. Див. останній рядок таблиці 3 в їхній статті.)

Див. також

Примітки

  1. Szumilas M (August 2010). Explaining Odds Ratios. Journal of the Canadian Academy of Child and Adolescent Psychiatry (англ.). 19 (3): 227—229. ISSN 1719-8429. PMC 2938757. PMID 20842279.
  2. LaMorte WW (13 травня 2013), Case-Control Studies (англ.), Boston University School of Public Health(інші мови), архів оригіналу за 8 жовтня 2013, процитовано 2 вересня 2013
  3. а б Simon S (July–August 2001). Understanding the Odds Ratio and the Relative Risk. Journal of Andrology (англ.). 22 (4): 533—536. doi:10.1002/j.1939-4640.2001.tb02212.x. PMID 11451349. S2CID 6150799.
  4. Morris JA, Gardner MJ (May 1988). Calculating confidence intervals for relative risks (odds ratios) and standardised ratios and rates. British Medical Journal (Clinical Research Ed.) (англ.). 296 (6632): 1313—6. doi:10.1136/bmj.296.6632.1313. PMC 2545775. PMID 3133061.
  5. Viera AJ (July 2008). Odds ratios and risk ratios: what's the difference and why does it matter?. Southern Medical Journal (англ.). 101 (7): 730—4. doi:10.1097/SMJ.0b013e31817a7ee4. PMID 18580722.
  6. а б Zhang J, Yu KF (November 1998). What's the relative risk? A method of correcting the odds ratio in cohort studies of common outcomes. JAMA (англ.). 280 (19): 1690—1. doi:10.1001/jama.280.19.1690. PMID 9832001.
  7. Robbins AS, Chao SY, Fonseca VP (October 2002). What's the relative risk? A method to directly estimate risk ratios in cohort studies of common outcomes. Annals of Epidemiology (англ.). 12 (7): 452—4. doi:10.1016/S1047-2797(01)00278-2. PMID 12377421.
  8. Nurminen M (August 1995). To use or not to use the odds ratio in epidemiologic analyses?. European Journal of Epidemiology (англ.). 11 (4): 365—71. doi:10.1007/BF01721219. PMID 8549701.
  9. а б King G, Zeng L (30 травня 2002). Estimating risk and rate levels, ratios and differences in case-control studies. Statistics in Medicine (англ.). 21 (10): 1409—1427. doi:10.1002/sim.1032. PMID 12185893.
  10. а б Taeger D, Sun Y, Straif K (10 серпня 1998). On the use, misuse and interpretation of odds ratios. The BMJ (англ.).
  11. а б A'Court C, Stevens R, Heneghan C (March 2012). Against all odds? Improving the understanding of risk reporting. The British Journal of General Practice (англ.). 62 (596): e220—3. doi:10.3399/bjgp12X630223. PMC 3289830. PMID 22429441.
  12. Nijsten T, Rolstad T, Feldman SR, Stern RS (January 2005). Members of the national psoriasis foundation: more extensive disease and better informed about treatment options. Archives of Dermatology (англ.). 141 (1): 19—26. doi:10.1001/archderm.141.1.19. PMID 15655138.
  13. Holcomb W (2001). An odd measure of risk: Use and misuse of the odds ratio. Obstetrics & Gynecology (англ.). 98 (4): 685—688. doi:10.1016/S0029-7844(01)01488-0. PMID 11576589.
  14. Taylor HG (January 1975). Social perception of the mentally retarded. Journal of Clinical Psychology (англ.). 31 (1): 100—2. doi:10.1136/bmj.316.7136.989. PMC 1112884. PMID 9550961.
  15. Wells GA (2022). Commentary on controversy and debate 4 paper series: Questionable utility of the relative risk in clinical research. Journal of Clinical Epidemiology (англ.). 142: 268—270. doi:10.1016/j.jclinepi.2021.09.016. PMID 34560254.
  16. Rothman KJ, Greenland S, Lash TL (2008). Modern Epidemiology (англ.). Lippincott Williams & Wilkins. ISBN 978-0-7817-5564-1.[сторінка?]
  17. Edwards AW (1963). The Measure of Association in a 2 × 2 Table. Journal of the Royal Statistical Society. A (General) (англ.). 126 (1): 109—114. doi:10.2307/2982448. JSTOR 2982448.
  18. а б Celentano DD, Szklo M, Gordis L (2019). Gordis Epidemiology, Sixth Edition (PDF) (англ.). Philadelphia, PA: Elsevier. с. 149–177. ISBN 9780323552318. Архів оригіналу (PDF) за 3 травня 2024.
  19. а б в г Breslow, NE, Day, NE (1980). Statistical Methods in Cancer Research: Vol. 1 – The Analysis of Case-Control Studies (англ.). Lyon, France: IARC Scientific Publications. с. 162–189. ISBN 978-92-832-0132-8.
  20. а б Rothman KJ, Greenland S, Lash TL (2008). Modern Epidemiology, Third Edition (PDF) (англ.). Philadelphia, PA: Lippincott Williams & Wilkins. с. 287,288. ISBN 978-0-7817-5564-1.
  21. Breslow NE, Day NE, Halvorsen KT, Prentice RL, Sabai C (1978). Estimation of multiple relative risk functions in matched case-control studies. Am J Epidemiol (англ.). 108 (4): 299—307. doi:10.1093/oxfordjournals.aje.a112623. PMID 727199.
  22. а б McEvoy SP, Stevenson MR, McCartt AT, Woodward M, Haworth C, Palamara P, Cercarelli R (2005). Role of mobile phones in motor vehicle crashes resulting in hospital attendance: a case-crossover study. BMJ (англ.). 331 (7514): 428. doi:10.1136/bmj.38537.397512.55. PMC 1188107. PMID 16012176.

Посилання

  • Odds Ratio Calculator — вебсайт (англ.)
  • Odds Ratio Calculator with various tests — вебсайт (англ.)
  • OpenEpi, вебпрограма, яка обчислює співвідношення шансів, як без добирання, так і з попарним добиранням (англ.)
Prefix: a b c d e f g h i j k l m n o p q r s t u v w x y z 0 1 2 3 4 5 6 7 8 9

Portal di Ensiklopedia Dunia

Kembali kehalaman sebelumnya