Валідність тестуВалі́дність те́сту (англ. test validity) — це ступінь, до якого тест (наприклад, хімічний, фізичний чи освітній) точно вимірює те, що він має вимірювати. У галузях психологічного та освітнього тестування «валідність стосується ступеня, до якого свідчення й теорія підтримують інтерпретації результатів тесту, передбачені запропонованим використанням тесту».[1] Хоча класичні моделі розділяли це поняття на різні «валідності» (як-от змістовна валідність , критеріальна валідність та конструктна валідність ),[2][3] нині переважним є погляд на валідність як на єдиний унітарний конструкт.[4] Валідність загалом вважають найважливішим питанням у психологічному та освітньому тестуванні,[5] оскільки вона стосується значення, яке покладають на результати тесту.[4] Хоча багато підручників подають валідність як статичний конструкт,[6] з моменту перших опублікованих рекомендацій зі створення психологічних та освітніх тестів розвинулися різні моделі валідності.[7] Ці моделі можливо поділити на дві основні групи: класичні моделі, що містять кілька типів валідності, та сучасні моделі, що розглядають валідність як єдиний конструкт. Сучасні моделі реорганізують класичні «валідності» в «аспекти» валідності[4] або «типи» свідчень, що підтримують валідність.[1] Валідність тесту часто плутають із надійністю, яка стосується узгодженості вимірювання. Адекватна надійність є необхідною передумовою валідності, але висока надійність жодним чином не гарантує, що вимірювання валідне. Історичне підґрунтяХоча психологи й педагоги усвідомлювали кілька аспектів валідності ще до Другої світової війни, їхні методи встановлення валідності зазвичай обмежувалися кореляцією результатів тесту з деяким відомим критерієм.[8] Під керівництвом Лі Кронбаха «Технічні рекомендації для психологічних тестів і діагностичних методик» 1954 року[7] намагалися уточнити й розширити поняття валідності, розділивши його на чотири частини: (а) конкурентна валідність , (б) прогностична валідність , (в) змістовна валідність і (г) конструктна валідність . Пізніша публікація Кронбаха та Міла[9] об'єднала прогностичну й конкурентну валідності в «критеріальну орієнтацію», яка згодом стала критеріальною валідністю . Протягом наступних чотирьох десятиліть багато теоретиків, зокрема й сам Кронбах,[10] висловлювали своє невдоволення цією трикомпонентною моделлю валідності.[11][12][13] Їхні аргументи досягли кульмінації у статті Семюела Мессіка 1995 року, де валідність описано як єдиний конструкт, складений із шести «аспектів».[4] На його погляд, різні висновування з результатів тесту можуть вимагати різних типів свідчень, але не різних валідностей. «Стандарти освітнього та психологічного тестування» 1999 року[1] переважно кодифікували модель Мессіка. Вони описують п'ять типів свідчень, що підтримують валідність і включають кожен із аспектів Мессіка, не згадуючи змістовної, критеріальної та конструктної валідностей класичної моделі. Процес валідаціїЗа «Стандартами» 1999 року,[1] валідація — це процес збирання свідчень для забезпечення «науково обґрунтованої основи» для інтерпретування результатів, запропонованої розробником тесту та/або його користувачем. Отже, валідація починається з розробки рамок, які визначають охоплення та аспекти (у випадку багатовимірних шкал) запропонованої інтерпретації. Ці рамки також містять раціональне обґрунтування, яке пов'язує інтерпретацію з відповідним тестом. Дослідники валідності далі складають список тверджень, які мають бути виконані, щоби запропонована інтерпретація була валідною. Або, навпаки, вони можуть скласти список питань, які можуть загрожувати валідності інтерпретацій. У будь-якому випадку дослідники збирають свідчення — чи то оригінальні емпіричні дослідження, метааналіз, чи огляд наявної літератури або логічний аналіз питань — для підтримки або спростування тверджень інтерпретації (або загроз валідності інтерпретації). Наголос роблять на якості, а не на кількості свідчень. Одна інтерпретація будь-якого результату тесту може вимагати, щоби було виконано кілька тверджень (або її може бути поставлено під сумнів будь-якою із загроз її валідності). Потужні свідчення на підтримку одного твердження не зменшують потреби в підтримці інших тверджень. Свідчення для підтримки (або спростування) валідності інтерпретації можливо класифікувати в одну з п'яти категорій:
Методики збирання кожного типу свідчень слід застосовувати лише тоді, коли вони дають інформацію, яка могла би підтримати або поставити під сумнів твердження, необхідні для відповідної інтерпретації. Кожен елемент свідчень зрештою інтегрується в аргументацію валідності. Ця аргументація може вимагати перегляду тесту, протоколу його проведення або теоретичних конструктів, які лежать в основі інтерпретацій. Якщо тест та/або інтерпретації його результатів будь-яким чином змінюються, для підтримки нової версії мусить зібрати свідчення новий процес валідації. Див. такожПримітки
|
Portal di Ensiklopedia Dunia