Теорія узагальнюваності
Тео́рія узага́льнюваності (англ. Generalizability theory, G theory) — це статистична система для концептуалізації, дослідження та проєктування надійних спостережень. Її використовують для визначення надійності (тобто відтворюваності) вимірювань за конкретних умов. Вона особливо корисна для оцінювання надійності оцінювання успішності. Її вперше представили Лі Кронбах , Н. Раджаратнам і Ґолдайн Ґлезер 1963 року. ОглядУ теорії узагальнюваності джерела дисперсії називають аспектами (англ. facets). Аспекти подібні до «факторів», які використовують у дисперсійному аналізі, до них, серед інших можливостей, можуть належати особи, оцінювачі, завдання/форми, час і постановка. Ці аспекти є потенційними джерелами похибки, і призначенням теорії узагальнюваності є кількісна оцінка обсягу похибки, спричиненої кожним аспектом та взаємодією аспектів. Корисність даних, отриманих у дослідженні узагальнюваності (англ. G study), критично залежить від конструкції дослідження. Тому дослідник повинен ретельно обміркувати, як він/вона сподівається узагальнювати будь-які конкретні результати. Чи важливо узагальнювати з однієї постановки на більше число постановок? З одного оцінювача на більшу кількість оцінювачів? З одного набору завдань на більший набір завдань? Відповіді на ці запитання варіюватимуться від одного дослідника до іншого й визначатимуть конструкцію дослідження узагальнюваності різними способами. Окрім визначення, які аспекти дослідник загалом бажає вивчати, необхідно встановити, який аспект слугуватиме об'єктом вимірювання (наприклад, систематичним джерелом дисперсії) для цілей аналізу. Решту аспектів розглядають як джерела похибки вимірювання. У більшості випадків об'єктом вимірювання буде особа, якій призначують число/оцінку. В інших випадках це може бути група виконавців, наприклад, команда чи клас. В ідеалі, майже вся вимірювана дисперсія має бути приписана об'єкту вимірювання (наприклад, індивідуальним відмінностям), з лише мінімальною часткою дисперсії, приписаною решті аспектів (наприклад, оцінювач, час, постановка). Результати з дослідження узагальнюваності можливо також використовувати для інформування дослідження рішення (англ. decision study, D study). У дослідженні рішення ми можемо поставити гіпотетичне запитання: «Що сталося би, якби різні аспекти цього дослідження було змінено?» Наприклад, компанія з виробництва безалкогольних напоїв може зацікавитися оцінкою якості нового продукту за допомогою споживчої шкали оцінювання. Використовуючи дослідження рішення, можливо оцінити, як зміниться послідовність оцінок якості, якщо споживачам поставити 10 питань замість 2, або якщо напій оцінять 1 000 споживачів замість 100. Завдяки моделюванню досліджень рішення можливо дослідити, як зміняться коефіцієнти узагальнюваності (подібні до коефіцієнтів надійності в класичній теорії тестування) за різних обставин і, відповідно, визначити ідеальні умови, за яких наші вимірювання будуть найнадійнішими. Порівняння з класичною теорією тестуванняУвага класичної теорії тестування (КТТ) зосереджена на визначенні похибки вимірювання. Мабуть, найвідомішою моделлю КТТ є рівняння , де є спостережуваною оцінкою, — істинною оцінкою, а — похибкою вимірювання. Хоча може подавати багато різних типів похибок, як-от похибку оцінювача чи інструмента, КТТ дозволяє оцінювати лише один тип похибки за раз. По суті, вона вкидає всі джерела похибки до одного члену похибки. Це може бути прийнятним у контексті суворо контрольованих лабораторних умов, але варіативність є частиною повсякденного життя. У польових дослідженнях, наприклад, нереалістично очікувати, що умови вимірювання залишатимуться сталими. Теорія узагальнюваності визнає та враховує варіативність умов оцінювання, яка може впливати на вимірювання. Перевага теорії узагальнюваності полягає в тому, що дослідники можуть оцінювати, яку частку загальної дисперсії результатів спричиняють окремі чинники, які часто змінюються під час оцінювання, як-от постановка, час, завдання та оцінювачі. Ще однією важливою відмінністю між КТТ і теорією узагальнюваності є те, що останній підхід враховує, як може змінюватися узгодженість результатів залежно від того, чи міру використовують для ухвалення абсолютних, чи відносних рішень. Наприклад, абсолютним або орієнтованим на критерій (англ. criterion-referenced) рішенням є порівняння тестової оцінки особи з пороговою оцінкою для визначення відповідності або діагнозу (наприклад, оцінку дитини в тесті досягнень використовують для визначення відповідності програмі для обдарованих дітей). Натомість відносним або орієнтованим на норму (англ. norm-referenced) рішенням є використання тестової оцінки особи для (а) визначення її відносного становища у порівнянні з однолітками (наприклад, оцінку дитини в підтесті з читання використовують для визначення, до якої групи з читання її віднести), або (б) здійснення внутрішньоіндивідуальних порівнянь (наприклад, порівняння попередньої й поточної успішності однієї й тієї ж особи). Тип рішення, який цікавить дослідника, визначатиме формулу, яку слід використовувати для обчислення коефіцієнта узагальнюваності (подібного до коефіцієнта надійності в КТТ). Див. такожДжерела
Посилання
|
Portal di Ensiklopedia Dunia