У статистиці та дослідженняхвну́трішня узго́дженість[1][2][3] (англ.internal consistency) зазвичай є мірою на основі кореляцій між різними завданнями одного тесту (або однієї підшкали більшого тесту). Вона вимірює, чи дають кілька завдань, що мають оцінювати один і той же загальний конструкт(інші мови), подібні результати. Наприклад, якщо респондент висловлює згоду з твердженнями «Мені подобається кататися на велосипеді» та «Я отримував задоволення від їзди на велосипеді в минулому», а також незгоду з твердженням «Я ненавиджу велосипеди», це вказуватиме на добру внутрішню узгодженість тесту.
Внутрішню узгодженість зазвичай вимірюють за допомогою альфи Кронбаха, статистики, яку обчислюють на основі парних кореляцій між завданнями. Внутрішня узгодженість може набувати значень від від'ємної нескінченності до одиниці. Коефіцієнт альфа буде від'ємним, якщо внутрішньоособова мінливість перевищує міжособову.[4]
Загальноприйнятим є таке емпіричне правило опису внутрішньої узгодженості:[5]
Дуже високі значення надійності (0,95 або більше) не завжди бажані, оскільки це може свідчити про надлишковість завдань.[6] Мета при розробці надійного інструменту полягає в тому, щоб оцінки за подібними завданнями були пов'язані між собою (внутрішньо узгоджені), але щоби кожна водночас привносила деяку унікальну інформацію. Варто також зазначити, що альфа Кронбаха неодмінно вища для тестів, що вимірюють вужчі конструкти, й нижча при вимірюванні загальніших, широких конструктів. Це явище, поряд із низкою інших чинників, є аргументом проти використання об'єктивних порогових значень для міри внутрішньої узгодженості.[7] Альфа також є функцією від кількості завдань у тесті, тому коротші опитувальники часто матимуть нижчі оцінки надійності, залишаючись кращими в багатьох ситуаціях через менше навантаження на респондентів.
Альтернативний підхід до розгляду внутрішньої узгодженості полягає в трактуванні її як ступеня, до якого всі завдання тесту вимірюють одну й ту же латентну змінну. Перевага цього підходу над поняттям високої усередненої кореляції між завданнями тесту, що є основою альфи Кронбаха, полягає в тому, що на усереднену кореляцію між завданнями, як і на будь-яке інше усереднення, впливає асиметрія (у розподілі кореляцій між завданнями). Таким чином, хоча модова кореляція між завданнями дорівнює нулю, коли тест вимірює декілька непов'язаних латентних змінних, середня кореляція між завданнями в таких випадках буде більшою за нуль. Відтак, хоч ідеал вимірювання полягає у вимірюванні всіма завдання тесту єдиної латентної змінної, було багато разів показано, що альфа може досягати доволі високих значень навіть тоді, коли набір завдань тесту вимірює декілька непов'язаних латентних змінних.[8][9][10][11][12][13][14] Доречнішим показником ступеня, до якого всі завдання тесту вимірюють одну латентну змінну, може бути ієрархічний «коефіцієнт омега» (англ."coefficient omega").[15][16] Ревелль і Зінбарґ (2009) розглядають декілька різних мір внутрішньої узгодженості.[17][18]
↑Knapp, T. R. (1991). Coefficient alpha: Conceptualizations and anomalies. Research in Nursing & Health(англ.). 14: 457—480. doi:10.1002/nur.4770140610.
↑George, D.; Mallery, P. (2003). SPSS for Windows step by step: A simple guide and reference. 11.0 update(англ.) (вид. 4th). Boston: Allyn & Bacon. ISBN978-0205375523.
↑Streiner, D. L. (2003). Starting at the beginning: an introduction to coefficient alpha and internal consistency. Journal of Personality Assessment(англ.). 80: 99—103. doi:10.1207/S15327752JPA8001_18.
↑Green, S. B.; Lissitz, R.W.; Mulaik, S. A. (1977). Limitations of coefficient alpha as an index of test unidimensionality. Educational and Psychological Measurement(англ.). 37: 827—838. doi:10.1177/001316447703700403.