Вчителеве нав'язуванняВчи́телеве нав'я́зування (англ. teacher forcing) — це алгоритм для тренування ваг рекурентних нейронних мереж (РНМ).[1] Він передбачає подавання спостережуваних значень послідовності (тобто, істинних зразків) назад до РНМ після кожного кроку, відтак змушуючи РНМ триматися близько до істинної послідовності.[2] Термін «вчителеве нав'язування» може бути обґрунтовано порівнянням РНМ з людиною-студентом, яка складає багаточастинний іспит, де відповідь на кожну частину (наприклад, математичний розрахунок) залежить від відповіді на попередню частину.[3] У цій аналогії, замість того, щоб оцінювати кожну відповідь у кінці, з ризиком того, що студент завалить всі окремі частини, навіть якщо помилку він зробив лише в першій, вчитель записує оцінку для кожної окремої частини, а потім говорить студентові правильну відповідь, яка буде використовуватися в наступній частині.[3] Використання зовнішнього вчителевого сигналу відрізняється від реальночасового рекурентного навчання (РЧРН, англ. RTRL).[4] Вчителеві сигнали відомі з осциляторних мереж.[5] Перспектива полягає в тому, що вчителеве нав'язування допомагає скорочувати час тренування.[6] Термін «вчителеве нав'язування» запровадили 1989 року Рональд Вільямс та Давід Ціпсер, які повідомили, що цю методику в той час вже «часто використовували у завданнях з динамічного керованого навчання».[7][2] Доповідь NeurIPS[en] 2016 року представила пов'язаний метод «професорового нав'язування» (англ. "professor forcing").[2] Див. такожПосилання
|
Portal di Ensiklopedia Dunia