Функція цінностіоптимізаційної задачі дає значення, отримане виконанням цільової функції, але тільки в залежності від параметрів задачі.[1][2] У керованійдинамічній системі функція цінності представляє оптимальний винагороду системи на інтервалі [t, t1] при старті в момент часу tстануx(t)=x.[3] Якщо цільова функція представляє деяку вартість, яку потрібно мінімізувати, функцію цінності можна інтерпретувати як собівартість завершення оптимальної програми, і тому її називають «функцією собівартості».[4][5] В економічному контексті, де цільова функція зазвичай представляє корисність, функція цінності концептуально еквівалентна функції непрямої корисності.[6][7]
У задачі оптимального керування функція цінності визначається як супремум цільової функції, взятий на множині допустимих дій. При , типова задача оптимального керування полягає в
за умови, що
з початковим станом .[8] Цільова функція має бути максимізовано за всіма допустимими діями , де є функцією вимірною за мірою Лебега, яка відображає інтервал у визначену підмножину . Тоді функція цінності має вигляд
з , де — це «втрати». Якщо — це оптимальна пара векторів дій та станів, то . Функція , яка повертає оптимальний вектор дій для стану називається функцією стратегії.[9]
Функція цінності є унікальним в'язкісним рішенням[en] рівняння Гамільтона–Якобі–Беллмана.[13] У замкненій онлайн системі з наближено-оптимальним управлінням функція цінності також є функцією Ляпунова, яка встановлює глобальну асимптотичну стійкість замкнутої системи.[14]
↑Kamien, Morton I.; Schwartz, Nancy L. (1991). Dynamic Optimization : The Calculus of Variations and Optimal Control in Economics and Management (вид. 2nd). Amsterdam: North-Holland. с. 259. ISBN0-444-01609-0.
Clarke, Frank H.; Loewen, Philip D. (1986). The Value Function in Optimal Control: Sensitivity, Controllability, and Time-Optimality. SIAM Journal on Control and Optimization. 24 (2): 243—263. doi:10.1137/0324014.