Більш конкретне формулювання виглядає наступним чином. Ми розглядаємо адаптований сильний марковський ланцюг визначений у відфільтрованому ймовірнісному просторі , де позначає міру ймовірності, з якої починається випадковий процес. Задані неперервні функції , і , оптимальна задача зупинки це
Ще інколи називають формулою MLS (що розшифровується як Mayer, Lagrange and supremum відповідно).[4]
Методи вирішення
Загалом існує два підходи до вирішення задачі оптимальної зупинки.[4] Коли основний процес (або процес посилення) описується безумовними кінцевовимірними розподілами, відповідним методом вирішення є мартингальний підхід, який називається так тому, що він використовує мартингальну теорію, найважливішою концепцією якої є конверт Снелла[en]. У випадку дискретного часу, якщо горизонт планування скінченний, задачу також можна легко вирішити за допомогою динамічного програмування.
Коли основний процес визначається сімейством (умовних) функцій переходу, що веде до марковського сімейства ймовірностей переходу, часто можна використовувати потужні аналітичні інструменти, надані теорією марковських процесів, і цей підхід називають методом Маркова. Розв'язок зазвичай отримують розв'язуванням пов'язаних задач із вільною границею[en] (задача Стефана[en]).
де є -мірний броунівський рух, є -вимірна компенсована випадкова міра Пуассона[en], , , і - задані функції такі, що існує єдиний розв'язок . Нехай буде відкритою множиною (областю платоспроможності) і
буде часом банкрутства. Оптимальна задача зупинки:
Виявляється, що за деяких умов регулярності[5] справедлива перевірочна теорема: Якщо функція задовольняє
У вас є «чесна» монета, і ви постійно її підкидаєте. Кожного разу, перш ніж її підкинути, ви можете зупинити її підкидання та отримати виплату (скажімо, у гривнах) за середню кількість спостережених орлів.
Ви хочете максимізувати суму, яку вам платять, вибравши правило зупинки. Якщо Xi (для i ≥ 1) утворює послідовність незалежних, однаково розподілених випадкових величин із розподілом Бернуллі
і якщо
тоді послідовності , і — це об'єкти, пов'язані з цією задачею.
Продаж будинку
(Приклад, де не обов'язково сходиться)
У вас є будинок і ви хочете його продати. Кожен день вам пропонують за ваш будинок, і ви платите продовжуючи рекламу будинку. Якщо ви продаєте свій будинок в день , ви заробите , де .
Ви хочете максимізувати зароблену суму, вибравши правило зупинки.
У цьому прикладі послідовність () — це послідовність пропозицій для вашого будинку, а послідовність функцій винагород — це те, скільки ви заробите.
Ви спостерігаєте за послідовністю об'єктів, які можна ранжувати від найкращого до найгіршого. Ви хочете вибрати правило зупинки, яке максимізує ваші шанси вибрати найкращий об'єкт.
Ось, якщо (n — деяке велике число) — ранги об'єктів, і — це ймовірність вибору найкращого об'єкта, якщо ви припините навмисно відхиляти об'єкти на кроці i і — це послідовності, пов'язані з цією задачею. Ця задача була розв'язана на початку 1960-х років кількома людьми. Елегантне розв'язання задачі про перебірливу наречену та кілька модифікацій цієї задачі забезпечує більш сучасний алгоритм шансів (алгоритм Брюса).
Теорія пошуку
Економісти досліджували низку проблем оптимальної зупинки, подібних до «задач про перебірливу наречену», і зазвичай називають цей тип аналізу «теорією пошуку». Теорія пошуку особливо зосереджена на пошуку працівником високооплачуваної роботи або пошуку споживачем недорогого товару.
Проблема паркування
Особливим прикладом застосування теорії пошуку є задача оптимального вибору паркувального місця водієм, який прямує в оперу (театр, шопінг тощо). Наближаючись до пункту призначення, водій їде вулицею, вздовж якої є паркувальні місця — зазвичай вільними є лише деякі місця на парковці. Ціль добре видно, тому відстань до цілі оцінюється легко. Завдання водія — вибрати вільне місце для паркування якомога ближче до пункту призначення, не їздячи по колу, щоб відстань від цього місця до місця призначення була найменшою.[6]
Торгівля опціонами
Під час торгівлі опціонами на фінансових ринках власнику американського опціону дозволяється скористатися правом купити (або продати) базовий актив за заздалегідь визначеною ціною в будь-який час до або на дату закінчення терміну дії. Таким чином, оцінка американських опціонів є, по суті, проблемою оптимальної зупинки. Розглянемо класичну модель Блека — Шоулза і дозволимо бути безризиковою процентною ставкою та і — це ставка дивідендів і волатильність акцій. Ціна акцій підпорядковується геометричному броунівському руху
за нейтральною до ризику мірою.
Коли опція безстрокова, проблема оптимальної зупинки є
де функція виплати для опції call (далі «колл») і для put-опціону (далі «пут»). Варіаційна нерівність є
для усіх , де є межею вправи. Відомо, що розв'язок[7]
(Вічний колл) де і
(Вічний пут) де і
З іншого боку, коли термін придатності обмежений, задача пов'язана з двовимірною задачею з вільними границями, яка не має відомого розв'язку в замкненому вигляді. Однак можна застосувати різні чисельні методи. Див. модель Блека–Шоулза для різних методів оцінки, а також Fugit[en] для дискретного розрахунку оптимального часу для тренування на основі дерева[en].