МАКСИМИЗАЦИЯ ВРЕМЕНИ ВЫХОДА УПРАВЛЯЕМОГО СЛУЧАЙНОГО БЛУЖДАНИЯ НА ГРАНИЦУ КВАДРАНТА
В каждый момент времени управление воздействует только на одну из двух координат блуждания, величина его фиксирована. Находится стратегия, оптимальная сразу для ряда критериев (среднее время выхода, вероятность невыхода и др.). Решение уравнения Беллмана для этого не потребовалось благодаря свойствам модели: симметрия, монотонность, возможность декомпозиции. Модель возникла при изучении экономических задач.
Year of publication: |
2010
|
---|---|
Authors: | ВЛАДИМИРОВНА, АНУЛОВА СВЕТЛАНА |
Published in: |
Проблемы управления. - CyberLeninka. - 2010, 3, p. 7-11
|
Publisher: |
CyberLeninka Общество с ограниченной ответственностью "СенСиДат-Контрол" |
Subject: | УПРАВЛЯЕМОЕ СЛУЧАЙНОЕ БЛУЖДАНИЕ | УРАВНЕНИЕ БЕЛЛМАНА | CONTROLLED RANDOM WALK | BELLMAN EQUATION |
Saved in:
Saved in favorites
Similar items by subject
-
A hardware approach to value function iteration
Peri, Alessandro, (2019)
-
Existence and uniqueness of solutions to the Bellman equation in stochastic dynamic programming
Rincón-Zapatero, Juan Pablo, (2022)
-
Optimal capital injections and dividends with tax in a risk model in discrete time
Bata, Katharina, (2020)
- More ...