Оптимальные стратегии и оценка полунепрерывного обрывного управляемого марковского процесса

Домашня сторінка
→
Фізико-технічні та математичні науки
→
Відділення інформатики
→
Кибернетика и системный анализ
→
Кибернетика и системный анализ, 2016, том 52
→
Кибернетика и системный анализ, 2016, № 4
→
Переглянути статтю

Оптимальные стратегии и оценка полунепрерывного обрывного управляемого марковского процесса

Інші назви: Оптимальні стратегії та оцінка напівнеперевних обривних керованих марковських процесів
Assessment and optimal policies of semi-continuous killed Markov decision processes

Тема: Системный анализ

УДК: 519.21

URI: http://dspace.nbuv.gov.ua/handle/123456789/142007

Посилання: Оптимальные стратегии и оценка полунепрерывного обрывного управляемого марковского процесса / П.Р. Шпак, Я.И. Елейко // Кибернетика и системный анализ. — 2016. — Т. 52, № 4. — С. 155-160. — Бібліогр.: 5 назв. — рос.

Дата: 2016

Завантажень: 245

Оптимальные стратегии и оценка полунепрерывного обрывного управляемого марковского процесса

Анотація:

Рассмотрены обрывные управляемые марковские процессы с несчетными множествами состояний и управлений на конечном промежутке времени. Приведены определения обрывного управляемого марковского процесса, оценки пути и оптимальной стратегии, а также доказано фундаментальное уравнение в случае, когда множествами состояний и управлений являются измеримые пространства. Предложен метод построения оптимальной стратегии и доказано существование равномерно оптимальной стратегии в случае, когда множествами состояний и управлений есть сепарабельные метрические пространства.

Розглянуто обривні керовані марковські процеси з незліченними множинами станів та керувань на скінченному часовому інтервалі. Наведено означення обривного керованого марковського процесу, оцінки шляху та оптимальної стратегії, а також доведено істинність фундаментального рівняння за умов, коли множини станів та керувань є вимірними просторами. Наведено метод побудови рівномірно оптимальної стратегії у випадку, коли множини станів та керувань являють собою сепарабельні метричні простори.

In the paper, we consider killed Markov decision processes with uncountable sets of states and controls on a finite time interval. Definitions of killed Markov decision process and assessment of the way and optimal policy are given, as well as fundamental equation is proved in the case where the set of states and set of controls are measurable spaces. We also proposed a method to construct the optimal strategy and proved the existence of a uniformly optimal policy in case where the set of states and set of controls are separable metric spaces.

Показати повний запис статті