Дорошенко, А.Ю.; Ашур, І.З.
(Проблеми програмування, 2021)
Навчання з підкріпленням – галузь машинного навчання, що базується на тому, як програмним агентам слід виконувати дії у середовищі з метою максимізації поняття кумулятивної винагороди. В даній роботі запропоновано нове ...