Speaker
Дмитрий Журавлёв
(МФТИ)
Description
В работе решается задача гибкого планирования в облачном производстве с учетом затрат на логистику. Для этого разрабатывается модель обучения с подкреплением на основе алгоритма Q-lerning. Результат работы алгоритма сравнивается с точным решением, жадным решением и решением на основе GNN. Дополнительно исследуется вероятностное пространство возможных решений.
Primary authors
Vitaly Pozdnyakov
(AIRI)
Дмитрий Журавлёв
(МФТИ)