Мультиагентное обучение с подкреплением

Автор: А.Н. Алфимцев
Год: 2021

Рассмотрены современные и классические алгоритмы одновременного машинного обучения множества агентов, основанные на теории игр, табличных, нейросетевых, эволюционных и роевых технологиях. Представлено последовательное развитие теоретической модели алгоритмов, базирующееся на марковских процессах принятия решений. Реализация алгоритмов выполнена на языке программирования Python с использованием библиотеки глубокого обучения PyTorch. Средой машинного обучения является компьютерная игра StarCraft II с интерфейсом кооперативного мультиагентного обучения SMAC.
Для магистрантов и аспирантов направления подготовки «Информатика и вычислительная техника».

multi_agent_reinforcement_learning.rar