Adaptive Optimal Control via <i>Q</i>-Learning for Multi-Agent Pursuit-Evasion Games

Adaptive Optimal Control via Q-Learning for Multi-Agent Pursuit-Evasion Games | IEEE Journals & Magazine | IEEE Xplore