Potential-based online policy iteration algorithms for Markov decision processes

Potential-based online policy iteration algorithms for Markov decision processes | IEEE Journals & Magazine | IEEE Xplore