Policy Return: A New Method for Reducing the Number of Experimental Trials in Deep Reinforcement Learning

Policy Return: A New Method for Reducing the Number of Experimental Trials in Deep Reinforcement Learning | IEEE Journals & Magazine | IEEE Xplore