Successive Convex Approximation Based Off-Policy Optimization for Constrained Reinforcement Learning

Successive Convex Approximation Based Off-Policy Optimization for Constrained Reinforcement Learning | IEEE Journals & Magazine | IEEE Xplore