Off-Policy Reinforcement Learning: Optimal Operational Control for Two-Time-Scale Industrial Processes

Off-Policy Reinforcement Learning: Optimal Operational Control for Two-Time-Scale Industrial Processes | IEEE Journals & Magazine | IEEE Xplore