CIPPO: Contrastive Imitation Proximal Policy Optimization for Recommendation Based on Reinforcement Learning

CIPPO: Contrastive Imitation Proximal Policy Optimization for Recommendation Based on Reinforcement Learning | IEEE Journals & Magazine | IEEE Xplore