A convergent actor-critic-based FRL algorithm with application to power management of wireless transmitters

A convergent actor-critic-based FRL algorithm with application to power management of wireless transmitters | IEEE Journals & Magazine | IEEE Xplore