Analysis of Off-Policy Multi-Step TD-Learning with Linear Function Approximation

Analysis of Off-Policy Multi-Step TD-Learning with Linear Function Approximation | IEEE Conference Publication | IEEE Xplore