Qualitative Adaptive Reward Learning With Success Failure Maps: Applied to Humanoid Robot Walking

Qualitative Adaptive Reward Learning With Success Failure Maps: Applied to Humanoid Robot Walking | IEEE Journals & Magazine | IEEE Xplore