Value-Iteration Based Fitted Policy Iteration: Learning with a Single Trajectory

Value-Iteration Based Fitted Policy Iteration: Learning with a Single Trajectory | IEEE Conference Publication | IEEE Xplore