The <formula formulatype="inline"><tex>$n$</tex></formula>th-Order Bias Optimality for Multichain Markov Decision Processes

The -th-Order Bias Optimality for Multichain Markov Decision Processes | IEEE Journals & Magazine | IEEE Xplore