Speedup Training Artificial Intelligence for Mahjong via Reward Variance Reduction

Speedup Training Artificial Intelligence for Mahjong via Reward Variance Reduction | IEEE Conference Publication | IEEE Xplore