关于预训练与强化学习的有趣帖子(显然这是一个非常初步的想法,但有一些真实的实验)
31.43K