Bài viết thú vị về việc huấn luyện trước với RL (rõ ràng là một ý tưởng đang trong quá trình phát triển, nhưng có một số thí nghiệm thực sự)
31,45K