có vẻ như vài năm tới trong phát triển AI sẽ chủ yếu là RL với các hàm thưởng LLM-as-a-judge. thời kỳ kỳ lạ mà chúng ta đang sống tôi có thể học thêm về mô hình này ở đâu? những blog và tài liệu nào là liên quan nhất?
135,76K