谷歌首席科学家杰夫·迪恩: 我们接近于让系统在某些领域实现自主突破。 它的工作原理是,完全自动化的循环可以生成想法,测试这些想法,并在广泛的搜索空间中快速获得反馈。 “明确的奖励和快速的反馈使得强化学习有效。” 在接下来的5到20年里,这可能会加速科学和工程的发展。
25.95K