谷歌首席科學家杰夫·迪恩: 我們接近於讓系統在某些領域實現自主突破。 它的工作原理是,完全自動化的循環可以生成想法,測試這些想法,並在廣泛的搜索空間中快速獲得反饋。 “明確的獎勵和快速的反饋使得強化學習有效。” 在接下來的5到20年裡,這可能會加速科學和工程的發展。
40.46K