vào ngày 5 tháng 12 năm 2016, John Schulman và Pieter Abbeel đã tổ chức một buổi hướng dẫn tuyệt vời tại @NeurIPSConf về RL sâu với những ranh giới của thời điểm đó. sau khoảng 9 năm, nó vẫn chính xác về vị trí mà chúng ta đang có với RL cho các mô hình nền tảng với một số sửa đổi nhỏ! @johnschulman2 @pabbeel
5,72K