提到「持續學習」作為問題的每個人,通常只是談論樣本效率。 顯然,你應該通過不斷將軌跡訓練回模型來「持續學習」! 這並不神秘:這在低樣本效率下根本行不通。
77.74K