「継続的な学習」を問題として言及する人は、通常、サンプル効率について話しているだけです。 明らかに、軌跡をモデルに継続的にトレーニングすることで「継続的に学習」する必要があります。 これは、サンプル効率が低いと機能しないという疑問はありません。
77.71K