tout le monde qui mentionne « apprentissage continu » comme un problème parle généralement simplement d'efficacité d'échantillonnage. clairement, vous devriez « apprendre continuellement » en entraînant continuellement des trajectoires dans le modèle ! il n'y a pas de mystère : cela ne fonctionne tout simplement pas avec une faible efficacité d'échantillonnage.
77,72K