le 5 décembre 2016, John Schulman et Pieter Abbeel ont animé un excellent tutoriel lors de la @NeurIPSConf sur le RL profond avec les frontières de l'époque. après environ 9 ans, c'est toujours pertinent par rapport à notre situation actuelle avec le RL pour les modèles de base avec peu de modifications ! @johnschulman2 @pabbeel
5,31K