no dia 5 de dezembro de 2016, John Schulman e Pieter Abbeel realizaram um ótimo tutorial na @NeurIPSConf sobre RL profundo com as fronteiras da época. depois de cerca de 9 anos, ainda está exatamente onde estamos com RL para modelos fundamentais com poucas modificações! @johnschulman2 @pabbeel
5,73K