RL é tão genericamente aplicável que poderia marcar a forma final do progresso da IA, na medida em que faremos RL para o que mais precisarmos
6,44K