los LLM de próxima generación son realmente vulnerables al espionaje corporativo. Las funciones de recompensa que funcionan, especialmente las que ayudan a converger más rápido, caben en un solo archivo de Python. La idea se puede decir en una conversación en una cafetería. Este no fue el caso en el régimen previo al tren
7.5K