Utilizarea de către Trinity, mai ales când este gratuită pe openrouter, a fost incredibilă. De fapt, am reușit să gestionăm de 3 ori mai mult debit pe clusterul nostru de inferențe decât am estimat. Dar TPS-ul nostru a scăzut pe măsură ce utilizarea continuă să crească. Am mutat o parte din calculul de antrenament în inferență (nu atât de simplu pe cât credeam) și ar trebui să revenim la viteză maximă. Dă-ne tot ce ai.