O uso do Trinity, especialmente enquanto gratuito no openrouter, tem sido incrível. Na verdade, conseguimos lidar com 3x mais throughput no nosso cluster de inferência do que estimamos. Mas o nosso TPS despencou à medida que o uso continua a crescer. Mudamos alguns recursos de treinamento para inferência (não é tão simples quanto pensei que seria) e devemos voltar à velocidade total. Dê-nos tudo o que você tem.