Executando algumas comparações de raciocínio matemático para o novo @OpenAI gpt-oss em @layerlens_ai . No benchmark AIME 2025, @deepseek_ai R1 tem um desempenho um pouco melhor do que o gpt-oss. No entanto, quando comparado ao @Alibaba_Qwen, o gpt-oss realmente supera
333