Os benchmarks do PinchBench avaliam o desempenho de grandes modelos de linguagem de IA em tarefas de proxy OpenClaw. Os resultados mostram que o Gemini 3 Flash lidera com uma taxa de sucesso de 95,1% no processamento de tarefas OpenClaw, enquanto minimax-m2.1 e kimi-k2.5 ocupam o segundo e terceiro lugar com 93,6% e 93,4%, respectivamente. Claude Sonnet 4,5 é 92,7%, e GPT-4o é 85,2%.