A Red Team da AISI do Reino Unido testou tanto os modelos da OpenAI quanto os da Anthropic lançados hoje! Conseguimos contornar o GPT-5.3-Codex (e o monitor de conversas) em 10 horas e realizamos uma auditoria de alinhamento no Opus 4.6. 🧵