Apenas um lembrete de que na verdade não sabemos muito sobre o alinhamento prático de agentes. AIs individuais são difíceis o suficiente, mas os agentes captam contexto uns dos outros, de prompts potencialmente hostis, do ambiente, de longas execuções autônomas, muitos têm pesos abertos, etc.
Alexander Long
Alexander Long7/03, 04:49
sequência insana de declarações enterradas em um relatório técnico da Alibaba
Para ser claro, também não sabemos muito sobre o alinhamento mais profundo das AIs.
119