Čekal jsem, až to půjde na Arxiv, ale cokoli Dario řekne, odpovídá našim benchmarkům na ROSClaw, když testujeme agenty ztělesňující různé roboty. Různé modely mají odlišné behaviorální charakteristiky a obavy z interakce s reálným světem. Velmi zvláštní a zajímavé pozorování