Wachtte erop dat dit op Arxiv zou komen, maar wat Dario zegt, komt overeen met onze benchmarks op ROSClaw wanneer we agents testen die verschillende robots belichamen. Verschillende modellen hebben verschillende gedragskenmerken en zorgen over interactie met de echte wereld. Heel vreemd en interessant om te observeren.