Ich habe darauf gewartet, dass dies auf Arxiv veröffentlicht wird, aber was auch immer Dario sagt, entspricht unseren Benchmarks auf ROSClaw, wenn wir Agenten testen, die verschiedene Roboter verkörpern. Verschiedene Modelle haben unterschiedliche Verhaltensmerkmale und Bedenken hinsichtlich der Interaktion mit der realen Welt. Es ist sehr seltsam und interessant zu beobachten.