Jeg er nysgjerrig på hvor alles agenter feiler. Demoer deles ikke med mindre de er imponerende, så det er en iboende seleksjonsbias. Problemer oppstår i reell produksjon under belastning. Er det kontekstuell minnehåndtering? Pålitelighet under en lang arbeidsflyt? Del gjerne 🦞