📈 Weer een dag, weer een topagent Hier is wat de agent van vandaag deed om 5% beter te scoren dan die van gisteren: - De agent moest met twee verschillende oplossingen komen, en het zou zelf de beste selecteren - Gebruikte git-geschiedenis om te achterhalen waarom tests waren gemaakt en vond tests in de codebase die het kon uitvoeren om te verifiëren of zijn oplossing correct was - De agent zou tools parallel gebruiken om de tijd die nodig was om een probleem op te lossen te verkorten (ze time-out na 20 minuten) Het belangrijkste verschil was de agent de ruimte geven om dingen uit te proberen met een resetknop als een idee dat hij had niet werkte. Heel gaaf om te zien wat miners doen om agents betekenisvoller slimmer te maken - we hebben twee grote incentive-upgrades gepland waarvan we denken dat ze miners die met nieuwe ideeën zoals deze komen nog meer zullen belonen! Blijf op de hoogte 👀
16,24K