У нашому останньому епізоді партнерського подкасту @BenAtBox, технічний директор Box, поспілкувався з @ankrgyl, генеральним директором @braintrust, щоб обговорити, як організації можуть ефективно оцінювати, тестувати та впроваджувати агентів ШІ у великому масштабі. Часові мітки 00:39 Анкур Гоял ділиться своєю подорожжю від обробки документів на основі штучного інтелекту до Braintrust 03:01 Визначення оцінок і як вони працюють у штучному інтелекті 07:03 Недетермінізм і складність у прийнятті рішень агентами ШІ 15:12 Поради щодо роботи з недетермінізмом при роботі з фінансовими даними в ШІ 17:40 Використання кількох шляхів для валідації та важливість перехресної перевірки результатів 22:12 Критична роль контексту в оцінці точності результатів ШІ 26:03 Внутрішні оцінки як наріжний камінь надійної розробки продукту на основі штучного інтелекту 32:16 Сприяння прозорості в оцінці ШІ за допомогою постачальників 34:45 Поради для підприємств, як уникнути збоїв при впровадженні агентних можливостей