"В традиционной разработке программного обеспечения вы планируете версии v1, v2, v3 нового продукта, основываясь на глубине функций или потребностях пользователей. С системами ИИ акцент смещается. Каждая версия определяется тем, сколько автономии имеет система и сколько контроля вы готовы отдать. Начните с определения набора функций, которые имеют высокий контроль и низкую автономию (версия 1 на изображении ниже). Эти функции должны быть небольшими, тестируемыми и легко наблюдаемыми. Отсюда подумайте, как эти возможности могут развиваться со временем, постепенно увеличивая автономию, одну версию за раз. Цель состоит в том, чтобы разбить амбициозное конечное состояние на ранние поведения, которые вы можете оценить, итеративно улучшать и строить на их основе. Например, если ваша конечная цель — автоматизировать поддержку клиентов в вашей компании, высококонтрольный способ начать — это определить v1 (версия 1) как простую маршрутизацию заявок в нужный отдел, затем перейти к v2, где система предлагает возможные решения, и только в v3 разрешить автоматическое разрешение с человеческим резервом. Вот еще несколько примеров: Маркетинговый ассистент v1: Создание черновика электронного письма, рекламы или текста для социальных сетей по подсказкам v2: Создание многоступенчатых кампаний и их запуск v3: Запуск, A/B тестирование и автоматическая оптимизация кампаний по каналам Ассистент по программированию v1: Предложение встроенных завершений и шаблонных фрагментов v2: Генерация больших блоков (например, тестов или рефакторинга) для человеческой проверки v3: Применение ограниченных изменений и открытие запросов на внесение изменений (PR) автономно Если вы следили за тем, как развивались инструменты, такие как GitHub Copilot или Cursor, это именно тот план, который они использовали. Большинство пользователей видят только текущую версию, но основная система постепенно поднималась по этой лестнице. Сначала завершения, затем блоки, затем PR, при этом каждый шаг был достигнут благодаря использованию, обратной связи и итерациям." Больше здесь:
Lenny Rachitsky
Lenny Rachitsky20 авг., 00:21
Вы не можете создавать продукты на основе ИИ так же, как другие продукты. Продукты на основе ИИ по своей природе недетерминированы, и вам нужно постоянно вести переговоры о компромиссе между агентством и контролем. Когда команды не осознают эти различия, их продукты сталкиваются с неожиданными сбоями, они застревают в отладке больших сложных систем, которые не могут отследить, и доверие пользователей к продукту тихо разрушается. После того как они увидели этот паттерн в более чем 50 реализациях ИИ в таких компаниях, как @OpenAI, @Google, @Amazon и @Databricks, Айшвария Нареш Реганти и Кирити Бадам разработали решение: рамки Непрерывной Калибровки/Непрерывного Развития (CC/CD). Название отсылает к Непрерывной Интеграции/Непрерывному Развертыванию (CI/CD), но, в отличие от своего предшественника, оно предназначено для систем, где поведение недетерминировано, и агентство должно быть заслужено. Эта структура показывает, как: - Начать с функций с высоким контролем и низким агентством - Создавать оценочные системы, которые действительно работают - Масштабировать продукты ИИ, не подрывая доверие пользователей Она разработана для того, чтобы признать уникальность систем ИИ и помочь вам создавать более целенаправленные, стабильные и надежные продукты ИИ. Они делятся этим публично в первый раз:
64,1K