"I tradisjonell programvareutvikling vil du planlegge for v1, v2, v3 av det nye produktet basert på funksjonsdybde eller brukerbehov. Med AI-systemer skifter linsen. Hver versjon er i stedet definert av hvor mye handlefrihet systemet har og hvor mye kontroll du er villig til å gi fra deg. Start med å identifisere et sett med funksjoner som er høy kontroll og lav handlefrihet (versjon 1 på bildet nedenfor). Disse skal være små, testbare og enkle å observere. Derfra kan du tenke på hvordan disse evnene kan utvikle seg over tid ved gradvis å øke handlefriheten, én versjon om gangen. Målet er å bryte ned en opphøyd slutttilstand til tidlig atferd som du kan evaluere, iterere på og bygge oppover fra. For eksempel, hvis sluttmålet ditt er å automatisere kundestøtte i bedriften din, vil en måte å starte på være å begrense v1 (versjon 1) som ganske enkelt å rute billetter til riktig avdeling, og deretter flytte til v2 der systemet foreslår mulige løsninger, og bare i v3 tillate det å automatisk løse med menneskelig tilbakefall. Her er et par eksempler til: Markedsassistent v1: Utkast til e-post, annonse eller sosial kopi fra spørsmål v2: Bygg flertrinnskampanjer og kjør dem v3: Lansering, A/B-test og automatisk optimalisering av kampanjer på tvers av kanaler Assistent for koding v1: Foreslå innebygde fullføringer og standardtekstsnutter v2: Generer større blokker (som tester eller refaktorer) for menneskelig gjennomgang v3: Bruk omfangsendringer og åpne pull-forespørsler (PR-er) autonomt Hvis du har fulgt hvordan verktøy som GitHub Copilot eller Cursor utviklet seg, er dette akkurat spilleboken de brukte. De fleste brukere ser bare den nåværende versjonen, men det underliggende systemet klatret gradvis opp stigen. Først fullføringer, så blokkeringer, deretter PR-er, med hvert trinn oppnådd gjennom bruk, tilbakemelding og iterasjon.» Mer her:
Lenny Rachitsky
Lenny Rachitsky20. aug., 00:21
Du kan ikke bygge AI-produkter som andre produkter. AI-produkter er iboende ikke-deterministiske, og du må hele tiden forhandle om avveiningen mellom handlekraft og kontroll. Når teamene ikke gjenkjenner disse forskjellene, står produktene deres overfor uventede feil, de blir sittende fast med å feilsøke store kompliserte systemer de ikke kan spore, og brukernes tillit til produktet eroderer stille. Etter å ha sett dette mønsteret utspille seg på tvers av 50+ AI-implementeringer hos selskaper inkludert @OpenAI, @Google, @Amazon og @Databricks, utviklet Aishwarya Naresh Reganti og Kiriti Badam en løsning: rammeverket Continuous Calibration/Continuous Development (CC/CD). Navnet er en referanse til Continuous Integration/Continuous Deployment (CI/CD), men i motsetning til navnebroren er det ment for systemer der atferden er ikke-deterministisk og handlefrihet må fortjenes. Dette rammeverket viser deg hvordan du kan: - Start med funksjoner med høy kontroll og lite byrå - Bygge evalueringssystemer som faktisk fungerer - Skaler AI-produkter uten å bryte brukernes tillit Den er utformet for å gjenkjenne det unike ved AI-systemer og hjelpe deg med å bygge mer tilsiktede, stabile og pålitelige AI-produkter. De deler det offentlig for første gang:
60,73K