La oss bygge en nettleserautomatiseringsagent ved hjelp av gpt-oss (100 % lokal):
Nettleseren er fortsatt det mest universelle grensesnittet med 4,3 milliarder sider besøkt hver dag! Her er en rask demonstrasjon av hvordan vi kan automatisere det fullstendig! Teknisk stabel: - @stagehanddev AI-nettleserautomatisering med åpen kildekode - @crewAIInc for orkestrering - @ollama å kjøre GPT-OSS La oss gå!🚀
Oversikt over systemet: - Brukeren skriver inn en automatiseringsspørring. - Planner Agent oppretter en automatiseringsplan. - Browser Automation Agent kjører den ved hjelp av Stagehand-verktøyet. - Svaragenten genererer et svar. La oss nå dykke ned i koden!
1️⃣ Definer LLM Vi bruker tre LLM-er: - Planner LLM: Oppretter en strukturert plan for en automatiseringsoppgave. - Automatisering LLM: Utfører planen ved hjelp av Stagehand-verktøyet. - Respons LLM: Syntetiserer endelig respons. Sjekk dette ut 👇
2️⃣ Definer Automation Planner Agent Planleggeragenten mottar en automatiseringsoppgave fra brukeren og oppretter et strukturert oppsett for kjøring av nettleseragenten. Sjekk dette ut 👇
3️⃣ Definer Stagehand Browser Tool Et tilpasset CrewAI-verktøy bruker AI for å samhandle med nettsider. Den utnytter Stagehands agentiske evner for datamaskinbruk til å autonomt navigere i URL-er, utføre sidehandlinger og trekke ut data for å svare på spørsmål. Sjekk dette ut 👇
4️⃣ Definer nettleserautomatiseringsagent Browser Automation Agent bruker det nevnte Stagehand-verktøyet for autonom nettleserkontroll og planutførelse. Sjekk dette ut 👇
5️⃣ Definer responssynteseagent Synthesis Agent fungerer som endelig kvalitetskontroll, og foredler utdata fra nettleserautomatiseringsagenten for å generere et polert svar. Sjekk dette ut 👇
6️⃣ Opprett CrewAI Agentic Flow Til slutt kobler vi agentene våre i en arbeidsflyt ved hjelp av CrewAI Flows. Sjekk dette 👇
Gjort! La oss se vår arbeidsflyt for automatisering av nettlesere med flere agenter i aksjon! 🚀 Sjekk dette 👇
Du finner all koden og alt du trenger i GitHub Repository som er delt nedenfor. Sjekk dette ut 👇
For å oppsummere, her er systemoversikten for din referanse: - Brukeren skriver inn en automatiseringsspørring. - Planner Agent oppretter en automatiseringsplan. - Browser Automation Agent kjører den ved hjelp av Stagehand-verktøyet. - Svaragenten genererer et svar. Sjekk dette👇
Hvis du syntes det var innsiktsfullt, kan du dele det med nettverket ditt. Finn meg → @akshay_pachaar ✔️ For mer innsikt og opplæringer om LLM-er, AI-agenter og maskinlæring!
Akshay 🚀
Akshay 🚀10. aug., 20:51
La oss bygge en nettleserautomatiseringsagent ved hjelp av gpt-oss (100 % lokal):
87,02K