Populære emner
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
La oss bygge en nettleserautomatiseringsagent ved hjelp av gpt-oss (100 % lokal):
Nettleseren er fortsatt det mest universelle grensesnittet med 4,3 milliarder sider besøkt hver dag!
Her er en rask demonstrasjon av hvordan vi kan automatisere det fullstendig!
Teknisk stabel:
- @stagehanddev AI-nettleserautomatisering med åpen kildekode
- @crewAIInc for orkestrering
- @ollama å kjøre GPT-OSS
La oss gå!🚀
Oversikt over systemet:
- Brukeren skriver inn en automatiseringsspørring.
- Planner Agent oppretter en automatiseringsplan.
- Browser Automation Agent kjører den ved hjelp av Stagehand-verktøyet.
- Svaragenten genererer et svar.
La oss nå dykke ned i koden!
1️⃣ Definer LLM
Vi bruker tre LLM-er:
- Planner LLM: Oppretter en strukturert plan for en automatiseringsoppgave.
- Automatisering LLM: Utfører planen ved hjelp av Stagehand-verktøyet.
- Respons LLM: Syntetiserer endelig respons.
Sjekk dette ut 👇

2️⃣ Definer Automation Planner Agent
Planleggeragenten mottar en automatiseringsoppgave fra brukeren og oppretter et strukturert oppsett for kjøring av nettleseragenten.
Sjekk dette ut 👇

3️⃣ Definer Stagehand Browser Tool
Et tilpasset CrewAI-verktøy bruker AI for å samhandle med nettsider.
Den utnytter Stagehands agentiske evner for datamaskinbruk til å autonomt navigere i URL-er, utføre sidehandlinger og trekke ut data for å svare på spørsmål.
Sjekk dette ut 👇

4️⃣ Definer nettleserautomatiseringsagent
Browser Automation Agent bruker det nevnte Stagehand-verktøyet for autonom nettleserkontroll og planutførelse.
Sjekk dette ut 👇

5️⃣ Definer responssynteseagent
Synthesis Agent fungerer som endelig kvalitetskontroll, og foredler utdata fra nettleserautomatiseringsagenten for å generere et polert svar.
Sjekk dette ut 👇

6️⃣ Opprett CrewAI Agentic Flow
Til slutt kobler vi agentene våre i en arbeidsflyt ved hjelp av CrewAI Flows.
Sjekk dette 👇

Gjort! La oss se vår arbeidsflyt for automatisering av nettlesere med flere agenter i aksjon! 🚀
Sjekk dette 👇

Du finner all koden og alt du trenger i GitHub Repository som er delt nedenfor.
Sjekk dette ut 👇
For å oppsummere, her er systemoversikten for din referanse:
- Brukeren skriver inn en automatiseringsspørring.
- Planner Agent oppretter en automatiseringsplan.
- Browser Automation Agent kjører den ved hjelp av Stagehand-verktøyet.
- Svaragenten genererer et svar.
Sjekk dette👇
Hvis du syntes det var innsiktsfullt, kan du dele det med nettverket ditt.
Finn meg → @akshay_pachaar ✔️
For mer innsikt og opplæringer om LLM-er, AI-agenter og maskinlæring!

10. aug., 20:51
La oss bygge en nettleserautomatiseringsagent ved hjelp av gpt-oss (100 % lokal):
87,02K
Topp
Rangering
Favoritter