Kan vi kjøre lokale 1T-parametere som Kimi K2.5? 👀 Ja, det kan vi! Her er den: - kjører på 20 tok/s på @exolabs med Apple MLX på mine to Mac Studio M3 Ultra 512GB og bruker ~630GB RAM - @opencode brukt til å lage et slangespill med autoplay - Du kan se modellen som lager spillet og deretter automatisk oepper sluttresultater med ChromeDevTools MCP for å sjekke resultatet. Lokal AI har nådd utrolige nivåer! 🚀