Noen notater om gpt-sanntidsutgivelsen den erstatter kjedede STT→LLM→TTS med en enkelt tale-inn/tale-ut-modell (lavere ventetid, rikere nyanse) - enorm imo 🔥 På benchmarks (vs GPT4o-sanntid): > scorer 82.8% mot 65.6% på BigBench (resonnement) > 30.5 % mot 20.6 % på MultiChallenge Audio (instruksjon følger) > 66,5 % mot 49,7 % på ComplexFuncBench (funksjonsanrop) Gevinster inkluderer forbedret prosodi, tonekontroll, ikke-verbal og alfanumerisk nøyaktighet og flerspråklig veksling Sanntids-API nå GA med SIP-telefon, bildeinngang, MCP-verktøyintegrasjon alt dette med 20 % lavere API - ganske søtt (selv om jeg synes det fortsatt er litt for dyrt)
13,46K