🚀 Wir haben @openai's neues gpt-realtime frühzeitig getestet – unsere ersten Erkenntnisse: Insgesamt ein großer Fortschritt in Bezug auf die Befolgung von Anweisungen – der größte Schmerzpunkt der Open AI Realtime-Modelle bis heute. Was uns sonst noch auffällt: --> Bessere Präzision beim Funktionsaufruf --> Verbesserte Verständlichkeit mit der Erkennung nonverbaler Hinweise --> Nahtloser Sprachwechsel mitten im Gespräch: IMO der größte Gewinn – viele Spracharchitekturen haben damit die größten Schwierigkeiten aufgrund der höheren Latenz auf der TTS-Seite – die unter 500 ms End-to-End-Latenz ist hier beeindruckend. --> UND: SIP (Telekommunikation) Unterstützung! UND wir haben es in unsere Benchmarks aufgenommen! 𝗯𝗲𝗻𝗰𝗵𝗺𝗮𝗿𝗸𝘀 . 𝗰𝗼𝘃𝗮𝗹 . 𝗮𝗶 Bald kommen Benchmarks zur Befolgung von Anweisungen! Tipp: Open AI Realtime kann für TTS, STT oder Turn-Taking verwendet werden, und Sie können es mit anderen Modellen kombinieren. Ich kann es kaum erwarten zu sehen, wie dies Sprachagenten in Produktionsumgebungen transformiert!
14,44K