🚀 Testowaliśmy nowego gpt-realtime od @openai – oto nasze początkowe wnioski: Ogólnie rzecz biorąc, to ogromny krok naprzód w zakresie przestrzegania instrukcji - największy problem modeli Open AI w czasie rzeczywistym do tej pory. Co jeszcze zwraca naszą uwagę: --> Lepsza precyzja wywoływania funkcji --> Ulepszona zdolność rozumienia z wykrywaniem sygnałów niewerbalnych --> Płynne przełączanie języków w trakcie rozmowy: IMO największa wygrana – wiele architektur głosowych ma z tym największe problemy z powodu większej latencji po stronie TTS – latencja poniżej 500 ms od początku do końca jest tutaj imponująca. --> I: wsparcie SIP (telefony)! I dodaliśmy to do naszych benchmarków! 𝗯𝗲𝗻𝗰𝗵𝗺𝗮𝗿𝗸𝘀 . 𝗰𝗼𝘃𝗮𝗹 . 𝗮𝗶 Benchmarki dotyczące przestrzegania instrukcji wkrótce! Wskazówka: Open AI realtime może być używane do TTS, STT lub przejmowania głosu, a także można je łączyć z innymi modelami. Nie mogę się doczekać, jak to zmieni agentów głosowych w środowiskach produkcyjnych!
14,44K