🚀 Мы протестировали новый gpt-realtime от @openai на ранней стадии – вот наши первые выводы: В целом, это большой шаг вперед в плане следования инструкциям – самая большая проблема моделей Open AI в реальном времени на сегодняшний день. Что еще выделяется для нас: --> Лучшая точность вызова функций --> Улучшенное понимание с обнаружением невербальных сигналов --> Бесшовное переключение языков в середине разговора: на мой взгляд, это самая большая победа – многие голосовые архитектуры сталкиваются с этой проблемой из-за большей задержки на стороне TTS – впечатляющая задержка менее 500 мс от начала до конца. --> И: поддержка SIP (телефонии)! И мы добавили это в наши бенчмарки! 𝗯𝗲𝗻𝗰𝗵𝗺𝗮𝗿𝗸𝘀 . 𝗰𝗼𝘃𝗮𝗹 . 𝗮𝗶 Бенчмарки по следованию инструкциям скоро будут! Совет: Open AI realtime можно использовать для TTS, STT или смены очередности, и вы можете сочетать его с другими моделями. Не могу дождаться, чтобы увидеть, как это преобразит голосовых агентов в производственных средах!
14,44K