La voz es la modalidad OG. ¡Estoy muy emocionado por las entradas de imágenes, la llamada a funciones y el soporte de MCP en la API en tiempo real GA! 'gpt-realtime' es mucho más natural y expresivo, y cada vez que se lanza un modelo de voz SOTA, sabes lo que tengo que hacer... ¡Aquí está la nueva voz Marin, en KaraokeBench! puntuaciones 3 de 7 de nuevo de mi parte
OpenAI
OpenAIhace 16 horas
Presentamos gpt-realtime, nuestro mejor modelo de conversión de voz a voz para desarrolladores y actualizaciones de la API de Realtime
28.65K