La voz es la modalidad original. ¡Estoy muy emocionado por las entradas de imagen, la llamada a funciones y el soporte de MCP en la API en tiempo real GA! `gpt-realtime` es mucho más natural y expresivo, y cada vez que se lanza un modelo de voz SOTA, ya sabes lo que tengo que hacer... ¡Aquí está la nueva voz Marin, en KaraokeBench! de nuevo me da 3 de 7.
OpenAI
OpenAI29 ago, 00:55
Presentamos gpt-realtime: nuestro mejor modelo de voz a voz para desarrolladores, y actualizaciones de la API Realtime.
44K