OpenAI lanza modelos de audio en tiempo real para traducción y agentes de voz

OpenAI presentó tres nuevos modelos de audio para su API, con foco en traducción simultánea y agentes de voz capaces de razonar, conservar contexto y ejecutar acciones en sistemas externos. La demostración apunta a una apuesta más ambiciosa: convertir la voz en una interfaz principal para productos empresariales, soporte, educación y herramientas de productividad. *** OpenAI mostró GPT Realtime Translate, un modelo que traduce voz en vivo y admite 70 idiomas. La empresa también presentó GPT Realtime 2, orientado a agentes de voz con razonamiento y uso de herramientas. Durante la demo, el asistente consultó un calendario, permaneció atento en...

Leer el artículo completo

Este artículo proviene de Diario Bitcoin. Haz clic abajo para leer la historia completa:

Leer Artículo Completo