La compañía OpenAI presenta su innovador modelo de voz en tiempo real, GPT-Realtime, que promete transformar la interacción con asistentes virtuales y agentes de voz, incorporando nuevas funciones avanzadas y voces expresivas.

Este avance representa una evolución importante en la creación de agentes de voz más naturales y expresivos, capaces de comprender instrucciones complejas y responder con una naturalidad que antes parecía inalcanzable.
Supuestamente, GPT-Realtime cuenta con capacidades mejoradas que permiten a los desarrolladores integrar en sus aplicaciones funciones como la llamada telefónica mediante el Protocolo de Inicio de Sesión (SIP), entrada de imágenes y soporte para servidores MCP remotos.
Estas innovaciones amplían considerablemente las posibilidades de los asistentes de voz, permitiendo que sean más útiles en diversos contextos, desde atención al cliente hasta asistentes personales en dispositivos inteligentes.
Este nuevo modelo no solo responde a instrucciones complejas, sino que también produce un discurso natural y expresivo, lo que supone un gran avance en la interacción humano-máquina.
Además, #OpenAI ha presentado dos nuevas voces llamadas Cedar y Martin para su #API en tiempo real, diseñadas para ofrecer una experiencia auditiva más variada y realista.
Supuestamente, la compañía también ha actualizado la Realtime API, que ahora soporta la integración de servidores remotos, entrada de imágenes y llamadas telefónicas mediante SIP, facilitando así la creación de agentes que puedan comunicarse de forma más efectiva en múltiples entornos.
Esto es especialmente relevante en un momento en que la demanda de asistentes de voz más inteligentes y adaptables continúa creciendo en todo el mundo.
Interesantemente, la introducción de GPT-Realtime se produce en un contexto donde otras grandes empresas tecnológicas también están invirtiendo en mejorar sus sistemas de interacción por voz.
Y la #innovación constante es clave para mantenerse a la vanguardia
La competencia en este sector es fuerte, y la innovación constante es clave para mantenerse a la vanguardia.
Supuestamente, OpenAI también ha anunciado que estas capacidades se ofrecerán inicialmente a desarrolladores y empresas que utilicen su plataforma, con planes de ampliar el acceso en el futuro.
La implementación de esta #tecnología puede tener un impacto considerable en sectores como la atención al cliente, la automatización de tareas y la creación de asistentes personales más humanos y eficientes.
Este avance en la tecnología de voz en tiempo real, que presuntamente tiene un coste que podría oscilar en torno a los 200 euros mensuales para empresas, refuerza la posición de OpenAI como líder en innovación en inteligencia artificial.
La compañía, fundada en 2015, ha sido pionera en desarrollar modelos que no solo entienden el lenguaje, sino que también lo generan de manera natural, lo que ha cambiado la forma en que interactuamos con las máquinas.