La compañía china Alibaba lanza Qwen-TTS, un innovador sistema de texto a voz bilingüe que ofrece voces naturales y expresivas en varios dialectos chinos y voces en inglés, marcando un paso importante en la inteligencia artificial de síntesis de voz.

Imagen relacionada de alibaba presenta un avanzado modelo de voz ai que revoluciona la tecnologia multilingue

Este sistema, que ha sido desarrollado por su división de #inteligencia artificial Qwen, promete transformar la forma en que las máquinas generan audio hablado, ofreciendo resultados que se asemejan sorprendentemente a la voz humana.

Supuestamente, #Qwen-TTS ha sido entrenado con millones de horas de grabaciones de voz, lo que le permite producir audios ultra naturales y llenos de expresividad.

La compañía asegura que el sistema no solo capta la entonación y el ritmo de la voz humana, sino que también puede expresar emociones y ajustar la prosodia de manera inteligente, logrando una comunicación más cercana a la interacción humana real.

Este modelo de síntesis de voz se encuentra actualmente disponible a través de la API de Qwen, permitiendo a desarrolladores y empresas integrar voces personalizadas en sus aplicaciones.

El sistema soporta siete voces bilingües, incluyendo nombres como Cherry, Ethan, Chelsie, Serena, Dylan, Jada y Sunny, y cuenta con soporte para tres dialectos chinos: Beijing, Shanghai y Sichuan.

La inclusión de múltiples dialectos refleja la intención de #Alibaba de atender a un mercado chino diverso y en constante crecimiento.

A nivel internacional, la inversión en inteligencia artificial continúa en aumento. Según un informe de Nasscom, una organización india de tecnología, el 88% de las empresas globales ya disponen de presupuestos específicos destinados a la IA, y la tendencia se orienta cada vez más hacia la creación de agentes inteligentes que puedan asistir en tareas complejas y mejorar la experiencia del usuario.

El lanzamiento de Qwen-TTS forma parte de una estrategia más amplia de Alibaba para posicionarse como líder en #innovación tecnológica en Asia y el mundo

Supuestamente, el lanzamiento de Qwen-TTS forma parte de una estrategia más amplia de Alibaba para posicionarse como líder en innovación tecnológica en Asia y el mundo.

La compañía supuestamente busca competir con gigantes como Google, Amazon y Microsoft, que también han desarrollado sistemas avanzados de síntesis de voz y asistentes virtuales.

En la historia de la tecnología, la síntesis de voz ha evolucionado desde los primeros sistemas mecánicos hasta las modernas soluciones basadas en inteligencia artificial.

Los primeros intentos en la década de 1960, como el famoso sistema IBM Shoebox, tenían capacidades limitadas y voces robóticas. En las últimas dos décadas, el desarrollo de redes neuronales y el aprendizaje profundo ha permitido obtener voces cada vez más naturales y expresivas, como las que ahora presenta Alibaba con Qwen-TTS.

Supuestamente, las aplicaciones de este tipo de #tecnología son vastas, abarcando desde asistentes virtuales en dispositivos móviles y sistemas de navegación, hasta soluciones de accesibilidad para personas con discapacidades auditivas o del habla.

La integración de voces naturales en chatbots y plataformas de atención al cliente también se ha convertido en una tendencia en auge.

Con la llegada de Qwen-TTS, Alibaba demuestra su compromiso con la innovación en inteligencia artificial y abre un camino prometedor para la creación de voces más humanas y versátiles.

Se espera que en los próximos meses, este sistema sea adoptado por numerosas empresas en todo el mundo, impulsando aún más la revolución en la interacción entre humanos y máquinas.