Microsoft presenta sus últimos desarrollos en inteligencia artificial, incluyendo modelos de generación de voz natural y expresiva, y adelanta futuras innovaciones en el campo.

Imagen relacionada de microsoft revela nuevos avances en ia con modelos de voz expresivos y futuros lanzamientos

Mustafa Suleyman, CEO de #Microsoft AI, reveló en una reciente conferencia la llegada del proyecto Copilot Audio Expression Labs, junto con la presentación de dos nuevos modelos de IA: MAI-Voice-1 y MAI-1-Preview.

El modelo MAI-Voice-1 se destaca por su capacidad para generar voz de manera expresiva y natural, permitiendo crear audios que transmiten emociones y matices similares a una conversación humana.

Este avance representa un gran salto en la #tecnología de síntesis de voz, ya que anteriormente los modelos se limitaban a producciones más monótonas y menos humanas.

Supuestamente, este modelo ya está disponible en las plataformas Copilot y Podcasts de Microsoft, permitiendo a los usuarios experimentar con su potencial.

Por otro lado, el modelo MAI-1-Preview se encuentra en fase de pruebas y actualmente se está evaluando en la plataforma LMArena, según informan fuentes cercanas a la compañía.

Aunque todavía en fase experimental, la expectativa es que en el futuro cercano estos modelos puedan integrarse en diversos servicios y productos de Microsoft, potenciando la interacción mediante voz en asistentes virtuales, aplicaciones de entretenimiento y más.

Uno de los aspectos más interesantes es que MAI-Voice-1 puede generar audios de hasta un minuto de duración, lo que abre un amplio abanico de posibilidades para creadores de contenido, desarrolladores y empresas que busquen ofrecer experiencias más humanas y envolventes a sus usuarios.

Esta tecnología marca un avance significativo

En comparación con modelos anteriores, que solían producir fragmentos de audio más cortos y menos expresivos, esta tecnología marca un avance significativo.

Además, Microsoft no es la única empresa en esta carrera por perfeccionar la síntesis de voz. La competencia en el sector tecnológico impulsa constantemente nuevas innovaciones. Supuestamente, OpenAI, otra de las grandes protagonistas en inteligencia artificial, anunció recientemente su modelo GPT-Realtime, que mejora las capacidades de conversión de texto a voz y de habla a habla en tiempo real, con voces como Cedar y Martin, que prometen mayor realismo y versatilidad.

El interés en estos avances no es casual. La historia de la #inteligencia artificial está marcada por hitos que han ido transformando diferentes industrias. Desde los primeros chatbots en los años 60 hasta los asistentes de voz actuales, el progreso ha sido exponencial. La incorporación de modelos expresivos y naturales en la voz artificial puede cambiar radicalmente la forma en que interactuamos con la tecnología en nuestro día a día.

Supuestamente, en los próximos meses se esperan más lanzamientos y mejoras en estos modelos, con Microsoft y otras compañías invirtiendo millones de euros en investigación y desarrollo para mantenerse a la vanguardia.

La integración de estas tecnologías en diversas plataformas podría facilitar desde atención al cliente hasta la creación de contenido multimedia, ofreciendo experiencias más personalizadas y humanas.