Alibaba presenta Wan 2.2, un innovador modelo de generación de video de código abierto que incorpora arquitectura MoE y control cinematográfico, sin incrementar la carga computacional y con capacidades avanzadas en manipulación de contenido visual.

Wan 2.2 ha sido desarrollado con la intención de ofrecer capacidades avanzadas en la creación de contenido visual, permitiendo a los usuarios manipular aspectos como la iluminación, la posición de la cámara, los colores, los movimientos y otros elementos cinematográficos de manera directa y precisa.
Esto brinda una herramienta poderosa tanto para cineastas, creativos digitales y desarrolladores, como para investigadores que buscan explorar nuevas fronteras en la inteligencia artificial.
Supuestamente, esta #innovación en la arquitectura del modelo permite escalar la capacidad del mismo sin afectar el rendimiento en términos de consumo energético o requerimientos de hardware.
La arquitectura MoE, que ya había sido utilizada en otros ámbitos de la inteligencia artificial, ahora se aplica en la generación de video para ofrecer resultados más complejos y realistas, a la vez que mantiene la eficiencia.
La plataforma de #Alibaba ha puesto a disposición de la comunidad tres capacidades principales en su modelo Wan 2.2: Text-to-Video (T2V), Image-to-Video (I2V) y una generación unificada de video (TI2V). Supuestamente, estas funciones permiten convertir textos en videos, imágenes en secuencias visuales y realizar una generación de contenido multimedia de forma integrada, facilitando el trabajo de creadores y desarrolladores.
El modelo Wan 2.2 también destaca por su supuesta superioridad en la generación de movimientos complejos y dinámicas en los videos, algo que anteriormente requería hardware de última generación y procesos largos.
La comunidad tecnológica ha visto en esta innovación una posible democratización del acceso a herramientas avanzadas de creación visual
La comunidad tecnológica ha visto en esta innovación una posible democratización del acceso a herramientas avanzadas de creación visual, que antes estaban reservadas a grandes estudios o empresas con recursos significativos.
Cabe mencionar que esta iniciativa de Alibaba se suma a otros movimientos en el sector tecnológico, donde empresas líderes están abriendo sus modelos y capacidades para promover la innovación colaborativa.
La compañía china, que en los últimos años ha ampliado su presencia en el campo de la inteligencia artificial, parece consolidar su liderazgo con este lanzamiento.
Además de Wan 2.2, Alibaba ha anunciado que próximamente lanzará nuevas versiones y funcionalidades, manteniendo su compromiso de ofrecer #tecnología de vanguardia accesible para todos.
En un contexto donde las capacidades de generación automática de contenido visual están revolucionando industrias enteras, este modelo podría convertirse en una referencia para el desarrollo de nuevas aplicaciones en cine, publicidad, videojuegos y más.
El precio estimado de desarrollo y mantenimiento de modelos similares en Europa y Estados Unidos puede superar los 10 millones de euros, por lo que la disponibilidad de un modelo #open-source representa una oportunidad sin precedentes para investigadores y startups en todo el mundo.