Investigadores del proyecto SANA presentaron un modelo de generación de video por inteligencia artificial denominado WM que se distingue por combinar una calidad aceptable con un tamaño relativamente reducido. Con 2.600 millones de parámetros, el modelo es capaz de producir clips de hasta un minuto en resolución 720p a partir de descripciones en lenguaje natural.

El enfoque del proyecto es explícitamente orientado a la eficiencia: mientras que los grandes laboratorios como OpenAI, Google y Runway invierten miles de millones de dólares en clusters de GPUs para entrenar modelos de video, SANA-WM demuestra que es posible obtener resultados útiles con hardware más modesto y un consumo de energía significativamente menor.

El modelo se publica bajo licencia de código abierto, lo que permite a cualquier desarrollador utilizarla, modificarla y desplegarla en entornos propios. Los investigadores advierten que, debido a su tamaño reducido, el modelo no alcanza la fidelidad y coherencia de soluciones comerciales como Sora o Veo, pero resulta práctico para aplicaciones donde el costo y la velocidad son prioritarios frente a la máxima calidad.