La carrera por dominar la inteligencia artificial generativa acaba de entrar en una nueva etapa. Durante su mas reciente anuncio, Google presento Gemini Omni Flash, un modelo disenado para crear y editar video con solo hablarle al sistema.
La novedad marca un cambio importante dentro de la familia Gemini. Hasta ahora, muchas herramientas de inteligencia artificial se enfocaban en producir texto o imagenes aisladas. Omni Flash intenta reunificar ambas capacidades en un solo sistema conversacional.
La apuesta de Google apunta a convertir la IA en una herramienta de produccion creativa mucho mas cercana a una conversacion natural. En lugar de usar programas complejos de edicion, la idea es que cualquier persona pueda pedir cambios en un video como si hablara con un editor.
Por ejemplo, el modelo puede tomar un clip grabado desde un celular y transformar el entorno, agregar objetos, modificar movimientos o cambiar el estilo visual sin necesidad de conocimientos tecnicos previos.
Lo que diferencia a Gemini Omni Flash de otros modelos es que fue disenado para trabajar de forma multimodal desde el inicio. Eso significa que entiende distintos tipos de contenido al mismo tiempo y puede mantener consistencia entre escenas y personajes.
Segun Google, el modelo puede recibir imagenes, texto, clips de video y referencias de audio para producir una nueva pieza audiovisual. Incluso puede mantener coherencia entre escenas sin necesidad de que el usuario defina cada parametro.
El Chasqui
Comentarios (0)
Sé el primero en comentar.