Hace apenas un año, los vídeos generados por inteligencia artificial a partir de texto eran poco más que borrones en movimiento, una especie de visión prehistórica del potencial que podían alcanzar. Sin embargo, Google ha dado un salto gigantesco hacia el presente con el lanzamiento de Lumiere, una innovadora inteligencia artificial generativa de vídeo.
¿Cómo funciona Lumiere?
La magia de Lumiere reside en su capacidad para inventar vídeos a partir de diversas entradas. La opción más básica es utilizar un simple texto como “un oso con una chaqueta verde montando en bici sobre el acueducto de Segovia”. Sin embargo, Lumiere no se limita a las palabras; puede transformar un dibujo o una foto en un fascinante vídeo animado.
Puede, también animar sólo una porción de una imagen. Imagina tener una foto de una acampada al aire libre con una hoguera; Lumiere puede dar vida sólo al fuego, añadiendo movimiento y realismo a la escena estática.
Además, Lumiere es capaz de crear imágenes en movimiento utilizando el estilo de dibujo de una imagen. Esto significa que puede tomar una imagen y generar un vídeo manteniendo la estética visual de la imagen original. Una revolución en sí misma para la creatividad visual.
La tecnología detrás de Lumiere
Google Research, en su blog, desvela el secreto detrás de esta hazaña tecnológica: la arquitectura Space-Time U-Net. Este enfoque único permite a Lumiere generar todo el metraje de un vídeo de una sola vez, a través de una única pasada en el modelo.
A diferencia de los modelos de vídeo existentes, que sintetizan fotogramas clave distantes entre sí y aplican una superresolución temporal, Lumiere utiliza un enfoque más integral. Con desplazamiento y muestreo tanto espaciales como temporales, y aprovechando un modelo de difusión preentrenado de texto a imagen, Lumiere aprende a generar directamente vídeos de baja resolución a una velocidad de cuadro completa.
El futuro de la creación de contenido visual
Con Lumiere, Google ha superado los límites de la generación de vídeos a partir de texto, allanando el camino para una variedad de aplicaciones en la creación de contenido visual. Desde la transformación de imágenes estáticas en vídeos dinámicos hasta la animación selectiva de elementos en una escena, Lumiere se posiciona como una herramienta versátil para tareas como image-to-video, video inpainting y generación estilizada.
En definitiva, Lumiere no solo es una nueva herramienta en el arsenal de la inteligencia artificial de Google; es una puerta abierta a un mundo de posibilidades creativas que hace apenas un año parecían inalcanzables. La era de los vídeos generados por IA ha llegado, y Lumiere es su estandarte.
¡Bienvenidos al futuro de la creación visual!