Agosto, 2025.- Google DeepMind ha revelado Genie 3, su modelo más avanzado hasta la fecha para generar entornos virtuales 3D interactivos en tiempo real a partir de simples descripciones en texto o imágenes estáticas. Este avance representa un paso clave hacia el desarrollo de una inteligencia artificial general, capaz de entender y simular el mundo como lo haría un ser humano.
A diferencia de los modelos generativos tradicionales, Genie 3 comprende relaciones causales y físicas dentro de los entornos que genera. Esto significa que puede anticipar comportamientos realistas, como el rebote de una pelota o el desplazamiento natural de objetos, acercándose al razonamiento físico humano.
Genie 3 permite explorar mundos virtuales durante varios minutos, muy por encima del límite de 10 a 20 segundos de su versión anterior, Genie 2. Además, genera entornos en resolución 720p a 24 fotogramas por segundo, con capacidad para modificar condiciones como el clima o añadir personajes mediante comandos simples.
El modelo es capaz de mantener la coherencia física durante aproximadamente un minuto. Esto permite, por ejemplo, que los elementos del entorno permanezcan en su sitio incluso si el usuario se aleja y regresa más tarde, algo inédito en simulaciones generadas por IA.
Para lograr esta interactividad, Genie 3 ejecuta cálculos constantes y complejos, reconstruyendo el entorno fotograma a fotograma a partir de datos previos. Esta arquitectura lo convierte en una herramienta poderosa no solo para la generación creativa, sino también para entrenar agentes de IA más autónomos y adaptables.
Aunque aún no puede simular entornos reales con coherencia prolongada, Google considera que Genie 3 es una pieza fundamental para el futuro del aprendizaje por simulación. En su fase actual, Genie 3 se encuentra en beta privada, disponible exclusivamente para académicos, investigadores y creadores seleccionados.


El objetivo es recopilar retroalimentación, mejorar su rendimiento y anticipar posibles riesgos antes de un despliegue más amplio. Con Genie 3, Google DeepMind reafirma su liderazgo en el desarrollo de modelos de IA que integran visión, lenguaje, física y acción en un solo sistema.











Discussion about this post