Este jueves, Stability AI presentó Stable Diffusion 3, su más reciente modelo avanzado de generación de imágenes. Siguiendo el legado de sus predecesores, este modelo es capaz de producir imágenes detalladas y precisas a partir de instrucciones de texto. Aunque el anuncio fue breve y no se acompañó de una demostración pública, Stability ha abierto una lista de espera para aquellos interesados en probarlo. La familia de modelos Stable Diffusion 3 de Stability varía en tamaño, desde 800 millones hasta 8 mil millones de parámetros, lo que permite su ejecución en una amplia gama de dispositivos, desde teléfonos inteligentes hasta servidores.
Desde 2022, Stability ha lanzado una serie de modelos de IA para generación de imágenes, y Stable Diffusion 3 es el último en la lista. La compañía se ha destacado por ofrecer una alternativa abierta en comparación con otros modelos propietarios, aunque ha enfrentado controversias relacionadas con derechos de autor y sesgos en los datos de entrenamiento.
En cuanto a las mejoras tecnológicas, el CEO de Stability, Emad Mostaque, explicó que Stable Diffusion 3 utiliza una nueva arquitectura de transformador de difusión, que trabaja área por área en la imagen en lugar de utilizar bloques habituales de construcción de imágenes. Esta técnica se inspira en los transformadores, lo que permite una generación más eficiente y de mayor calidad. Además, Stable Diffusion 3 incorpora la tecnología flow matching, que facilita la transición de un ruido aleatorio a una imagen estructurada sin problemas, mejorando la calidad y fluidez de las imágenes generadas.
Aunque no se tiene acceso directo a Stable Diffusion 3, las muestras publicadas en el sitio web de Stability y en redes sociales indican que las creaciones son comparables con otros modelos de generación de imágenes de última generación, incluyendo DALL-E 3 y Adobe Firefly. Stable Diffusion 3 parece manejar bien la generación de imágenes con texto, una mejora notable en comparación con modelos anteriores. La compañía ha anunciado que una vez completadas las pruebas, el modelo estará disponible para descarga y uso gratuito, tras una fase crucial de recopilación de información para mejorar su rendimiento y seguridad.