Finalmente, Bard ha incorporado la capacidad de generar imágenes a través de la inteligencia artificial, colocándose así en competencia directa con otros chatbots multimodales. A diferencia de su rival, ChatGPT Plus, que ya contaba con esta función desde hace meses, Bard ahora permite a los usuarios solicitar la generación de fotografías utilizando el modelo de texto a imagen Imagen 2 de Google, impulsado por el extenso modelo de lenguaje Gemini Pro de Google. Aunque se esperaba que el modelo más potente, Gemini Ultra, lo impulsara, este aún se encuentra en desarrollo.
Google ha estado posicionando a Bard como un competidor a la altura de ChatGPT Plus de OpenAI, que utiliza GPT-4 y permite a los usuarios generar imágenes mediante la integración de DALL-E 3. Ambos chatbots han demostrado un buen rendimiento, pero la falta de funciones de conversión de texto a imagen en Bard le daba a ChatGPT Plus cierta ventaja. Sin embargo, ahora las personas pueden utilizar Bard actualizado con Imagen 2 de forma gratuita, a diferencia de ChatGPT Plus, que requiere una suscripción de pago.
Es importante señalar que la generación de imágenes mediante inteligencia artificial ha sido objeto de críticas recientes, especialmente después de la circulación de fotos falsas y sexualmente explícitas de Taylor Swift. Aunque no se sabe qué plataformas se utilizaron para generar esas imágenes, varias empresas tecnológicas han comenzado a restringir el acceso a sus plataformas de generación de imágenes. Google ha asegurado que la capacidad de imagen de Bard ha sido «diseñada teniendo en cuenta la responsabilidad». La compañía incorporará una marca de agua a las fotos generadas, indicando que fueron creadas por IA. También ha implementado medidas técnicas y de seguridad para evitar la generación de imágenes de personas conocidas y para limitar el contenido violento, ofensivo o sexualmente explícito.
La capacidad de generación de imágenes no se limita solo a Bard. Google ha lanzado una nueva herramienta fotográfica experimental impulsada por Imagen 2 llamada ImageFX. ImageFX permite a los usuarios crear imágenes con mensajes de texto simples para experimentar con la inteligencia artificial generativa, y los comentarios se envían directamente a los ingenieros de Google. Al igual que con Bard, todas las fotos generadas a través de ImageFX estarán marcadas por SynthID y seguirán los principios éticos de inteligencia artificial y las barreras técnicas establecidas por Google. Esta nueva herramienta se une a otras herramientas de creación de inteligencia artificial de Google, como MusicFX y TextFX, lanzadas el año pasado y disponibles para pruebas en Google Labs.
Además de la generación de imágenes, Bard también ha experimentado otras expansiones. Aunque, por el momento, la función de generación de imágenes solo está disponible en inglés, el chatbot se ha expandido a más de 40 idiomas en más de 230 países.