En la actualidad, la competencia por la supremacía en inteligencia artificial es intensa en la industria tecnológica. Hace poco, OpenAI (los creadores de ChatGPT) sorprendieron con Sora, una IA capaz de generar videos impresionantes. En respuesta, Microsoft ha presentado VASA-1, una inteligencia artificial que puede dotar de voz y movimiento a imágenes estáticas, incluso permitiendo que canten.
El principal riesgo asociado a estas IA es su potencial para crear Deep Fakes, videos manipulados que pueden difundir desinformación al hacer que figuras públicas digan cosas que nunca dijeron. Estos pueden utilizarse para propagar engaños y estafas, aprovechándose de la credibilidad de celebridades.
VASA-1, desarrollado por Microsoft, es una herramienta basada en inteligencia artificial que permite animar cualquier imagen, otorgándole movimiento, habla e incluso habilidades musicales. Destaca por su alto grado de realismo, lo que lo convierte en una solución prometedora.
El enfoque principal de VASA-1 es mejorar la accesibilidad para personas con dificultades de comunicación, brindándoles compañía y apoyo terapéutico cuando lo necesiten. Su objetivo es ofrecer una experiencia más interactiva y satisfactoria para estos usuarios.
Esta tecnología permite generar imágenes de rostros que hablan de manera realista en tiempo real, utilizando solo una fotografía del sujeto. Además de agregar voz, ofrece la posibilidad de modificar expresiones faciales, como la sonrisa o el gesto de la boca, para lograr un resultado más auténtico.
Microsoft destaca la naturaleza realista y dinámica de los videos generados con esta herramienta. No se limita a sincronizar los labios con el audio, sino que también añade emociones, expresiones faciales y movimientos a la cabeza, mejorando aún más la veracidad de las imágenes.
Esta IA no solo funciona con fotografías de personas, sino que también puede aplicarse a otros tipos de imágenes, como dibujos o arte digital. Es capaz de agregar voz y movimientos realistas a estos elementos visuales, incluso permitiendo que canten. Sin embargo, Microsoft ha anunciado que esta tecnología no estará disponible públicamente, evitando su uso indebido.
Es posible que esta sea solo la primera versión de esta tecnología en desarrollo. Dada la preocupación por los Deep Fakes, es probable que su uso se limite a colaboraciones con centros especializados en problemas de comunicación. En el futuro, podría ser utilizada por organismos públicos para crear asistentes virtuales más amigables o integrarse en productos como Copilot de Windows.
El acceso público a esta herramienta podría plantear problemas de seguridad, aumentando el riesgo de estafas en línea al permitir la creación de videos falsos con famosos promocionando productos fraudulentos o incitando a inversiones fraudulentas. Por lo tanto, su lanzamiento requeriría medidas de control estrictas para prevenir su mal uso.