El mundo de la inteligencia artificial está en constante evolución, y una de las últimas creaciones que ha generado un gran revuelo es Sora, el modelo de texto a vídeo más impactante desarrollado por OpenAI. Sin embargo, recientemente ha surgido controversia en torno a los materiales utilizados para su entrenamiento, especialmente en lo que respecta a los vídeos obtenidos de YouTube.
En una entrevista con Bloomberg, Neal Mohan, CEO de YouTube, lanzó una advertencia clara a OpenAI y su CEO, Sam Altman. Mohan afirmó que el uso de vídeos de YouTube para entrenar modelos de inteligencia artificial va en contra de los términos de uso de la plataforma. Aunque admitió no tener conocimiento directo de que OpenAI hubiera utilizado YouTube para entrenar a Sora, Mohan enfatizó que dicha práctica sería una violación de las reglas establecidas.
El CEO de YouTube también explicó que ni siquiera Google, la empresa matriz de YouTube, tiene acceso irrestricto a los vídeos de la plataforma para entrenar a su IA de última generación, Gemini. Mohan destacó que los términos de uso de YouTube prohíben no solo el uso de vídeos completos, sino también la extracción de fragmentos de clips o transcripciones de audio para el entrenamiento de modelos de lenguaje.
A pesar de las especulaciones sobre el posible uso de YouTube por parte de OpenAI para entrenar a Sora, Mohan hizo hincapié en la importancia de respetar los términos de servicio de la plataforma. Desde la perspectiva de un creador, subir contenido a YouTube implica ciertas expectativas sobre el uso adecuado de dicho contenido, y violar estos términos es inaceptable.
Las sospechas sobre el uso de YouTube por parte de OpenAI se intensificaron después de una entrevista con Mira Murati, jefa tecnológica de la compañía, quien evitó brindar detalles sobre los conjuntos de datos utilizados para entrenar a Sora.
Aunque OpenAI ha afirmado que utiliza «información disponible públicamente» y contenido licenciado, la falta de transparencia sobre sus fuentes de datos ha generado desconfianza entre algunos sectores. Además, las declaraciones anteriores de la compañía sobre la necesidad de utilizar materiales protegidos por derechos de autor para el entrenamiento de IA han aumentado las preocupaciones sobre sus prácticas.