Según informes, OpenAI ofrece entre 1 y 5 millones de dólares al año para licenciar artículos noticiosos con el fin de entrenar sus modelos de IA con información protegida por derechos de autor.
Esto es uno de los primeros indicios de cuánto están dispuestas a pagar las compañías de IA por material licenciado. Otros informes indican que Apple también está buscando asociarse con empresas de medios para utilizar contenido en el entrenamiento de sus sistemas de IA y ofrece al menos 50 millones de dólares durante varios años por estos datos.
Estos montos se asemejan a algunos acuerdos de licencia no relacionados con la IA realizados anteriormente. Por ejemplo, cuando Meta lanzó la pestaña de noticias de Facebook, supuestamente ofreció hasta 3 millones de dólares al año para licenciar historias, titulares y vistas previas de noticias.
Actualmente, los modelos de lenguaje grandes se han entrenado principalmente con información de internet. Algunos modelos de IA no revelan cómo obtienen sus datos de entrenamiento, aunque a menudo se conoce qué conjuntos de datos o rastreadores web se utilizaron. El precio de estos conjuntos de datos de entrenamiento varía según el proveedor, tamaño y contenido del conjunto de datos.
Sin embargo, surgieron desafíos significativos en esta práctica. Por un lado, el rastreador de OpenAI ha sido bloqueado por algunas compañías de medios, incluyendo The New York Times y Vox Media (la empresa matriz de The Verge), lo que dificulta su acceso a ciertos datos. Por otro lado, varias organizaciones argumentan que el uso de sus datos para entrenamiento constituye una infracción de derechos de autor, e inclusive ya hay demandas de por medio.
Para evitar estos problemas, las empresas de IA están estableciendo asociaciones con editoriales. Algunos medios, como Axel Springer (empresa matriz de Politico y Business Insider) y The Associated Press, han firmado acuerdos con OpenAI para licenciar historias y colaborar en el desarrollo de tecnología para la recolección de noticias.
Además de OpenAI y Apple, Google también ha mostrado interés en trabajar con organizaciones de noticias, demostrando herramientas de IA a ejecutivos de medios reconocidos. Algunas organizaciones de noticias han utilizado herramientas de IA generativa en sus redacciones con resultados mixtos.
La IA está evolucionando rápidamente, y los datos de alta calidad desempeñarán un papel cada vez más importante en su desarrollo. Las empresas de IA que puedan acceder a los mejores datos estarán en una posición ventajosa en el mercado.
- Alianzas estratégicas: Estas negociaciones representan alianzas estratégicas en las que las empresas de IA y los medios de comunicación colaboran para intercambiar datos y contenido. Las compañías de IA obtienen acceso a información protegida por derechos de autor para entrenar sus modelos de IA, mientras que los medios de comunicación pueden beneficiarse económicamente al licenciar su contenido. Esta colaboración puede permitir a ambas partes desarrollar tecnología más avanzada, mejorar sus productos y ofrecer servicios más sofisticados a sus usuarios.
- Nuevo mercado para compañías de medios: También puede considerarse como la apertura de un nuevo mercado para las compañías de medios de información. Anteriormente, las editoriales podrían haber ganado ingresos principalmente a través de la publicación de contenido en sus plataformas o vendiendo licencias para el uso de su material a otras empresas. Ahora, al asociarse con empresas de IA, como OpenAI, las compañías de medios pueden generar ingresos adicionales al licenciar su contenido para el entrenamiento de modelos de IA. Esto representa una nueva oportunidad de negocio para los medios de comunicación, donde su contenido tiene un valor adicional en el campo de la inteligencia artificial y la tecnología.
En resumen, estas negociaciones pueden ser consideradas tanto como alianzas estratégicas que fomentan la colaboración entre empresas de IA y medios de comunicación, como una incursión en un nuevo mercado donde el contenido noticioso se convierte en un activo valioso para entrenar modelos de IA, generando así una nueva fuente de ingresos para las editoriales.
Comentarios