Collector
La IA se nutre de la ilegalidad: así entrena con la biblioteca pirata más grande del mundo | Collector
La IA se nutre de la ilegalidad: así entrena con la biblioteca pirata más grande del mundo
Cope Zaragoza

La IA se nutre de la ilegalidad: así entrena con la biblioteca pirata más grande del mundo

El gran secreto detrás del entrenamiento de las inteligencias artificiales más punteras ha salido a la luz, y es más polémico de lo que se pensaba. Lejos de los cauces legales, estas tecnologías han sido alimentadas con una cantidad ingente de información proveniente de la que es considerada la mayor biblioteca pirata del mundo. Así lo ha desvelado el divulgador y viajero Sergio Parra en el programa 'Herrera en COPE Cataluña', donde ha afirmado que las empresas tecnológicas han tenido que admitir el uso de este repositorio ilegal para desarrollar sus modelos. La revelación es contundente y apunta directamente a 'Anna's Archive', un gigantesco reservorio de libros electrónicos pirateados. Según Parra, compañías como OpenAI o Anthropic se han servido de este archivo para entrenar a sus algoritmos. La razón es puramente logística y económica: adquirir legalmente millones de libros para este fin supondría un gasto multimillonario y un reto logístico casi insuperable. En cambio, desde esta plataforma, han podido descargar "80 teras" de datos de forma masiva y rápida, una base de conocimiento fundamental que ha permitido el salto cualitativo de la IA. Pero, ¿qué es exactamente Anna's Archive? Sergio Parra lo describe como "el mayor reservorio de libros electrónicos del mundo, todos piratas", un lugar donde "es raro que un libro no esté ahí", disponible en multitud de idiomas y formatos como PDF o EPUB. El acceso a esta biblioteca es peculiar. Debido a que sus direcciones web son eliminadas constantemente por infringir los derechos de autor, los usuarios deben recurrir a la página de Wikipedia sobre el archivo para encontrar los enlaces actualizados. "Las direcciones van actualizándolas cada día", explica Parra, quien reconoce usarlo para acceder a libros que considera "inaccesibles" por otras vías. El propio divulgador ha señalado que, aunque se trata de un contenido ilícito, en España "la descarga para consumo privado, en principio, es legal", siempre que no haya una finalidad comercial. Esta práctica, ahora en el centro del debate, ha sido la piedra angular sobre la que se han construido herramientas que están transformando la sociedad, lo que plantea un profundo dilema sobre la innovación y los derechos de autor. En el otro extremo del espectro se encuentran las bibliotecas oficiales, colosos del saber que compiten por el título del lugar con más libros del mundo. Según Parra, existe un debate abierto entre la Biblioteca del Congreso de Estados Unidos, en Washington, y la Biblioteca Británica, en Londres. Aunque las cifras "bailan" porque cada institución cuenta los documentos de manera diferente, se estima que la británica alberga unos 200 millones de documentos, mientras que la estadounidense posee alrededor de 175 millones de libros. El crecimiento de la Biblioteca del Congreso es imparable, ya que añade unos 10.000 libros nuevos cada día, una cifra que da vértigo si se compara con los 100.000 libros que se publican en toda España en un año. Para visualizar su magnitud, Parra ofrece una analogía impactante: si se pusieran todas sus estanterías en línea recta, alcanzarían una longitud de 1.300 kilómetros, la distancia aproximada entre Madrid y París. Entre sus tesoros, la institución estadounidense custodia una de las poquísimas copias que existen de la Biblia de Gutenberg, el primer libro impreso con tipos móviles, cuyo valor es de cientos de millones de euros. También posee récords curiosos, como el libro más grande del mundo, un atlas de 2 metros por 1,5, y el más pequeño, una edición de 'Old King Cole' que mide menos de un milímetro y cuyas páginas deben pasarse con un alfiler. Como colofón, una red de túneles subterráneos y pasadizos secretos conecta la biblioteca con el Capitolio, permitiendo que los senadores reciban los libros que solicitan en cuestión de minutos.

Go to News Site