¿Quién está detrás del archivo que ha clonado millones de canciones de Spotify?

El grupo activista Anna’s Archive asegura haber recopilado metadatos de 256 millones de pistas y 86 millones de archivos de audio, lo que representa aproximadamente el 99,6 % de lo que los usuarios escuchan en Spotify, organizados en un archivo de casi 300 TB distribuido en torrents. El proyecto, que hasta ahora era conocido por preservar libros y artículos científicos, lo presenta como el “archivo de preservación musical más grande creado no oficialmente”, diseñado para “proteger la música de la pérdida” si plataformas como Spotify cambian licencias o cierran. El archivo no es una copia literal de todo Spotify, pero sí de la música que más se reproduce: Metadatos para 256 millones de pistas (títulos, artistas, ISRCs, portadas, etc.).  86 millones de pistas de audio, mayormente en formato OGG Vorbis a 160 kbps, organizadas por popularidad.  Los temas con poca popularidad —según su propio esquema— se han comprimido a formatos de menor bitrate para ahorrar espacio.La colección cubre música disponible hasta julio de 2025. Este archivo ha sido difundido en archivos torrent agrupados por popularidad y pensado para que cualquiera con suficiente almacenamiento pueda replicarlo. Spotify ha confirmado accesos no autorizados y ha comenzado una investigación interna sobre la extracción masiva de datos. La plataforma afirmó haber desactivado cuentas vinculadas a la operación y que utiliza técnicas no permitidas para eludir protecciones DRM para obtener algunos archivos de audio. La compañía asegura estar implementando nuevas salvaguardas contra ataques anti-copyright y monitorizando comportamientos “sospechosos” para evitar filtraciones similares en el futuro. Anna’s Archive defiende que su acción responde a una lógica de preservación de la cultura digital, argumentando que la música podría desaparecer si sólo se accede a través de servicios de suscripción y licencias temporales. Sin embargo, expertos legales y representantes de la industria lo consideran una violación directa de derechos de autor y anticipan posibles acciones legales. Además, la disponibilidad de estos datos en torrents plantea riesgos extendidos, desde la descarga ilegal por usuarios comunes hasta su posible uso para entrenar modelos de inteligencia artificial sin consentimiento. El incidente pone de manifiesto posibles vulnerabilidades técnicas en servicios de streaming que dependen de APIs públicas y métricas de popularidad para estructurar catálogos, y subraya la necesidad de reforzar controles de acceso y protección de datos multimedia. A su vez, la magnitud del archivo —que incluye cientos de millones de registros de metadatos y decenas de millones de pistas— podría cambiar cómo se valora la preservación musical en la era digital. 300 TB de datos recopilados y organizados en torrents.256 millones de metadatos de pistas. 86 millones de archivos de audio (≈99,6 % de reproducciones). El archivo cubre contenido hasta julio de 2025.