La entidad de gestión de derechos de propiedad intelectual de escritores y periodistas CEDRO ha identificado casi 50.000 títulos editados en España, correspondientes al menos a 41.000 autores y 1.100 editoriales, que podrían estar usándose para alimentar modelos de Inteligencia Artificial.

La lista incluye a autores como Almudena Grandes, Arturo Pérez Reverte, Fernando Aramburu, Dolores Redondo, Lorenzo Silva, María Dueñas o Eduardo Mendoza y editoriales como Planeta, Acantilado, Anagrama, Libros del Asteroide o la RAE, «prácticamente toda la producción editorial española».

Informe de la Danish Rights Alliance

CEDRO se basa en un informe publicado en septiembre pasado por la Danish Rights Alliance, organización danesa que defiende los derechos de autor en internet, según el cual el sitio pirata Libgen ha sido usado como fuente de contenido para entrenar modelos de IA desarrollados por empresas como Meta (LLaMA) y OpenAI (ChatGPT).

La organización danesa, que con su informe buscaba demostrar la importancia de obligar a las empresas a ser transparentes con sus fuentes, obtuvo esa información a partir de documentos y declaraciones hechos públicos en el marco de los procedimientos judiciales abiertos en Estados Unidos contra las principales empresas tecnológicas implicadas.

LIBGEN

Libgen es un sitio pirata de origen ruso creado a finales de la primera década de los años dos mil. La justicia estadounidense ordenó su cierre y la suspensión del dominio en octubre 2015 y también está bloqueado en países como Reino Unido, Francia, Alemania, Grecia, Italia o Países Bajos, recuerda CEDRO en un informe interno al que ha tenido acceso EFE. A pesar de ello, sigue siendo accesible en casi todo el mundo gracias a webs espejo y cambios de dominio para evadir bloqueos.

La organización española ha analizado las bases de datos de Libgen y ha encontrado 49.461 obras de al menos 41.100 autores españoles y 1.100 editoriales y alerta de que cualquier empresa que haya utilizado ese sitio para la prestación de sus servicios podría estar incurriendo en delitos de infracción de derechos de autor, entre otros.

Marco legal actual es «totalmente defectuoso»

Jorge Corrales, director general de CEDRO, cree que el principal problema para perseguir estos delitos es que el marco legal actual es «totalmente defectuoso» y denuncia que desde hace 20 años se ha tomado una decisión tras otra, en todos los niveles, para «devaluar el marco de los derechos de autor».

«No me creo el relato de que la legislación no va a la velocidad que va la tecnología, aquí lo que no hay es voluntad», sostiene el directivo, que insta a una reflexión global sobre los modelos de negocio de internet y el tipo de sociedad que queremos.

«Hasta ahora no hemos sido capaces de calibrar todas las externalidades negativas: desinformación, pérdida de pensamiento crítico y capacidad de atención… pero ya han pasado 20 años, a lo mejor sí que tenemos que darnos cuenta y digo yo que no dejaremos caer un sector tan imprescindible para el conjunto de la sociedad como es el sector editorial».

Los editores ven el escenario actual con máxima preocupación

Los editores ven el escenario actual con máxima preocupación. «Hace mucho tiempo que nos están robando», ha dicho a EFE Daniel Fernández, presidente de la Federación de Gremios de Editores de España (FGEE), que utiliza «la metáfora del cocido» para explicarlo.

«El primer vuelco fue la aparición de Internet; el segundo vuelco, los buscadores, digamos Google como elemento más importante, y ahora estamos en el tercer vuelco, que es esta llamada inteligencia artificial y que yo prefiero llamar bases de datos asociativas».

«Este tercer vuelco del cocido -agrega- es el más abusivo de todos porque es donde va toda la carne, la chicha, la morcilla, el chorizo, etc. y con la derivada de no saber si se va a utilizar para hacer pasar por creaciones humanas creaciones de máquinas».