Sala de Prensa

14 noviembre, 2024
España

Inteligencia artificial, minería de datos y derechos de autor

Nota informativa escrita por el área de TMT de ECIJA Madrid.

Primera sentencia en Europa sobre este complejo equilibrio.

Lo que necesitas saber:

  • Definición del alcance de la excepción de interés científico en el ámbito del text and data mining: en base a esta sentencia, los derechos de autor quedan limitados por cuestiones de interés público. En concreto, se refuerza la ya establecida excepción por uso científico y de investigación. Así las cosas, los datasets, pueden incluir obras protegidas sin necesidad de licencias individuales para el entrenamiento de IA generativa, con ciertas limitaciones.
  • Impacto en la industria creativa: la sentencia podría establecer un precedente que limite las posibilidades de que los autores controlen cómo sus obras pueden ser transformadas en otras obras derivadas mediante la IA generativa.
  • Aplicación de la Directiva 2019/790 de Derechos de Autor en el Mercado Único Digital (DSM) en el ámbito de la IA generativa: a pesar de que el fallo se base en derecho alemán, el fundamento de esta regulación reside en los artículos 4 y 5 de la DSM, en relación con la minería de datos y las excepciones aplicables a sus restricciones correspondientes.

El pasado 27 de septiembre de 2024, el Tribunal Regional de Hamburgo dictó la primera sentencia en Europa que aborda uno de los temas más controvertidos en el contexto de text and data mining (TDM): la confrontación entre IA y derechos de autor. Con esta sentencia, el Tribunal analiza la legalidad del uso de imágenes protegidas por derechos de autor en conjuntos de datos (los llamados datasets) para entrenar modelos de IA generativa.

El litigio se inicia por una demanda del fotógrafo alemán Robert Kneschke, quien alegó que una organización (LION) había utilizado su fotografía sin su autorización para crear un dataset público cuya finalidad es entrenar sistemas de IA generativa.

Por su parte, la entidad demandada LION, es una organización sin ánimo de lucro compuesta por investigadores, comprometida con el desarrollo de algoritmos de autoaprendizaje en el contexto de la IA. Kneschke alegó que LION había incluido su fotografía en un conjunto de datos masivo (de 5,85 mil millones de pares imagen-texto) extraído de diversas fuentes de internet. La fotografía en cuestión estaba integrada por voluntad de Kneschke en una plataforma de imágenes, en cuyos términos se establecía que la imagen estaba protegida por derechos de autor y se distribuía bajo licencia, con restricciones explícitas en contra del scraping de datos mediante programas automatizados.

Concretamente, en esta plataforma, constaba una cláusula que establecía expresamente: “No se puede utilizar programas automatizados, applets, bots o similares para acceder a este sitio web o cualquier contenido en él para cualquier propósito, incluyendo, a modo de ejemplo, descargar contenido, indexar, extraer o almacenar cualquier contenido del sitio web”.

LION, obviando esta restricción, descargó de la plataforma, sin autorización, la fotografía, la incluyó en su dataset y la utilizó en un proceso automatizado de análisis, comparando su contenido con descripciones textuales para validar su precisión. Estas acciones implican la descarga, reproducción y, según alega Kneschke, el uso no autorizado de la fotografía. Concretamente, Kneschke argumentó que la inclusión de su fotografía en el conjunto de datos de Lion infringe específicamente su derecho exclusivo de reproducción, ya que ésta fue descargada y almacenada por LION sin su consentimiento para integrarse en su dataset.

Descargar el PDF completo más abajo.