Un trio de médias numériques poursuit OpenAI pour avoir dissimulé des violations de droits d'auteur -

Raw Story, AlterNet et The Intercept s’ajoutent aux réactions de plus en plus vives contre la méthode de formation des chatbots de l’entreprise technologique.

Trois médias numériques – Raw Story, Alternet et The Intercept – ont intenté une action en justice contre OpenAI pour violation du droit d’auteur mercredi, renforçant ainsi le mouvement de protestation de l’industrie contre la méthode de formation des chatbots utilisée par l’entreprise technologique.

Les deux plaintes, l’une déposée par The Intercept et l’autre déposée collectivement par Raw Story et Alternet, accusent l’entreprise d’intelligence artificielle d’utiliser des œuvres de journalistes protégées par le droit d’auteur sans attribution appropriée pour former de grands modèles de langage. Les poursuites affirment qu’OpenAI a pris des mesures pour dissimuler ses actions de violation des droits d’auteur en supprimant certaines informations, telles que la signature ou le titre de l’article original.

Les entreprises de médias numériques demandent des dommages-intérêts d’au moins 2 500 dollars par infraction, ainsi que le retrait par OpenAI de tous les éléments protégés par le droit d’auteur des ensembles de données d’entraînement.

« Lorsqu’ils ont rempli leurs ensembles d’entraînement avec des œuvres journalistiques, les défendeurs avaient le choix : ils pouvaient entraîner ChatGPT en utilisant des œuvres journalistiques avec les informations de gestion du droit d’auteur protégées par le DMCA intactes, ou ils pouvaient les supprimer », peut-on lire dans le procès de Raw Story et d’Alternet. « Les défendeurs ont choisi cette dernière solution et, ce faisant, ont formé ChatGPT à ne pas reconnaître ou respecter les droits d’auteur, à ne pas avertir les utilisateurs de ChatGPT lorsque les réponses qu’ils recevaient étaient protégées par les droits d’auteur des journalistes, et à ne pas fournir d’attribution lorsqu’ils utilisaient les œuvres de journalistes humains ».

The Intercept a également poursuivi Microsoft pour avoir développé son propre chatbot avec la même formation, y compris le contenu protégé par le droit d’auteur.

Les éditeurs ont récemment été confrontés à un choix difficile : Lutter contre OpenAI et l’empiètement technologique sur l’industrie des médias, ou permettre aux entreprises technologiques d’utiliser des contenus protégés par le droit d’auteur moyennant une redevance élevée.

En décembre 2023, le New York Times a intenté une action en justice ambitieuse contre Microsoft et OpenAI, accusant les géants de la technologie de violation des droits d’auteur. Le procès affirme que les outils d’IA générative créés par Microsoft et OpenAI reposent sur de grands modèles de langage (ou LLM) « construits en copiant et en utilisant des millions d’articles de presse, d’enquêtes approfondies, d’articles d’opinion, de critiques, de guides pratiques et autres du Times, protégés par des droits d’auteur ».

L’action en justice intentée par le Times est la première affaire retentissante intentée par des éditeurs de presse au sujet des capacités génératives de l’IA et de la manière dont les chatbots ont été formés, alors que la technologie commence à s’implanter dans l’industrie des médias.

Entre-temps, des organisations telles que News Corp, qui possède le Wall Street Journal et le New York Post, se sont associées à OpenAI, car l’entreprise a l’intention d’être un « fournisseur de contenu de base pour les entreprises d’IA générative qui ont besoin d’un contenu opportun de la plus haute qualité pour garantir la pertinence de leurs produits », selon le PDG Robert Thomson.

M. Thomson a également dénoncé le procès intenté par le New York Times contre Microsoft et OpenAI, en déclarant que « la cour est préférable aux salles d’audience ».

Pamela Chelin a contribué à ce rapport.