Le New York Times poursuit OpenAI et Microsoft pour violation du droit d'auteur -

Le journal officiel affirme que des millions de ses articles n’ont pas été autorisés à former ChatGPT et les autres outils d’I.A. des entreprises.

Le New York Times a poursuivi Microsoft et le créateur de ChatGPT, OpenAI, pour violation des droits d’auteur, accusant les deux sociétés d' »utilisation illégale du travail du Times pour créer des produits d’intelligence artificielle » qui concurrencent le travail de l’organe de presse et « menacent » sa capacité à fournir un journalisme indépendant.

La plainte affirme que les outils d’intelligence artificielle générative créés par Microsoft et OpenAI reposent sur de grands modèles de langage, ou LLM, « qui ont été construits en copiant et en utilisant des millions d’articles de presse, d’enquêtes approfondies, d’articles d’opinion, de critiques, de guides pratiques, etc. du Times, protégés par des droits d’auteur ».

« Alors que les défendeurs se sont engagés dans la copie à grande échelle de nombreuses sources, ils ont accordé une importance particulière au contenu du Times lors de la construction de leurs LLM – révélant une préférence qui reconnaît la valeur de ces travaux », a déclaré le procès, qui a été déposé au tribunal de district des États-Unis pour le district sud de New York. « Par l’intermédiaire de Microsoft, le contenu du Times a été particulièrement mis en valeur lors de l’élaboration des LLM.
Bing Chat de Microsoft (récemment rebaptisé « Copilot ») et ChatGPT d’OpenAI, les défendeurs cherchent à profiter de l’investissement massif du Times dans son journalisme en l’utilisant pour créer des produits substitutifs sans autorisation ni paiement ».

Bien qu’il ne s’agisse pas du premier procès intenté à des sociétés d’IA pour leur utilisation de matériel publié – un large éventail d’écrivains et d’autres créateurs, de la comédienne Sarah Silverman à l’auteur chrétien et ancien gouverneur de l’Arkansas Mike Huckabee, ont porté plainte pour violation des droits d’auteur – le Times est le premier grand organe de presse américain à s’en prendre aux plates-formes d’IA.

Le Times a la particularité d’affirmer que les produits d’IA générative « menacent le journalisme de qualité ».

« Si le Times et d’autres organismes d’information ne peuvent pas produire et protéger leurs produits d’I.A. générative, ils risquent d’en pâtir.
journalisme indépendant, il y aura un vide qu’aucun ordinateur ou intelligence artificielle ne pourra combler », affirme la plainte.

Dans son article sur le procès, le Times indique que celui-ci pourrait également tester « les contours juridiques émergents des technologies génératives de l’intelligence artificielle » et « pourrait avoir des implications majeures pour l’industrie de l’information ».

L’action en justice, qui intervient quatre mois après que le Times a interdit l’utilisation de son contenu pour former des systèmes d’I.A., soutient que les entreprises ont « refusé de reconnaître » la forte protection des droits d’auteur prévue par la législation américaine.

« Alimentés par des LLM contenant des copies du contenu du Times, les outils GenAI des défendeurs peuvent générer des résultats qui récitent le contenu du Times mot pour mot, le résument étroitement et imitent son style expressif, comme le démontrent des dizaines d’exemples, y compris de nombreux articles inclus comme pièces à conviction dans le procès.

« Ces outils attribuent également à tort de fausses informations au Times », affirme le procès.

En outre, le moteur de recherche Bing de Microsoft « copie et catégorise le contenu en ligne du Times, afin de générer des réponses contenant des extraits textuels et des informations détaillées ».
des résumés d’articles du Times qui sont beaucoup plus longs et détaillés que ceux renvoyés par les moteurs de recherche traditionnels », affirme la plainte.

« En fournissant le contenu du Times sans sa permission ou son autorisation, les outils des défendeurs sapent et endommagent la relation du Times avec ses lecteurs et privent le Times d’abonnements, de licences, de publicité et de revenus d’affiliation », poursuit la plainte. Le procès indique que le Times comptait environ 10,1 millions d’abonnés au 30 septembre et vise à en avoir 15 millions d’ici à la fin de l’année 2027.

La plainte ne contient pas de demande pécuniaire, mais note que l’utilisation du travail du Times de cette manière sans payer « a été extrêmement lucrative » pour les entreprises. Elle affirme que l’utilisation par Microsoft de LLM formés par le Times dans sa gamme de produits « a contribué à augmenter sa capitalisation boursière d’un billion de dollars au cours de la seule année écoulée ». Il note également que « le lancement de ChatGPT par OpenAI a fait grimper son évaluation à 90 milliards de dollars ».

Le Times indique qu’il a tenté de parvenir à un accord négocié avec Microsoft et OpenAI depuis avril, qui pourrait impliquer un accord commercial et d’éventuels « garde-fous technologiques », de la même manière qu’il a conclu des accords avec Google, Meta et Apple, mais que les pourparlers ont abouti à une « impasse ».

Publiquement, les défendeurs insistent sur le fait que leur conduite est protégée par le principe de « fair use » (utilisation équitable) parce que leur utilisation sans licence de contenus protégés par le droit d’auteur pour former les modèles GenAI sert un nouvel objectif « transformatif » », affirme le procès. « Mais il n’y a rien de ‘transformatif’ dans le fait d’utiliser le contenu du Times sans paiement pour créer des produits qui se substituent au Times et lui volent son public.

« Parce que les résultats des modèles GenAI des défendeurs sont en concurrence avec les produits du Times et qu’ils sont en concurrence avec les produits du Times et qu’ils sont en concurrence avec les produits du Times.
Les résultats des modèles GenAI des défendeurs étant en concurrence avec les données d’entrée utilisées pour les former et les imitant étroitement, la copie des œuvres de Times à cette fin n’est pas un usage loyal », précise la plainte.

Les représentants de Microsoft et d’OpenAI n’ont pas immédiatement répondu aux demandes de commentaires, et les entreprises n’ont pas encore eu l’occasion de répondre au tribunal.