Une nouvelle affaire judiciaire en rapport avec l’intelligence artificielle fait trembler la Silicon Valley.
Le 4 juin 2025, Reddit, la plateforme sociale aux plus de 97 millions d’utilisateurs actifs quotidiens, a déposé une plainte contre Anthropic, la start-up d’IA basée à San Francisco, connue pour son modèle d’IA Claude.
Au cœur du litige : l’utilisation présumée non autorisée de conversations publiques issues de Reddit pour entraîner les modèles d’intelligence artificielle d’Anthropic.
Cette affaire soulève des questions cruciales sur l’éthique des données et les droits des utilisateurs dans l’ère de l’IA générative…
Reddit VS Anthropic : Une plainte fondée sur l’exploitation des données
Fondée en 2021 par d’anciens ingénieurs d’OpenAI, Anthropic s’est forgée une réputation de pionnier de l’IA éthique, mettant en avant des principes de transparence et de responsabilité. Pourtant, Reddit qualifie ces engagements de « promesses vides », accusant la start-up de privilégier ses ambitions commerciales au détriment des droits des utilisateurs.
Reddit accuse Anthropic d’avoir exploité sans permission les discussions riches et variées de ses utilisateurs pour nourrir ses algorithmes. Selon la plainte déposée devant la Cour supérieure de Californie à San Francisco, Anthropic aurait sciemment contourné les règles de la plateforme en utilisant des bots pour extraire massivement des données, et ce, malgré des mises en garde explicites.
La plateforme affirme que ces pratiques violent ses conditions d’utilisation, compromettent la vie privée de ses utilisateurs et sapent son modèle économique basé sur des accords de licence.
Le rapport d’Anthropic qui change tout
Un élément clé de l’accusation repose sur un document de recherche publié en décembre 2021 par Anthropic, cosigné par son PDG, Dario Amodei. Ce rapport met en lumière l’utilisation de données issues de plateformes comme Reddit et Wikipédia pour optimiser les performances des modèles d’IA et utiliser comme des données d’entrainement. `
Des conversations tirées de subreddits spécifiques, allant des conseils de jardinage aux discussions philosophiques, auraient servi à affiner Claude, le modèle phare d’Anthropic. Reddit y voit une exploitation illégale, arguant que ces données, bien que publiques, nécessitent un accord formel pour une utilisation commerciale.
Lire aussi : Qu’est-ce que le Big Data ? Définition et exemples
Anthropic se défend, mais les tensions montent
Face à ces accusations, Anthropic n’a pas tardé à réagir. « Nous contestons fermement les allégations de Reddit et nous nous défendrons avec vigueur », a déclaré un porte-parole de l’entreprise à l’AFP.
Cette affaire n’est pas isolée. Elle s’inscrit dans une vague croissante de litiges opposant des créateurs de contenu, qu’il s’agisse de plateformes comme Reddit, d’auteurs ou d’éditeurs, à des entreprises d’IA accusées d’exploiter des données sans consentement explicite.
Des précédents existent : le New York Times a poursuivi OpenAI et Microsoft pour des motifs similaires, tandis que des auteurs ont attaqué Meta pour l’utilisation non autorisée de leurs œuvres.
Reddit, gardien de ses données face à l’IA ?
Reddit, qui a fait son entrée en bourse en 2024, se positionne comme un acteur clé dans l’écosystème de l’IA. Ses milliards de commentaires et posts, couvrant une infinité de sujets, constituent une mine d’or pour les entreprises cherchant à entraîner des modèles d’IA capables de comprendre le langage humain.
Partenariat avec OpenAI
Consciente de cette valeur, la plateforme a déjà signé des accords de licence lucratifs avec des géants comme Google et OpenAI.
Ces partenariats, qui incluent des clauses strictes sur la protection des données et des compensations financières, permettent à Reddit de monétiser son contenu tout en préservant les intérêts de ses utilisateurs.
Des accès non autorisés ?
Anthropic, en revanche, aurait refusé de négocier un tel accord, préférant, selon Reddit, accéder aux données par des moyens détournés. La plainte détaille des tentatives répétées d’Anthropic pour scraper les serveurs de Reddit, avec plus de 100 000 accès non autorisés recensés depuis juillet 2024.
Reddit demande des dommages-intérêts, une injonction pour empêcher Anthropic d’utiliser ses données à des fins commerciales, et même la suppression des modèles d’IA potentiellement entraînés sur ces contenus.
Data et IA : Vers un précédent juridique ?
L’issue de ce procès pourrait avoir des répercussions majeures sur l’industrie de l’IA. Une victoire de Reddit renforcerait le pouvoir des plateformes de contenu sur leurs données, obligeant les entreprises d’IA à négocier des licences formelles. À l’inverse, un jugement en faveur d’Anthropic pourrait ouvrir la voie à une utilisation plus libre des données publiques, au risque de fragiliser les droits des utilisateurs.`
Récemment, Meta s’est retrouvé aussi au cœur d’une controverse pour avoir utilisé les données des utilisateurs de Facebook et Instagram afin d’entraîner son modèle d’intelligence artificielle. Bien que l’entreprise ait sollicité le consentement de ses utilisateurs, cette démarche a suscité une vive polémique, alimentant les débats sur l’éthique et la transparence dans l’utilisation des données personnelles pour le développement de l’IA.
Alors que l’IA générative continue de transformer notre rapport au numérique, ce litige rappelle une vérité incontournable : derrière chaque algorithme performant se cachent des données humaines, souvent collectées dans l’ombre. Reddit, en montant au créneau, cherche à imposer des garde-fous. Reste à savoir si la justice lui donnera raison.
Source :



Retour de ping : "Message Summaries" : L’IA de Meta qui résume vos conversations WhatsApp