Reddit a porté plainte, mercredi 22 octobre à New York, contre quatre entreprises pour avoir exploité sans autorisation ses données, à des fins d’entraînement d’intelligence artificielle (IA). Reddit, l’un des plus grands forums du monde, accuse ces entreprises de « contourner illégalement, à l’échelle industrielle » ses protections, et de tirer profit des messages publiés par ses millions d’utilisateurs.

La plainte vise Perplexity, une entreprise d’IA américaine connue pour son « moteur de réponse », ainsi que trois entités moins célèbres, spécialisées dans le moissonnage de données : l’entreprise lituanienne Oxylabs UAB, la russe AWMProxy et la texane SerpApi, spécialistes de l’aspiration et la revente de données.

« Ces entreprises contournent les protections technologiques pour dérober des données, puis les revendent à des clients avides de contenus d’entraînement. Reddit est une cible de premier choix car c’est un des recueils de conversations humaines les plus importants et dynamiques jamais créés », a déclaré Ben Lee, directeur juridique de Reddit, dans un communiqué. « Perplexity est le client assumé d’au moins un de ces collecteurs de données, choisissant d’acheter des données volées plutôt que de conclure un accord directement avec Reddit. »

Selon ce dernier, ces entreprises contournent ses systèmes de sécurité en passant notamment par Google : elles aspirent les résultats des recherches dans lesquels apparaissent des extraits de Reddit. Elles seraient ainsi « comparables à des braqueurs de banque qui, sachant qu’ils ne peuvent pas accéder au coffre-fort, décident plutôt d’attaquer le fourgon blindé qui transporte l’argent », peut-on lire dans la plainte.

« Nous défendrons toujours vigoureusement le droit des utilisateurs à accéder librement et équitablement à la connaissance », a répondu Perplexity dans un communiqué. « Notre approche est responsable, fondée sur des principes, nous fournissons des réponses factuelles grâce à une intelligence artificielle précise, et nous ne tolérerons aucune menace contre la transparence ni contre l’intérêt public. »

SerpApi affirme de son côté « s’opposer vivement aux allégations de Reddit » et entend se « défendre vigoureusement devant la justice ». « La position d’Oxylabs est qu’aucune entreprise ne devrait s’arroger la propriété de données publiques qui ne leur appartiennent pas », a déclaré Denas Grybauskas, un responsable de l’entreprise. « Cela ressemble à une tentative de vendre ces mêmes données publiques à un prix plus élevé », estime-t-il.

Ces entreprises ne sont pas les premières visées par Reddit, qui a porté plainte en juin, pour les mêmes motifs, contre Anthropic, l’opérateur de l’IA Claude. Elle a en revanche trouvé des accords de licence avec d’autres grandes entreprises d’IA, comme Google et OpenAI, désormais autorisés à utiliser ses contenus, sous conditions et contre compensation financière.

Recomendar A Un Amigo
  • gplus
  • pinterest
Commentarios
No hay comentarios por el momento

Tu comentario