Yannick Dehée, historien et fondateur de Nouveau Monde Editions, est le premier « à demander à Mistral AI d’indemniser les auteurs et les éditeurs français qu’elle a piratés ». Il assure au Monde que le champion français de l’intelligence artificielle (IA) a utilisé, pour entraîner son modèle d’IA générative, « plus de 200 titres de son catalogue », soit plus d’un cinquième de son fond, sans jamais lui reverser un centime.

Selon une enquête de Mediapart du 22 décembre 2025, le directeur scientifique de Mistral AI, Guillaume Lample – qui officiait auparavant chez Meta –, avait plaidé pour que Meta entraîne son IA générative, LLaMA, en « s’appuyant sur des millions de livres collectés par Library Genesis (LibGen), un site Internet pirate ». Ce qui aurait, selon Mediapart, permis « le piratage de plusieurs dizaines de téraoctets (un téraoctet équivaut à 1 000 gigaoctets) de données ».

Toute la question est de savoir si Mistral AI a également utilisé LibGen, comme en est persuadé Yannick Dehée. Le porte-parole de Mistral AI « conteste les allégations de Nouveau Monde Editions », sans dire clairement que LibGen n’a pas été utilisé. Et ajoute simplement : « Les modèles de Mistral AI sont entraînés, testés, validés sur un ensemble diversifié de données couvrant plusieurs langues et régions géographiques, et soigneusement sélectionnés à partir de diverses sources pour garantir une couverture large et un apprentissage de haute qualité. Ces données incluent des informations publiques disponibles sur Internet, des jeux de données non publics sous licence auprès de tiers, ainsi que des données générées en interne. »

« Si vous n’aviez pas utilisé LibGen, il serait pourtant simple de le dire », lui rétorque Yannick Dehée, qui rappelle que la start-up Mistral AI « est française, en partie financée par les pouvoirs publics » et « ne peut se comporter comme les pirates américains ».

C’est pourtant outre-Atlantique que Nouveau Monde Editions – l’une des maisons d’édition lésées par Anthropic aux Etats-Unis – va obtenir gain de cause. Au moins cinq ouvrages de la maison française traduits en anglais ont été utilisés illégalement pour entraîner l’IA générative Claude d’Anthropic. Celui-ci a accepté, en septembre 2025, dans un accord à l’amiable, de verser au moins 1,5 milliard de dollars (1,26 milliard d’euros) à un fonds d’indemnisation d’auteurs, ayants droit et éditeurs qui poursuivaient l’entreprise pour avoir téléchargé illégalement des millions de livres.

Recomendar A Un Amigo
  • gplus
  • pinterest
Commentarios
No hay comentarios por el momento

Tu comentario