Meta aurait utilisé des livres piratés afin de former son IA
Des documents judiciaires récemment révélés suggèreraient que Meta, propriétaire de Facebook, Instagram et WhatsApp, aurait eu recours à des livres piratés dans le but de former son système d’intelligence artificielle.
Meta n’aura pas attendu longtemps pour tenter de rattraper son retard en matière d’IA. Et pour cause : le patron de l’entreprise, Mark Zuckerberg, a récemment annoncé sa volonté de généraliser l’utilisation de l’intelligence artificielle. Dans ce cadre, le patron de Meta veut par exemple développer une IA dix fois plus puissante que Llama 3. Mais, comme tout système d’IA, la technologie de Meta a besoin de se former à l’aide d’une grande quantité de données.
Et, parfois, les grandes entreprises d’IA ne se gênent pas pour utiliser du contenu protégé par des droits d’auteur. On a par exemple pu voir l’auteur de Game of Thrones, George R. R. Martin, porter plainte contre le créateur de ChatGPT, OpenAI. D’ailleurs, plusieurs auteurs ont poursuivi OpenAI et Meta pour violation de droits d’auteur.
Meta : Mark Zuckerberg aurait donné son aval
Dans le cadre de l’un de ces procès, certains documents indiqueraient que Meta aurait sciemment utilisé des livres piratés, obtenus à partir de l’archive en ligne Library Genesis, pour entraîner son IA. Et, selon Wired, l’entreprise de Mark Zuckerberg aurait tenté de dissimuler les documents en question.
En effet, selon la juge en charge de cette affaire, Meta aurait tenté d’« éviter la publicité négative ». L’un des employés de Meta aurait ainsi déclaré : « Si les médias suggèrent que nous avons utilisé un ensemble de données que nous savons être piraté, comme LibGen, cela pourrait nuire à notre position de négociation avec les régulateurs sur ces questions. »
Pire : la plainte en question affirme que le patron de Meta lui-même, Mark Zuckerberg, aurait donné son feu vert. « Meta a traité la soi-disant “disponibilité publique” des ensembles de données fantômes comme une carte de sortie de prison, en dépit du fait que les dossiers internes de Meta montrent que tous les décideurs pertinents de Meta, y compris son PDG, Mark Zuckerberg, savaient que LibGen était “un ensemble de données que nous savons être piraté” », écrivent les plaignants.
Source : futurism