Wikipédia entre en guerre contre les contenus générés par l’IA

Depuis le succès mondial rencontré par le ChatGPT d’OpenAI, le web est inondé de contenus générés par l’intelligence artificielle. Cela ne semble pas plaire à Wikipédia, qui se lance dans une opération de « nettoyage » particulièrement ambitieuse.

L’explosion de l’IA a provoqué d’importants changements sur le net, pour le meilleur comme pour le pire. En effet, de nombreux sites, tels que Buzzfeed ou encore CNET, utilisent l’IA afin de rédiger rapidement toutes sortes de contenus. D’ailleurs, plus de la moitié du contenu présent sur le web serait généré par l’IA. Une étude menée par des chercheurs de Google affirme même que l’IA serait en train de ruiner l’internet. Ce problème touche également Wikipédia, qui vient de déclarer la guerre à l’IA.

Crédit photo : Unsplash

Une équipe de rédacteurs de Wikipédia s’est ainsi réunie pour créer le « WikiProject AI Cleanup », une opération de nettoyage à grande échelle qui se veut être « une collaboration pour combattre le problème croissant du contenu généré par l’IA, non sourcé et mal écrit, sur Wikipédia ».

Wikipédia se sert de ChatGPT pour détecter les contenus générés par l’IA

Ainsi, cette initiative ne vise pas à éliminer l’ensemble du contenu généré par l’IA, mais plutôt à combattre les textes de piètre qualité. Le groupe de rédacteurs précise ainsi : « Le but de ce projet n’est pas de restreindre ou d’interdire l’utilisation de l’IA dans les articles, mais de vérifier que sa production est acceptable et constructive, et de la corriger ou de la supprimer dans le cas contraire. »

Selon eux, il est plutôt facile de détecter des textes générés par l’IA, notamment en se concentrant sur certaines phrases d’accroche qui trahissent son utilisation. Les rédacteurs expliquent : « Quelques-uns d’entre nous avaient remarqué la prévalence d’une écriture non naturelle qui montrait des signes évidents de génération par l’IA, et nous avons réussi à reproduire des « styles » similaires en utilisant ChatGPT […] la découverte de certaines phrases d’accroche communes à l’IA nous a permis de repérer rapidement certains des exemples les plus flagrants d’articles générés. »

Quoi qu’il en soit, Wikipédia a déjà pris des mesures pour lutter contre les contenus générés par l’IA. Le site a par exemple choisi de rétrograder la fiabilité de certains sites d’information comme CNET, qui a d’ailleurs du mal à se vendre en raison d’une utilisation abusive de l’IA.

Source : futurism