Avec la popularité grandissante de ChatGPT, Bard et d’autres robots conversationnels intelligents (chatbots), il parfois difficile d’affirmer qu’un texte a été écrit par un humain ou grâce à un chatbot. Il est vrai qu’il y a de nombreux outils qui facilitent la détection de textes produits par l’IA, mais en vérité la plupart donnent des résultats erronés quand il s’agit de vérifier une dissertation, un article, une lettre de motivation ou d’autres contenus. Heureusement, il est encore possible de trouver des moyens fiables qui vous diront si un texte a été généré par ChatGPT ou s’il a été écrit par un être humain. Informez-vous donc sur les meilleurs outils de détection de l’IA pour les enseignants, les étudiants et d’autres utilisateurs curieux et apprenez à repérer rapidement les contenus rédigés par l’IA.
L’essentiel en quelques mots
- Pour vérifier un texte produit par ChatGPT, LLaMA ou un autre robot conversationnel intelligent, vous pouvez employer des outils comme Text Classifier d’OpenAI, GPTZero ou Copyleaks.
- ChatGPT permet d’avoir souvent des textes qui semblent « parfaits », mais contenant de fausses informations.
- Voici quelques signes qui indiquent que le texte a été rédigé avec ChatGPT : un manque de description, l’emploi de termes comme « premièrement » et « deuxièmement » ou de phrases qui « paraissent correctes », mais qui n’ont pas de sens en réalité.
Étapes
Comment fonctionnent les outils de détection de l’IA
-
Ces outils évaluent la prévisibilité du texte. ChatGPT, Bard et les chatbots similaires « écrivent » en anticipant la phrase ou le mot suivant. Pour ce faire, ils tiennent compte de leurs données d’entrainement. De même, les outils de détection de l’intelligence artificielle fonctionnent aussi en se basant sur des données d’entrainement similaires afin d’identifier « à quel point » les mots, les phrases et la structure d’un texte sont prévisibles.
- L’outil de détection fait une comparaison entre un texte donné et un contenu similaire. Ensuite, il évalue le degré de prévisibilité du texte pour en déterminer l’auteur, soit l’homme ou l’IA.
- Ces outils recherchent des « signatures » appelées aussi indicateurs, associés aux textes générés par l’IA comme le choix des termes et les structures [1] X Source de recherche .
-
Les détecteurs d’IA se trompent souvent. Dans le cas de ChatGPT, ils peuvent être utiles sans pour autant être infaillibles. Souvent, ils produisent des résultats faussement positifs en tendant à attribuer à l’IA un texte rédigé par un humain quand il suit certains modèles [2] X Source de recherche . D’un autre côté, les étudiants et autres rédacteurs peuvent facilement modifier le contenu obtenu par ChatGPT afin de le rendre pratiquement indétectable et tromper ainsi les outils de détection.
- Si l’un de ces outils signale qu’un texte a été généré par l’IA, soyez prudent et essayez de recouper vos informations. En effet, il est recommandé de ne recourir à ces outils que lorsque vous avez déjà trouvé d’autres indices qui laissent croire que l’écriture a été réalisée par ChatGPT [3] X Source de recherche .
- Si vous vérifiez des textes à l’aide de plusieurs détecteurs vous aurez une meilleure idée sur le fonctionnement de ces outils. Vous serez probablement en mesure de réduire vos erreurs d’appréciation quant aux auteurs réels des textes.
Publicité
-
Essayez OpenAI Text Classifier. Cet outil gratuit a été créé par les mêmes personnes qui ont mis au point ChatGPT. Il prédit la probabilité de la génération d’un texte en appliquant un modèle de langage d’IA [4] X Source de recherche . Vous devrez créer un compte gratuit OpenAI afin d’utiliser cet outil. Pour le moment, vous ne pouvez que coller du texte, mais l’option de téléversement de documents serait peut-être disponible à l’avenir. Pour avoir plus d’informations, consultez le site https://platform.openai.com/ai-text-classifier .
-
Découvrez GPTZero. L’outil a été mis au point par un élève de l’université de Princeton afin de lutter contre le plagiat par l’IA [5] X Source de recherche . GPTZero vous permet de coller ou de téléverser des documents pour vérifier s’ils ont été produits par ChatGPT ou d’autres chatbots. Avec la version gratuite (Classic), vous pouvez examiner jusqu’à 5 000 mots par fichier. Il y a des options payantes, dont un abonnement destiné aux enseignants. Vous pouvez aussi essayer l’outil dans votre navigateur Web, en installant le plug-in Chrome Extension ou dans Word [6] X Source de recherche . Allez sur https://gptzero.me pour créer un compte gratuit et commencer vos vérifications.
-
Testez Content at Scale. Ce détecteur gratuit en ligne a été créé par une société de création de contenu d’IA. L’objectif consiste à aider les utilisateurs de ChatGPT et d’autres générateurs de contenu d’IA à vérifier leurs travaux avant de les publier afin d’atténuer les indices d’une rédaction par un logiciel IA [7] X Source de recherche . Vous avez la possibilité de coller 25 mots ou même plus dans cet outil. Pour le tester, allez sur https://contentatscale.ai/ai-content-detector .
-
Essayez Copyleaks. C’est un outil haut de gamme, sécurisé et équipé pour détecter les contenus produits par GPT-4, la version la plus récente du modèle de langage d’OpenAI, disponible seulement dans ChatGPT Plus. La plateforme propose différents plans d’abonnement pour vérifier le plagiat résultant de l’emploi d’un logiciel IA. Vous avez la possibilité d’évaluer gratuitement jusqu’à 250 caractères pour ChatGPT, Bard et d’autres chatbots [8] X Source de recherche . Pour essayer Copyleaks, il suffit d’aller sur https://copyleaks.com/ai-content-detector .Publicité
-
Des phrases invraisemblables ou inexactes. ChatGPT, Google Bard et d’autres robots conversationnels intelligents (chatbots) sont connus pour produire des phrases bizarres ou inventer des faits [9] X Source de recherche . Il est vrai que les étudiants et les personnes qui postulent à un emploi peuvent faire des erreurs, mais celles des robots d’IA donnent l’impression d’être difficilement reconnaissables. De plus, ChatGPT a une connaissance limitée des évènements survenus après 2021. Par conséquent, il ne peut pas vous proposer des informations crédibles sur des évènements actuels [10] X Source de recherche . Si un texte vous semble très bien rédigé, mais il contient de fausses informations, il pourrait être généré par un robot.
- Si vous évaluez un texte, faites une recherche sur Internet à propos de quelques faits tirés du texte en question. Dans ce but, choisissez des éléments faciles à contrôler, comme des dates et des faits précis.
-
La vigilance reste la règle. Bien qu’elles vous semblent correctes, certaines phrases sont au fond dépourvues de sens. ChatGPT peut produire des phrases élégantes et grammaticalement parfaites, mais qui manquent de sens. En effet, ce robot place les bons mots aux bons endroits, mais il ne fait pas la différence entre le vrai et le faux. Si vous lisez une phrase qui vous parait bien construite, mais dont vous ne comprenez pas la signification, il est fort possible que le travail ait été réalisé par un robot.
-
L’emploi de certaines expressions. Vous pouvez rencontrer des termes comme « premièrement », « deuxièmement », « donc » et « en conclusion ». Ce sont des mots qui sont aussi employés par les élèves dans leurs productions écrites. Cependant, vous les verrez presque toujours dans ChatGPT. Si un texte inclut ces termes, certains outils de détection d’IA le classeront comme produit par un robot même s’il a été rédigé par un humain.
-
Des sources fausses ou inexistantes. En fait, la version de ChatGPT intégrée à Bing cite systématiquement les sources. Cependant, la version standard tend plutôt à inventer des sources farfelues [11] X Source fiable PubMed Central Aller sur la page de la source . Si vous évaluez une dissertation en tant qu’enseignant, ou si vous utilisez ChatGPT pour trouver des sources, vérifiez celles qu’il vous fournit et vérifiez qu’elles existent vraiment.
-
Des descriptions insuffisantes ou des mots peu usités. Les robots comme ChatGPT prédisent le mot suivant dans une phrase. Par conséquent, de nombreux termes sont imprécis, comme « on », « des » ou « ils ». De plus, ChatGPT utilise peu d’expressions pour les descriptions. Donc, un manque de langage descriptif coïncide habituellement avec un texte écrit par ChatGPT [12] X Source de recherche .
-
L’absence de fautes de grammaire ou d’orthographe. Généralement, les étudiants, les demandeurs d’emploi et les auteurs s’efforcent de corriger toutes les fautes de grammaire ou d’orthographe avant de remettre leur travail. Mais souvent, ils oublient de corriger certaines erreurs. Par contre, les ordinateurs produisent un texte sans aucune erreur de grammaire, même si l’écriture manque parfois de sens.
-
En cas de doute, demandez à ChatGPT de rédiger un contenu similaire. Il suffit de vous connecter et de demander au robot de refaire le travail en lui fournissant les mots-clés du texte à vérifier. Si le texte de ChatGPT a la même structure que le contenu que vous évaluez, il est fort possible que l’auteur ait produit son contenu avec ChatGPT.
- Par exemple, supposez que vous voulez savoir si une lettre de motivation a été produite par une machine. Vous pourrez demander à ChatGPT d’en écrire une pour postuler à un emploi de concepteur de logiciels débutant à la société X. Dites-lui d'expliquer que vous avez obtenu un diplôme en informatique de Rutgers, que vous aimez JavaScript et Ruby et que vous travaillez dans un café depuis un an.
- ChatGPT est conversationnel, vous pouvez donc fournir plus d’informations. Par exemple, demandez-lui d'ajouter quelque chose à votre lettre pour expliquer que la pandémie vous a empêché(e) de commencer à travailler dès la fin de vos études.
Publicité
Conseils
- Les chercheurs de Cornell ont trouvé que les humains pensent à tort que les articles de presse produits par l’intelligence artificielle sont crédibles dans plus de 60 % des cas [13] X Source de recherche .
- Si un outil de détection ChatGPT identifie un contenu comme étant produit par un robot, vérifiez d’abord qu’il ne s’agit pas d’un faux positif avant de le signaler à l’auteur.
- Si vous soupçonnez qu’un auteur a rédigé un texte avec ChatGPT, vous pouvez en parler avec l’auteur. Ne l’accusez pas d’emblée d’avoir utilisé ChatGPT, mais posez-lui des questions sur le texte pour vérifier que ses réponses reflètent bien le contenu qu’il a proposé. Demandez-lui aussi des informations sur sa façon de rédiger et regardez s’il est favorable à l’emploi de robots pour produire du contenu.
- La plupart des outils de détection de ChatGPT peuvent aussi reconnaitre des contenus rédigés par d’autres modèles linguistiques, notamment LLaMA, GPT-2 et GPT-4.
- Testez votre aptitude à reconnaitre des textes écrits par un robot conversationnel comme des recettes, des articles, des nouvelles ou des discours en jouant au vrai ou au faux sur https://roft.io (en anglais). Vous pouvez aussi évaluer vos connaissances en matière d’IA en visitant https://blogue.genium360.ca/article/professionnel/quiz-ia-etes-vous-vraiment-un-expert-en-intelligence-artificielle/ .
Références
- ↑ https://www.turnitin.com/blog/ai-writing-the-challenge-and-opportunity-in-front-of-education-now
- ↑ https://www.turnitin.com/blog/understanding-false-positives-within-our-ai-writing-detection-capabilities
- ↑ https://platform.openai.com/docs/chatgpt-education
- ↑ https://platform.openai.com/ai-text-classifier
- ↑ https://www.npr.org/2023/01/09/1147549845/gptzero-ai-chatgpt-edward-tian-plagiarism
- ↑ https://app.gptzero.me/app/subscription-plans
- ↑ https://contentatscale.ai/ai-content-detector/
- ↑ https://copyleaks.com/api-pricing
- ↑ https://research.google/pubs/pub51844/