Détection d’intelligence artificielle générative dans les articles scientifiques : techniques d’évasion et implications pour l’intégrité scientifique - 28/11/23

Detecting generative artificial intelligence in scientific articles: Evasion techniques and implications for scientific integrity

Doi : 10.1016/j.rcot.2023.10.007

Guillaume-Anthony Odri ^a,^⁎,^b , Diane Ji Yun Yoon ^b
^a Service de chirurgie orthopédique et traumatologique, centre hospitalier universitaire Lariboisière, 2, rue Ambroise-Paré, 75010 Paris, France
^b Inserm U1132 BIOSCAR, université Paris cité, 75010 Paris, France

^⁎Auteur correspondant.

Résumé

Contexte

Les outils d’intelligence artificielle (IA), bien que bénéfiques pour la collecte et l’analyse de données, pourraient également faciliter la fraude scientifique. Les détecteurs d’IA peuvent aider à atténuer ce problème, mais leur efficacité dépend de leur capacité à suivre les progrès de l’IA. De plus, de nombreuses méthodes pour échapper à la détection d’IA existent et leur sophistication en constante évolution rend la tâche encore plus difficile. Ainsi à partir d’un texte généré par l’IA, nous avons souhaité : 1) évaluer les sites de détection d’IA sur un texte généré entièrement par l’IA, 2) tester les méthodes décrites pour échapper à la détection d’IA et 3) évaluer l’efficacité de ces méthodes pour échapper à la détection d’IA sur les sites testés précédemment.

Hypothèse

Tous les sites de détection d’IA n’ont pas la même efficacité pour détecter un texte généré par l’IA et certaines techniques pour échapper à la détection d’IA pourraient rendre un texte produit par IA quasi-indétectable.

Matériel et méthodes

À cette fin nous avons créé un texte avec ChatGPT-4 (Chat Generative Pre-trained Transformer) et l’avons soumis à 11 sites de détection d’IA (Originality, ZeroGPT, Writer, Copyleaks, Crossplag, GPTZero, Sapling, Content at scale, Corrector, Writefull et Quill), avant et après l’application de stratégies pour minimiser la détection d’IA. Les stratégies utilisées pour minimiser la détection d’IA étaient l’amélioration des messages de commande dans ChatPGT, l’introduction d’erreurs grammaticales mineures comme la suppression de virgules, le paraphrasage, et la substitution de lettre latines par des lettres cyrilliques similaires (a et o) qui est aussi une méthode utilisée par ailleurs pour échapper à la détection du plagiat. Nous avons également testé l’efficacité de ces sites à correctement identifier un texte scientifique écrit par un humain en 1960.

Résultats

Sur le texte initial généré par l’IA, 7 des 11 détecteurs concluent à un texte majoritairement écrit par l’humain. Ensuite l’introduction de modifications simples, telles que la suppression de virgules ou le paraphrasage peuvent diminuer efficacement la détection d’IA et rendre le texte humain pour l’ensemble des détecteurs. De plus le remplacement de certaines lettres latines par des lettres cyrilliques peut rendre un texte d’IA totalement indétectable. Enfin nous observons que de manière paradoxale certains sites détectent une proportion importante d’IA dans un texte écrit par un humain.

Discussion

Les détecteurs d’IA ont une efficacité faible et des modifications simples peuvent permettre d’échapper facilement même aux détecteurs les plus robustes. L’évolution rapide de l’IA générative pose des questions sur l’avenir de la rédaction scientifique mais aussi sur la détection de la fraude scientifique telle que la fabrication de données.

Niveau de preuve

III ; étude cas témoin.

Il testo completo di questo articolo è disponibile in PDF.

Mots clés : Intelligence artificielle générative, Publication académique, Fraude scientifique

Mappa

Introduction

Matériels et méthodes

Matériel

Méthodes

Méthodes d’évaluation

Méthodes statistiques

Résultats

Texte initial écrit par GPT4 (Texte 1)

Texte modifié par ChatGPT selon les recommandations décrites dans le texte produit par ChatGPT4 (texte 2)

Texte 2±introduction de quelques erreurs grammaticales mineures (texte 3)

Texte 3±paraphrasage dans Quillbot (texte 4)

Texte 4±transformation par Cognibypass (texte 5)

Texte 5±introduction de nouvelles erreurs grammaticales supplémentaires (suppressions de virgules et de gérondifs) (texte 6)

Texte 6±remplacement des lettres « a » et « o » latines par les lettres « a » et « o » cyrilliques (texte final, ou texte 7)

Analyse d’un texte d’origine humaine []

Discussion

Conclusion

Déclaration de liens d’intérêts

Financements

Contribution des auteurs

Déclaration usage Ai

☆	Ne pas utiliser, pour citation, la référence française de cet article, mais celle de l’article original paru dans Orthopaedics & Traumatology: Surgery & Research, en utilisant le DOI ci-dessus.

Esportazione

Vol 109 - N° 8

P. 1103-1108 - Dicembre 2023 Ritorno al numero

Articolo precedente

Quel est le taux de texte généré par de l’intelligence artificielle sur une année de publication dans Orthopaedics & Traumatology: Surgery & Research ? Analyse de 425 articles avant versus après la mise en ligne de ChatGPT en novembre 2022
Théophile Bisi, Anthony Risser, Philippe Clavert, Henri Migaud, Julien Dartus

| Articolo seguente

Analyse bibliométrique des articles négatifs publiés dans les dix revues majeures d’orthopédie-traumatologie en 2009–2010 et 2019–2020 : comparaison à Orthopaedics & Traumatology: Surgery & Research avec la même analyse bibliométrique sur les articles soumis et acceptés
Martin Bauters, Patrick Devos, Etienne L. Belzile, Sophie Putman, Henri Migaud, Julien Dartus

Benvenuto su EM|consulte, il riferimento dei professionisti della salute.
L'accesso al testo integrale di questo articolo richiede un abbonamento.

Già abbonato a @@106933@@ rivista ?

connettersi o creare un account

Détection d’intelligence artificielle générative dans les articles scientifiques : techniques d’évasion et implications pour l’intégrité scientifique - 28/11/23

Detecting generative artificial intelligence in scientific articles: Evasion techniques and implications for scientific integrity

Résumé

Contexte

Hypothèse

Matériel et méthodes

Résultats

Discussion

Niveau de preuve

Mappa

Citazioni Export

File

Contenuto

Il mio account

Aide & support

Dichiarazione CNIL