Abbonarsi

Détection d’intelligence artificielle générative dans les articles scientifiques : techniques d’évasion et implications pour l’intégrité scientifique - 28/11/23

Detecting generative artificial intelligence in scientific articles: Evasion techniques and implications for scientific integrity

Doi : 10.1016/j.rcot.2023.10.007 
Guillaume-Anthony Odri a, , b , Diane Ji Yun Yoon b
a Service de chirurgie orthopédique et traumatologique, centre hospitalier universitaire Lariboisière, 2, rue Ambroise-Paré, 75010 Paris, France 
b Inserm U1132 BIOSCAR, université Paris cité, 75010 Paris, France 

Auteur correspondant.

Résumé

Contexte

Les outils d’intelligence artificielle (IA), bien que bénéfiques pour la collecte et l’analyse de données, pourraient également faciliter la fraude scientifique. Les détecteurs d’IA peuvent aider à atténuer ce problème, mais leur efficacité dépend de leur capacité à suivre les progrès de l’IA. De plus, de nombreuses méthodes pour échapper à la détection d’IA existent et leur sophistication en constante évolution rend la tâche encore plus difficile. Ainsi à partir d’un texte généré par l’IA, nous avons souhaité : 1) évaluer les sites de détection d’IA sur un texte généré entièrement par l’IA, 2) tester les méthodes décrites pour échapper à la détection d’IA et 3) évaluer l’efficacité de ces méthodes pour échapper à la détection d’IA sur les sites testés précédemment.

Hypothèse

Tous les sites de détection d’IA n’ont pas la même efficacité pour détecter un texte généré par l’IA et certaines techniques pour échapper à la détection d’IA pourraient rendre un texte produit par IA quasi-indétectable.

Matériel et méthodes

À cette fin nous avons créé un texte avec ChatGPT-4 (Chat Generative Pre-trained Transformer) et l’avons soumis à 11 sites de détection d’IA (Originality, ZeroGPT, Writer, Copyleaks, Crossplag, GPTZero, Sapling, Content at scale, Corrector, Writefull et Quill), avant et après l’application de stratégies pour minimiser la détection d’IA. Les stratégies utilisées pour minimiser la détection d’IA étaient l’amélioration des messages de commande dans ChatPGT, l’introduction d’erreurs grammaticales mineures comme la suppression de virgules, le paraphrasage, et la substitution de lettre latines par des lettres cyrilliques similaires (a et o) qui est aussi une méthode utilisée par ailleurs pour échapper à la détection du plagiat. Nous avons également testé l’efficacité de ces sites à correctement identifier un texte scientifique écrit par un humain en 1960.

Résultats

Sur le texte initial généré par l’IA, 7 des 11 détecteurs concluent à un texte majoritairement écrit par l’humain. Ensuite l’introduction de modifications simples, telles que la suppression de virgules ou le paraphrasage peuvent diminuer efficacement la détection d’IA et rendre le texte humain pour l’ensemble des détecteurs. De plus le remplacement de certaines lettres latines par des lettres cyrilliques peut rendre un texte d’IA totalement indétectable. Enfin nous observons que de manière paradoxale certains sites détectent une proportion importante d’IA dans un texte écrit par un humain.

Discussion

Les détecteurs d’IA ont une efficacité faible et des modifications simples peuvent permettre d’échapper facilement même aux détecteurs les plus robustes. L’évolution rapide de l’IA générative pose des questions sur l’avenir de la rédaction scientifique mais aussi sur la détection de la fraude scientifique telle que la fabrication de données.

Niveau de preuve

III ; étude cas témoin.

Il testo completo di questo articolo è disponibile in PDF.

Mots clés : Intelligence artificielle générative, Publication académique, Fraude scientifique


Mappa


 Ne pas utiliser, pour citation, la référence française de cet article, mais celle de l’article original paru dans Orthopaedics & Traumatology: Surgery & Research, en utilisant le DOI ci-dessus.


© 2023  Elsevier Masson SAS. Tutti i diritti riservati.
Aggiungere alla mia biblioteca Togliere dalla mia biblioteca Stampare
Esportazione

    Citazioni Export

  • File

  • Contenuto

Vol 109 - N° 8

P. 1103-1108 - Dicembre 2023 Ritorno al numero
Articolo precedente Articolo precedente
  • Quel est le taux de texte généré par de l’intelligence artificielle sur une année de publication dans Orthopaedics & Traumatology: Surgery & Research ? Analyse de 425 articles avant versus après la mise en ligne de ChatGPT en novembre 2022
  • Théophile Bisi, Anthony Risser, Philippe Clavert, Henri Migaud, Julien Dartus
| Articolo seguente Articolo seguente
  • Analyse bibliométrique des articles négatifs publiés dans les dix revues majeures d’orthopédie-traumatologie en 2009–2010 et 2019–2020 : comparaison à Orthopaedics & Traumatology: Surgery & Research avec la même analyse bibliométrique sur les articles soumis et acceptés
  • Martin Bauters, Patrick Devos, Etienne L. Belzile, Sophie Putman, Henri Migaud, Julien Dartus

Benvenuto su EM|consulte, il riferimento dei professionisti della salute.
L'accesso al testo integrale di questo articolo richiede un abbonamento.

Già abbonato a @@106933@@ rivista ?

Il mio account


Dichiarazione CNIL

EM-CONSULTE.COM è registrato presso la CNIL, dichiarazione n. 1286925.

Ai sensi della legge n. 78-17 del 6 gennaio 1978 sull'informatica, sui file e sulle libertà, Lei puo' esercitare i diritti di opposizione (art.26 della legge), di accesso (art.34 a 38 Legge), e di rettifica (art.36 della legge) per i dati che La riguardano. Lei puo' cosi chiedere che siano rettificati, compeltati, chiariti, aggiornati o cancellati i suoi dati personali inesati, incompleti, equivoci, obsoleti o la cui raccolta o di uso o di conservazione sono vietati.
Le informazioni relative ai visitatori del nostro sito, compresa la loro identità, sono confidenziali.
Il responsabile del sito si impegna sull'onore a rispettare le condizioni legali di confidenzialità applicabili in Francia e a non divulgare tali informazioni a terzi.


Tutto il contenuto di questo sito: Copyright © 2025 Elsevier, i suoi licenziatari e contributori. Tutti i diritti sono riservati. Inclusi diritti per estrazione di testo e di dati, addestramento dell’intelligenza artificiale, e tecnologie simili. Per tutto il contenuto ‘open access’ sono applicati i termini della licenza Creative Commons.