S'abonner

Détection d’intelligence artificielle générative dans les articles scientifiques : techniques d’évasion et implications pour l’intégrité scientifique - 28/11/23

Detecting generative artificial intelligence in scientific articles: Evasion techniques and implications for scientific integrity

Doi : 10.1016/j.rcot.2023.10.007 
Guillaume-Anthony Odri a, , b , Diane Ji Yun Yoon b
a Service de chirurgie orthopédique et traumatologique, centre hospitalier universitaire Lariboisière, 2, rue Ambroise-Paré, 75010 Paris, France 
b Inserm U1132 BIOSCAR, université Paris cité, 75010 Paris, France 

Auteur correspondant.

Résumé

Contexte

Les outils d’intelligence artificielle (IA), bien que bénéfiques pour la collecte et l’analyse de données, pourraient également faciliter la fraude scientifique. Les détecteurs d’IA peuvent aider à atténuer ce problème, mais leur efficacité dépend de leur capacité à suivre les progrès de l’IA. De plus, de nombreuses méthodes pour échapper à la détection d’IA existent et leur sophistication en constante évolution rend la tâche encore plus difficile. Ainsi à partir d’un texte généré par l’IA, nous avons souhaité : 1) évaluer les sites de détection d’IA sur un texte généré entièrement par l’IA, 2) tester les méthodes décrites pour échapper à la détection d’IA et 3) évaluer l’efficacité de ces méthodes pour échapper à la détection d’IA sur les sites testés précédemment.

Hypothèse

Tous les sites de détection d’IA n’ont pas la même efficacité pour détecter un texte généré par l’IA et certaines techniques pour échapper à la détection d’IA pourraient rendre un texte produit par IA quasi-indétectable.

Matériel et méthodes

À cette fin nous avons créé un texte avec ChatGPT-4 (Chat Generative Pre-trained Transformer) et l’avons soumis à 11 sites de détection d’IA (Originality, ZeroGPT, Writer, Copyleaks, Crossplag, GPTZero, Sapling, Content at scale, Corrector, Writefull et Quill), avant et après l’application de stratégies pour minimiser la détection d’IA. Les stratégies utilisées pour minimiser la détection d’IA étaient l’amélioration des messages de commande dans ChatPGT, l’introduction d’erreurs grammaticales mineures comme la suppression de virgules, le paraphrasage, et la substitution de lettre latines par des lettres cyrilliques similaires (a et o) qui est aussi une méthode utilisée par ailleurs pour échapper à la détection du plagiat. Nous avons également testé l’efficacité de ces sites à correctement identifier un texte scientifique écrit par un humain en 1960.

Résultats

Sur le texte initial généré par l’IA, 7 des 11 détecteurs concluent à un texte majoritairement écrit par l’humain. Ensuite l’introduction de modifications simples, telles que la suppression de virgules ou le paraphrasage peuvent diminuer efficacement la détection d’IA et rendre le texte humain pour l’ensemble des détecteurs. De plus le remplacement de certaines lettres latines par des lettres cyrilliques peut rendre un texte d’IA totalement indétectable. Enfin nous observons que de manière paradoxale certains sites détectent une proportion importante d’IA dans un texte écrit par un humain.

Discussion

Les détecteurs d’IA ont une efficacité faible et des modifications simples peuvent permettre d’échapper facilement même aux détecteurs les plus robustes. L’évolution rapide de l’IA générative pose des questions sur l’avenir de la rédaction scientifique mais aussi sur la détection de la fraude scientifique telle que la fabrication de données.

Niveau de preuve

III ; étude cas témoin.

Le texte complet de cet article est disponible en PDF.

Mots clés : Intelligence artificielle générative, Publication académique, Fraude scientifique


Plan


 Ne pas utiliser, pour citation, la référence française de cet article, mais celle de l’article original paru dans Orthopaedics & Traumatology: Surgery & Research, en utilisant le DOI ci-dessus.


© 2023  Elsevier Masson SAS. Tous droits réservés.
Ajouter à ma bibliothèque Retirer de ma bibliothèque Imprimer
Export

    Export citations

  • Fichier

  • Contenu

Vol 109 - N° 8

P. 1103-1108 - décembre 2023 Retour au numéro
Article précédent Article précédent
  • Quel est le taux de texte généré par de l’intelligence artificielle sur une année de publication dans Orthopaedics & Traumatology: Surgery & Research ? Analyse de 425 articles avant versus après la mise en ligne de ChatGPT en novembre 2022
  • Théophile Bisi, Anthony Risser, Philippe Clavert, Henri Migaud, Julien Dartus
| Article suivant Article suivant
  • Analyse bibliométrique des articles négatifs publiés dans les dix revues majeures d’orthopédie-traumatologie en 2009–2010 et 2019–2020 : comparaison à Orthopaedics & Traumatology: Surgery & Research avec la même analyse bibliométrique sur les articles soumis et acceptés
  • Martin Bauters, Patrick Devos, Etienne L. Belzile, Sophie Putman, Henri Migaud, Julien Dartus

Bienvenue sur EM-consulte, la référence des professionnels de santé.
L’accès au texte intégral de cet article nécessite un abonnement.

Déjà abonné à cette revue ?

Elsevier s'engage à rendre ses eBooks accessibles et à se conformer aux lois applicables. Compte tenu de notre vaste bibliothèque de titres, il existe des cas où rendre un livre électronique entièrement accessible présente des défis uniques et l'inclusion de fonctionnalités complètes pourrait transformer sa nature au point de ne plus servir son objectif principal ou d'entraîner un fardeau disproportionné pour l'éditeur. Par conséquent, l'accessibilité de cet eBook peut être limitée. Voir plus

Mon compte


Plateformes Elsevier Masson

Déclaration CNIL

EM-CONSULTE.COM est déclaré à la CNIL, déclaration n° 1286925.

En application de la loi nº78-17 du 6 janvier 1978 relative à l'informatique, aux fichiers et aux libertés, vous disposez des droits d'opposition (art.26 de la loi), d'accès (art.34 à 38 de la loi), et de rectification (art.36 de la loi) des données vous concernant. Ainsi, vous pouvez exiger que soient rectifiées, complétées, clarifiées, mises à jour ou effacées les informations vous concernant qui sont inexactes, incomplètes, équivoques, périmées ou dont la collecte ou l'utilisation ou la conservation est interdite.
Les informations personnelles concernant les visiteurs de notre site, y compris leur identité, sont confidentielles.
Le responsable du site s'engage sur l'honneur à respecter les conditions légales de confidentialité applicables en France et à ne pas divulguer ces informations à des tiers.


Tout le contenu de ce site: Copyright © 2026 Elsevier, ses concédants de licence et ses contributeurs. Tout les droits sont réservés, y compris ceux relatifs à l'exploration de textes et de données, a la formation en IA et aux technologies similaires. Pour tout contenu en libre accès, les conditions de licence Creative Commons s'appliquent.