S'abonner

Detecting generative artificial intelligence in scientific articles: Evasion techniques and implications for scientific integrity - 29/11/23

Doi : 10.1016/j.otsr.2023.103706 
Guillaume-Anthony Odri a, b, , Diane Ji Yun Yoon b
a Service de chirurgie orthopédique et traumatologique, centre hospitalier universitaire Lariboisière, 2, rue Ambroise-Paré, 75010 Paris, France 
b Inserm U1132 BIOSCAR, université Paris-Cité, 75010 Paris, France 

Corresponding author at: Service de chirurgie orthopédique et traumatologique, centre hospitalier universitaire Lariboisière, 2, rue Ambroise-Paré, 75010 Paris, France.Service de chirurgie orthopédique et traumatologique, centre hospitalier universitaire Lariboisière2, rue Ambroise-ParéParis75010France

Bienvenue sur EM-consulte, la référence des professionnels de santé.
Article gratuit.

Connectez-vous pour en bénéficier!

Abstract

Background

Artificial intelligence (AI) tools, although beneficial for data collection and analysis, can also facilitate scientific fraud. AI detectors can help resolve this problem, but their effectiveness depends on their ability to track AI progress. In addition, many methods of evading AI detection exist and their constantly evolving sophistication can make the task more difficult. Thus, from an AI-generated text, we wanted to: (1) evaluate the AI detection sites on a text generated entirely by the AI, (2) test the methods described for evading AI detection, and (3) evaluate the effectiveness of these methods to evade AI detection on the sites tested previously.

Hypothesis

Not all AI detection tools are equally effective in detecting AI-generated text and some techniques used to evade AI detection can make an AI-produced text almost undetectable.

Materials and methods

We created a text with ChatGPT-4 (Chat Generative Pre-trained Transformer) and submitted it to 11 AI detection web tools (Originality, ZeroGPT, Writer, Copyleaks, Crossplag, GPTZero, Sapling, Content at scale, Corrector, Writefull et Quill), before and after applying strategies to minimise AI detection. The strategies used to minimize AI detection were the improvement of command messages in ChatPGT, the introduction of minor grammatical errors such as comma deletion, paraphrasing, and the substitution of Latin letters with similar Cyrillic letters (а and о) which is also a method used elsewhere to evade the detection of plagiarism. We have also tested the effectiveness of these tools in correctly identifying a scientific text written by a human in 1960.

Results

From the initial text generated by the AI, 7 of the 11 detectors concluded that the text was mainly written by humans. Subsequently, the introduction of simple modifications, such as the removal of commas or paraphrasing can effectively reduce AI detection and make the text appear human for all detectors. In addition, replacing certain Latin letters with Cyrillic letters can make an AI text completely undetectable. Finally, we observe that in a paradoxical way, certain sites detect a significant proportion of AI in a text written by a human in 1960.

Discussion

AI detectors have low efficiency, and simple modifications can allow even the most robust detectors to be easily bypassed. The rapid development of generative AI raises questions about the future of scientific writing but also about the detection of scientific fraud, such as data fabrication.

Level of evidence

III Control case study.

Le texte complet de cet article est disponible en PDF.

Keywords : Generative artificial intelligence, Academic writing, Scientific fraud


Plan


© 2023  Elsevier Masson SAS. Tous droits réservés.
Ajouter à ma bibliothèque Retirer de ma bibliothèque Imprimer
Export

    Export citations

  • Fichier

  • Contenu

Vol 109 - N° 8

Article 103706- décembre 2023 Retour au numéro
Article précédent Article précédent
  • What is the rate of text generated by artificial intelligence over a year of publication in Orthopedics & Traumatology: Surgery & Research? Analysis of 425 articles before versus after the launch of ChatGPT in November 2022
  • Théophile Bisi, Anthony Risser, Philippe Clavert, Henri Migaud, Julien Dartus
| Article suivant Article suivant
  • Bibliometric evaluation of negative publications from orthopedics and traumatology from the ten most influential journals of 2009–2010 and 2019–2020: A comparative study with the “Orthopedics & Traumatology: Surgery & Research” journal, using the same analysis of submitted and accepted articles
  • Martin Bauters, Patrick Devos, Etienne L. Belzile, Sophie Putman, Henri Migaud, Julien Dartus

Bienvenue sur EM-consulte, la référence des professionnels de santé.

Mon compte


Plateformes Elsevier Masson

Déclaration CNIL

EM-CONSULTE.COM est déclaré à la CNIL, déclaration n° 1286925.

En application de la loi nº78-17 du 6 janvier 1978 relative à l'informatique, aux fichiers et aux libertés, vous disposez des droits d'opposition (art.26 de la loi), d'accès (art.34 à 38 de la loi), et de rectification (art.36 de la loi) des données vous concernant. Ainsi, vous pouvez exiger que soient rectifiées, complétées, clarifiées, mises à jour ou effacées les informations vous concernant qui sont inexactes, incomplètes, équivoques, périmées ou dont la collecte ou l'utilisation ou la conservation est interdite.
Les informations personnelles concernant les visiteurs de notre site, y compris leur identité, sont confidentielles.
Le responsable du site s'engage sur l'honneur à respecter les conditions légales de confidentialité applicables en France et à ne pas divulguer ces informations à des tiers.


Tout le contenu de ce site: Copyright © 2025 Elsevier, ses concédants de licence et ses contributeurs. Tout les droits sont réservés, y compris ceux relatifs à l'exploration de textes et de données, a la formation en IA et aux technologies similaires. Pour tout contenu en libre accès, les conditions de licence Creative Commons s'appliquent.