Availability of information needed to evaluate algorithmic fairness — A systematic review of publicly accessible critical care databases - 21/09/23

Doi : 10.1016/j.accpm.2023.101248

Nicholas Fong ^a,^b, Erica Langnas ^a,^c,^e, Tyler Law ^a,^e, Mallika Reddy ^d, Michael Lipnick ^a,^e, Romain Pirracchio ^a,^d,^⁎
^a Department of Anesthesia and Perioperative Medicine, Zuckerberg San Francisco General Hospital and Trauma Center, University of California San Francisco, San Francisco, CA, United States
^b School of Medicine, University of California San Francisco, San Francisco, CA, United States
^c Philip R. Lee Institute for Health Policy Studies at UCSF, San Francisco, CA, United States
^d Division of Biostatistics, School of Public Health, University of California Berkeley, Berkeley, CA, United States
^e Center for Health Equity in Surgery and Anesthesia University of California San Francisco, San Francisco, CA, United States

^⁎Corresponding author at: Department of Anesthesia and Perioperative Medicine, Zuckerberg San Francisco General Hospital and Trauma Center, 1001 Potrero Avenue, San Francisco, CA 94910, United States.Department of Anesthesia and Perioperative MedicineZuckerberg San Francisco General Hospital and Trauma Center1001 Potrero AvenueSan FranciscoCA94910United States

Abstract

Background

Machine learning (ML) may improve clinical decision-making in critical care settings, but intrinsic biases in datasets can introduce bias into predictive models. This study aims to determine if publicly available critical care datasets provide relevant information to identify historically marginalized populations.

Method

We conducted a review to identify the manuscripts that report the training/validation of ML algorithms using publicly accessible critical care electronic medical record (EMR) datasets. The datasets were reviewed to determine if the following 12 variables were available: age, sex, gender identity, race and/or ethnicity, self-identification as an indigenous person, payor, primary language, religion, place of residence, education, occupation, and income.

Results

7 publicly available databases were identified. Medical Information Mart for Intensive Care (MIMIC) reports information on 7 of the 12 variables of interest, Sistema de Informação de Vigilância Epidemiológica da Gripe (SIVEP-Gripe) on 7, COVID-19 Mexican Open Repository on 4, and eICU on 4. Other datasets report information on 2 or fewer variables. All 7 databases included information about sex and age. Four databases (57%) included information about whether a patient identified as native or indigenous. Only 3 (43%) included data about race and/or ethnicity. Two databases (29%) included information about residence, and one (14%) included information about payor, language, and religion. One database (14%) included information about education and patient occupation. No databases included information on gender identity and income.

Conclusion

This review demonstrates that critical care publicly available data used to train AI algorithms do not include enough information to properly look for intrinsic bias and fairness issues towards historically marginalized populations.

Le texte complet de cet article est disponible en PDF.

Abbreviations : MIMIC, SIVEP-Gripe, LEOSS, AmsterdamUMCdb, VitalDB

Keywords : Bias, Fairness, Publicly available, Dataset, Machine learning, Artificial Intelligence

Plan

Introduction

Methods

Database identification

Availability of the relevant data

Discussion

Conclusion

Disclosure of interest

Funding

Author contributions

Export

Vol 42 - N° 5

Article 101248- octobre 2023 Retour au numéro

Article précédent

French professional society guidelines on improving patient and planetary health: Liberté, égalité, fraternité… et durabilité!
Forbes McGain, Clifford Shelton, Scott McAlister

| Article suivant

Intensive Care Unit activity in France from the national database between 2013 and 2019: More critically ill patients, shorter stay and lower mortality rate
Nicolas Boulet, Amal Boussere, Myriam Mezzarobba, Mircea T. Sofonea, Didier Payen, Jeffrey Lipman, Kevin B. Laupland, Jordi Rello, Jean-Yves Lefrant, Laurent Muller, Claire Roger, Romain Pirracchio, Thibault Mura, Thierry Boudemaghe

Bienvenue sur EM-consulte, la référence des professionnels de santé.
L’accès au texte intégral de cet article nécessite un abonnement.

Déjà abonné à cette revue ?

connectez-vous ou créez un compte

Availability of information needed to evaluate algorithmic fairness — A systematic review of publicly accessible critical care databases - 21/09/23

Abstract

Background

Method

Results

Conclusion

Plan

Export citations

Fichier

Contenu

Accès rapides

Mon compte

Aide & support

Plateformes Elsevier Masson

Déclaration CNIL