An ensemble machine learning-based approach to predict cervical cancer using hybrid feature selection - 15/08/24

Doi : 10.1016/j.neuri.2024.100169 
Khandaker Mohammad Mohi Uddin a, , Abdullah Al Mamun b , Anamika Chakrabarti b , Rafid Mostafiz c , Samrat Kumar Dey d
a Department of Computer Science and Engineering, Southeast University, Bangladesh 
b Department of Computer Science and Engineering, Dhaka International University, Bangladesh 
c Institute of Information Technology, Noakhali Science and Technology University, Bangladesh 
d School of Science and Technology, Bangladesh Open University, Bangladesh 

Corresponding author.

Bienvenue sur EM-consulte, la référence des professionnels de santé.
Article gratuit.

Connectez-vous pour en bénéficier!

Abstract

Cervical cancer has recently emerged as the leading cause of premature death among women. Around 85% of cervical cancer cases occur in underdeveloped countries. There are several risk factors associated with cervical cancer. This study describes a novel predictive model that uses early screening and risk trends from individual health records to forecast cervical cancer patients' prognoses. This study uses machine learning classification techniques to investigate the risk factors for cervical cancer. Additionally, use the voting method to evaluate all models and select the most appropriate model. The dataset used in this study contains missing values and shows a significant imbalance. Thus, the Random Oversampling technique was used as a sampling method. We used Principal Component Analysis (PCA) and XGBoost feature selection techniques to determine the most important features. To predict the accuracy, we used several machine learning classifiers, including Support Vector Machines (SVM), Random Forest (RF), k-nearest Neighbors (KNN), Decision Trees (DT), Naive Bayes (NB), Logistic Regression (LR), AdaBoost (AdB), Gradient Boosting (GB), Multilayer Perceptron (MLP), and Nearest Centroid Classifier (NCC). To demonstrate the efficacy of the suggested model, a comparison of its accuracy, sensitivity, and specificity was performed. We used the Random Oversampling approach along with the Ensemble ML method, hard voting on RF and MLP, and achieved 99.19% accuracy. It is demonstrated that the ensemble ML classifier (hard voting) performs better at handling classification problems when features are decreased and the high-class imbalance problem is handled.

Le texte complet de cet article est disponible en PDF.

Keywords : Cervical cancer, Machine learning, SelectKBest, XGBoost, PCA, Random forest, Multilayer perceptron, Voting classifier


Plan


© 2024  The Author(s). Publié par Elsevier Masson SAS. Tous droits réservés.
Ajouter à ma bibliothèque Retirer de ma bibliothèque Imprimer
Export

    Export citations

  • Fichier

  • Contenu

Vol 4 - N° 3

Article 100169- septembre 2024 Retour au numéro
Article précédent Article précédent
  • Portability rules detection by Epilepsy Tracking META-Set Analysis
  • Christian Riccio, Roberta Siciliano, Michele Staiano, Giuseppe Longo, Luigi Pavone, Gaetano Zazzaro

Bienvenue sur EM-consulte, la référence des professionnels de santé.

Mon compte


Plateformes Elsevier Masson

Déclaration CNIL

EM-CONSULTE.COM est déclaré à la CNIL, déclaration n° 1286925.

En application de la loi nº78-17 du 6 janvier 1978 relative à l'informatique, aux fichiers et aux libertés, vous disposez des droits d'opposition (art.26 de la loi), d'accès (art.34 à 38 de la loi), et de rectification (art.36 de la loi) des données vous concernant. Ainsi, vous pouvez exiger que soient rectifiées, complétées, clarifiées, mises à jour ou effacées les informations vous concernant qui sont inexactes, incomplètes, équivoques, périmées ou dont la collecte ou l'utilisation ou la conservation est interdite.
Les informations personnelles concernant les visiteurs de notre site, y compris leur identité, sont confidentielles.
Le responsable du site s'engage sur l'honneur à respecter les conditions légales de confidentialité applicables en France et à ne pas divulguer ces informations à des tiers.


Tout le contenu de ce site: Copyright © 2024 Elsevier, ses concédants de licence et ses contributeurs. Tout les droits sont réservés, y compris ceux relatifs à l'exploration de textes et de données, a la formation en IA et aux technologies similaires. Pour tout contenu en libre accès, les conditions de licence Creative Commons s'appliquent.