« Machine learning » : bases pour le professionnel en santé au travail et de l'environnement - 16/01/23
Résumé |
Le machine learning est un domaine en pleine expansion, en lien direct avec le développement des grosses bases de données. Ce terme fait référence à des méthodes d'apprentissage automatique, fondées sur des outils mathématiques, pour apprendre à partir des observations, sans modèle explicite. Il existe ainsi différents modèles pouvant permettre des approches moins contraignantes en termes d'hypothèses tout en étant efficace sur de grosses bases de données. L'apprentissage supervisé est un des grands types d'apprentissage sous-jacent aux modèles de machine learning. Les observations sont ici catégorisées, selon une variable qualitative ou continue que l'on souhaite généralement prédire. Le preprocessing ou traitement des données est également une étape incontournable dans l'utilisation de modèles de type machine learning. Il peut permettre de choisir les paramètres de manière à minimiser l'erreur sans tomber dans le surapprentissage. L'objectif de cet article est ici d'expliciter certains termes récurrents dès qu'il est question de machine learning et de présenter quelques modèles courants de façon simplifiée afin de comparer leurs avantages vis-à-vis de méthodes statistiques plus classiques.
Le texte complet de cet article est disponible en PDF.Mots-clés : Machine learning, Deep learning, Massive data, Pathologie professionnelle
Plan
L'annexe indiquée dans ce PDF est présente dans la version étendue de l'article disponible sur www.em-consulte.com/. |
Bienvenue sur EM-consulte, la référence des professionnels de santé.
L’accès au texte intégral de cet article nécessite un abonnement.
Déjà abonné à ce traité ?