S'abonner

Code2vect: An efficient heterogenous data classifier and nonlinear regression technique - 03/12/19

Doi : 10.1016/j.crme.2019.11.002 
Clara Argerich Martín a , Ruben Ibáñez Pinillo a , Anais Barasinski b , Francisco Chinesta c,
a PIMM, Arts et Métiers Institute of Technology, CNRS, CNAM, HESAM University, 151, boulevard de l'Hôpital, 75013 Paris, France 
b University of Pau & Pays Adour, E2S UPPA, IPREM UMR5254, 64000 Pau, France 
c ESI GROUP Chair @ PIMM, Arts et Métiers Institute of Technology, 151, boulevard de l'Hôpital, 75013 Paris, France 

Corresponding author.

Bienvenue sur EM-consulte, la référence des professionnels de santé.
L’accès au texte intégral de cet article nécessite un abonnement.

pages 8
Iconographies 9
Vidéos 0
Autres 0

Abstract

The aim of this paper is to present a new classification and regression algorithm based on Artificial Intelligence. The main feature of this algorithm, which will be called Code2Vect, is the nature of the data to treat: qualitative or quantitative and continuous or discrete. Contrary to other artificial intelligence techniques based on the “Big-Data,” this new approach will enable working with a reduced amount of data, within the so-called “Smart Data” paradigm. Moreover, the main purpose of this algorithm is to enable the representation of high-dimensional data and more specifically grouping and visualizing this data according to a given target. For that purpose, the data will be projected into a vectorial space equipped with an appropriate metric, able to group data according to their affinity (with respect to a given output of interest). Furthermore, another application of this algorithm lies on its prediction capability. As it occurs with most common data-mining techniques such as regression trees, by giving an input the output will be inferred, in this case considering the nature of the data formerly described. In order to illustrate its potentialities, two different applications will be addressed, one concerning the representation of high-dimensional and categorical data and another featuring the prediction capabilities of the algorithm.

Le texte complet de cet article est disponible en PDF.

Keywords : Machine learning, Data representation, Classification, Categorial data, Neural network, High-dimensional data, Regression


Plan


© 2019  Académie des sciences. Publié par Elsevier Masson SAS. Tous droits réservés.
Ajouter à ma bibliothèque Retirer de ma bibliothèque Imprimer
Export

    Export citations

  • Fichier

  • Contenu

Vol 347 - N° 11

P. 754-761 - novembre 2019 Retour au numéro
Article précédent Article précédent
  • Direct numerical simulation of flexible molecules and data-driven molecular conformation
  • Amine Ammar, Francisco Chinesta
| Article suivant Article suivant
  • Real-time Bayesian data assimilation with data selection, correction of model bias, and on-the-fly uncertainty propagation
  • Paul-Baptiste Rubio, Ludovic Chamoin, François Louf

Bienvenue sur EM-consulte, la référence des professionnels de santé.
L’accès au texte intégral de cet article nécessite un abonnement.

Bienvenue sur EM-consulte, la référence des professionnels de santé.
L’achat d’article à l’unité est indisponible à l’heure actuelle.

Déjà abonné à cette revue ?

Mon compte


Plateformes Elsevier Masson

Déclaration CNIL

EM-CONSULTE.COM est déclaré à la CNIL, déclaration n° 1286925.

En application de la loi nº78-17 du 6 janvier 1978 relative à l'informatique, aux fichiers et aux libertés, vous disposez des droits d'opposition (art.26 de la loi), d'accès (art.34 à 38 de la loi), et de rectification (art.36 de la loi) des données vous concernant. Ainsi, vous pouvez exiger que soient rectifiées, complétées, clarifiées, mises à jour ou effacées les informations vous concernant qui sont inexactes, incomplètes, équivoques, périmées ou dont la collecte ou l'utilisation ou la conservation est interdite.
Les informations personnelles concernant les visiteurs de notre site, y compris leur identité, sont confidentielles.
Le responsable du site s'engage sur l'honneur à respecter les conditions légales de confidentialité applicables en France et à ne pas divulguer ces informations à des tiers.


Tout le contenu de ce site: Copyright © 2024 Elsevier, ses concédants de licence et ses contributeurs. Tout les droits sont réservés, y compris ceux relatifs à l'exploration de textes et de données, a la formation en IA et aux technologies similaires. Pour tout contenu en libre accès, les conditions de licence Creative Commons s'appliquent.