Cartolabe, un système d’information par apprentissage automatique - Laboratoire Interdisciplinaire des Sciences du Numérique Access content directly
Preprints, Working Papers, ... Year :

Cartolabe, un système d’information par apprentissage automatique

Abstract

We describe CARTOLABE, a web-based multi-scale system for visualizing and exploring large textual corpora based on topics, introducing a novel mechanism for the progressive visualization of filtering queries. CARTOLABE is made of two modules: the first relies on Natural Language Processing methods, converting a corpus and its entities (documents, authors, concepts) into high-dimensional vectors, computing their projection on the 2D plane, and extracting meaningful labels for regions of the plane. The second module is a Web-based visualization, displaying tiles computed from the multidimensional projection of the corpus using the UMAP projection method. This visualization module aims at enabling users with no expertise in visualization and data analysis to get an overview of their corpus, and to interact with it: exploring, querying, filtering, panning and zooming on regions of semantic interest.
Cartolabe permet de visualiser le contenu d'un grand ensemble de documents. Une de ses fonctionalités est de représenter les compétences d'un ensemble de personnes en s'appuyant sur leurs articles scientifiques (ou autres documents disponibles). Cartolabe crée une distance ou similarité entre documents, permettant de projeter les documents proches sur des points proches de la carte. Cartolabe intègre aussi des données de plus haut niveau (auteurs, institutions, laboratoires) et les place dans la même carte. Il génère aussi automatiquement un clustering de thématiques afin de nommer des régions. En donnant une vue d’ensemble, les institutionnels, les industriels ou les scientifiques l’utilisent pour des recherches d’interlocuteurs, d’experts ou des identifications de couvertures thématiques.
Fichier principal
Vignette du fichier
CartolabeHceres.pdf (2.65 Mo) Télécharger le fichier
Origin : Files produced by the author(s)

Dates and versions

hal-03248104 , version 1 (03-06-2021)

Identifiers

  • HAL Id : hal-03248104 , version 1

Cite

Anne-Catherine Letournel, Philippe Caillou, Jean-Daniel Fekete, Jonas Renault, Michèle Sebag. Cartolabe, un système d’information par apprentissage automatique. 2018. ⟨hal-03248104⟩
98 View
27 Download

Share

Gmail Facebook Twitter LinkedIn More