Knowledge-based Entity Linking in Heterogeneous Knowledge Graphs at Web-Scale - Laboratoire Interdisciplinaire des Sciences du Numérique Accéder directement au contenu
Rapport Année : 2022

Knowledge-based Entity Linking in Heterogeneous Knowledge Graphs at Web-Scale

Liage d'entités fondé sur les connaissances dans les graphes de connaissances hétérogènes à l'échelle du Web

Résumé

In this master thesis work we were able to define a new property alignment technique that not only relies on NLPs techniques to find similarity among labels and descriptions of these properties but also on their ranges and domains to compute similarity scores. Then using an existing method of key discovery, we were able to develop a new entity alignment technique that first aligns the properties of the two graphs, then uses keys to discover which properties are useful to detect identity relations in the two graphs and finally compare the values to create SameAs link between entities of the two graphs. In order to allow an efficient and incremental entity linking at web scale, we have built a catalog that stores the descriptions of the properties of N ontologies and the property alignments between these N ontologies as well as the keys that were discovered in each graph. Moreover, we have also designed several use cases of how the catalog can be used for entity linking, multi-lingual alignments as well as aligning properties from multiple graphs. Finally, in order to evaluate the performances of our approach, we have conducted several experimental evaluations on real datasets and benchmarks.
Dans ce rapport de thèse de master, nous avons pu définir une nouvelle méthode d'alignement des propriétés qui s'appuie non seulement sur les techniques NLP pour trouver des similarités entre les étiquettes et les descriptions de ces propriétés, mais aussi sur leurs domaine et leurs co-domaines pour calculer les scores de similarité. Ensuite, en utilisant une méthode existante de découverte de clés, nous avons pu développer une nouvelle technique d'alignement des entités qui aligne d'abord les propriétés des deux graphes, puis utilise des clés pour déterminer quelles propriétés sont utiles pour détecter les relations d'identité dans les deux graphes et enfin comparer les valeurs pour créer un lien SameAs entre les entités des deux graphes. Afin de permettre une mise en relation efficace et incrémentale des entités à l'échelle du web, nous avons construit un catalogue qui stocke les descriptions des propriétés de N ontologies et les alignements de propriétés entre ces N ontologies ainsi que les clés qui ont été découvertes dans chaque graphe. En outre, nous avons conçu plusieurs scenarii d'utilisation du catalogue pour l'établissement de liens entre les entités, les alignements multilingues,, ainsi que l'alignement des propriétés à partir de plusieurs graphes. Enfin, pour évaluer les performances de notre approche, nous avons procédé à plusieurs plusieurs évaluations expérimentales sur des jeux de données réels et de benchmarks.
Fichier non déposé

Dates et versions

hal-04046394 , version 1 (25-03-2023)

Licence

Paternité

Identifiants

  • HAL Id : hal-04046394 , version 1

Citer

Thibaut Soulard. Knowledge-based Entity Linking in Heterogeneous Knowledge Graphs at Web-Scale. Université Paris Saclay. 2022. ⟨hal-04046394⟩
39 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More