Annotation d’expressions polylexicales verbales en arabe : validation d’une procédure d’annotation multilingue - Information, Langue Ecrite et Signée Accéder directement au contenu
Communication Dans Un Congrès Année : 2022

Annotation d’expressions polylexicales verbales en arabe : validation d’une procédure d’annotation multilingue

Résumé

Cet article décrit nos efforts pour étendre le projet PARSEME à l’arabe standard moderne. L’applicabilité du guide d’annotation de PARSEME a été testée en mesurant l’accord inter-annotateurs dès la première phase d’annotation. Un sous-ensemble de 1062 phrases du Prague Arabic Dependency Treebank (PADT) a été sélectionné et annoté indépendamment par deux locutrices natives arabes. Suite à leurs annotations, un nouveau corpus arabe avec plus de 1250 expressions polylexicales verbales (EPV) annotées a été construit.
Fichier principal
Vignette du fichier
995.pdf (84.84 Ko) Télécharger le fichier
Origine : Fichiers éditeurs autorisés sur une archive ouverte

Dates et versions

hal-03701523 , version 1 (24-06-2022)

Identifiants

  • HAL Id : hal-03701523 , version 1

Citer

Najet Hadj Mohamed, Cherifa Ben Khelil, Agata Savary, Iskander Keskes, Jean Yves Antoine, et al.. Annotation d’expressions polylexicales verbales en arabe : validation d’une procédure d’annotation multilingue. Traitement Automatique des Langues Naturelles, Jun 2022, Avignon, France. pp.280-286. ⟨hal-03701523⟩
163 Consultations
23 Téléchargements

Partager

Gmail Facebook X LinkedIn More