Exploitation de différentes approches pour détecter et catégoriser le risque chimique et bactériologique - Laboratoire Interdisciplinaire des Sciences du Numérique Accéder directement au contenu
Communication Dans Un Congrès Année : 2016

Exploitation de différentes approches pour détecter et catégoriser le risque chimique et bactériologique

Résumé

Exploitation of various approaches for automatic detection and categorization of chemical risk Chemical risk corresponds to situations in which chemical products are or can be dangerous for human or animal health, or for environment. Detection of information on risk of chemicals occupies an important place in environmental agencies and researchers. Yet, large amounts of available data and controversies make it difficult to find the relevant information quickly and efficiently. Our objective is to propose an automatic help for the analysis of scientific literature in order to detect sentences indicative of chemical or bacteriological risk. We tackle the task as categorization problem: the sentences are are to be categorized in classes of risk. We use three approaches: rule-based, supervized categorization and information retrieval. The best results are obtained with supervized categorization and information retrieval. According to approaches, the results show up to 0.8 F-measure. MOTS-CLÉS : Risque chimique, catégorisation supervisée, recherche d'information.
Le risque chimique couvre les situations où les produits chimiques sont ou peuvent être dangereux pour la santé humaine, animale et pour l'environnement. La détection des informations qui concernent le risque des substances chimiques occupe une place importante dans des agences environnementales et les chercheurs. Cependant, d'une part la profusion de données et d'autre part les controverses qui les concernent créent une situation où il devient difficile de trouver rapidement et efficacement les informations pertinentes. Notre objectif consiste à proposer une aide automatique pour l'analyse de la littérature scientifique afin de détecter les phrases indicatives du risque que présentent les substances chimiques ou des bactéries. La tâche est abordée comme un problème de catégorisation : il s'agit de catégoriser les phrases des textes dans les classes du risque lié aux substances. Nous utilisons trois approches : à base de règles, par apprentissage supervisé et la recherche d'information. De meilleurs résultats sont obtenus avec l'apprentissage supervisé et la recherche d'information. En fonction des approches, les résultats obtenus montrent jusqu'à 0,8 de F-mesure.
Fichier principal
Vignette du fichier
grabar-TALN2016RISKchim.pdf (169.31 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-01426821 , version 1 (04-01-2017)

Identifiants

  • HAL Id : hal-01426821 , version 1

Citer

Natalia Grabar, Thierry Hamon. Exploitation de différentes approches pour détecter et catégoriser le risque chimique et bactériologique. Risque et TAL, TALN 2016 workshop, Jul 2016, Paris, France. ⟨hal-01426821⟩
351 Consultations
84 Téléchargements

Partager

Gmail Facebook X LinkedIn More