5-9 juin 2023 PARIS (France)
Extraction d'entités nommées à partir de descriptions d'espèces
Maya Sahraoui  1, 2@  , Vincent Guigue  3@  , Régine Vignes-Lebbe  4@  , Marc Pignal  4@  
1 : Institut des Systèmes Intelligents et de Robotique
Centre National de la Recherche Scientifique, Sorbonne Université, Centre National de la Recherche Scientifique : UMR7222
2 : Institut de Systématique, Evolution, Biodiversité
Museum National d'Histoire Naturelle, Sorbonne Université, Centre National de la Recherche Scientifique
3 : AgroParisTech
Evry Paris Saclay University
4 : Muséum national d'Histoire naturelle
Sorbonne Universités, UPMC, CNRS

Les descriptions d'espèces contiennent des informations importantes sur les caractéristiques morphologiques des espèces, mais l'extraction de connaissances structurées à partir de ces descriptions est souvent chronophage. Nous proposons un modèle texte-graphe adapté aux descriptions d'espèces en utilisant la reconnaissance d'entités nommées (NER) faiblement supervisée. Après avoir extrait les entités nommées, nous reconstruisons les triplets en utilisant des règles de dépendance pour créer le graphe. Notre méthode permet de comparer différentes espèces sur la base de caractères morphologiques et de relier différentes sources de données. Les résultats de notre étude se concentrent sur notre modèle NER et démontrent qu'il est plus performant que les modèles de référence et qu'il constitue un outil précieux pour la communauté de l'écologie et de la biodiversité.


Personnes connectées : 3 Vie privée
Chargement...