5-9 juin 2023 PARIS (France)
Résumé automatique multi-documents guidé par une base de résumés similaires
Florian Baud  1, *@  , Alexandre Aussem  1, *@  
1 : Laboratoire d'Informatique en Image et Systèmes d'information
Université Lumière - Lyon 2, Ecole Centrale de Lyon, Université Claude Bernard Lyon 1, Centre National de la Recherche Scientifique : UMR5205, Institut National des Sciences Appliquées de Lyon, Centre National de la Recherche Scientifique
* : Auteur correspondant

Le résumé multi-documents est une tâche difficile en traitement automatique du langage, ayant pour objectif de résumer les informations de plusieurs documents. Cependant, les documents sources sont souvent insuffisants pour obtenir un résumé qualitatif. Nous proposons un modèle guidé par un système de recherche d'informations combiné avec une mémoire non paramétrique pour la génération de résumés. Ce modèle récupère des candidats pertinents dans une base de données, puis génère le résumé en prenant en compte les candidats avec un mécanisme de copie et les documents sources. Cette mémoire non paramétrique est implémentée avec la recherche approximative des plus proches voisins afin de faire des recherches dans de grandes bases de données. Notre méthode est évalué sur le jeu de données MultiXScience qui regroupe des articles scientifiques. Enfin, nous discutons de nos résultats et des orientations possibles pour de futurs travaux.


Personnes connectées : 2 Vie privée
Chargement...