5-9 juin 2023 PARIS (France)
Intégration de connaissances structurées par synthèse de texte spécialisé
Guilhem Piat  1, 2@  , Ellington Kirby  1@  , Julien Tourille  2@  , Nasredine Semmar  3@  , Alexandre Allauzen  1@  , Hassane Essafi  3@  
1 : Université Paris Dauphine-PSL
Université Paris sciences et lettres
2 : Université Paris-Saclay, CEA, List
Université Paris-Saclay, CEA, List, F-91120, Palaiseau, France
3 : Université Paris-Saclay, CEA, List
Université Paris-Saclay, CEA, List, F-91120, Palaiseau, France

Les modèles de langue de type Transformer peinent à incorporer les modifications ayant pour but d'intégrer des formats de données structurés non-textuels tels que les graphes de connaissances. Les exemples où cette intégration est faite avec succès requièrent généralement que le problème de désambiguïsation d'entités nommées soit résolu en amont, ou bien l'ajout d'une quantité importante de texte d'entraînement, généralement annotée. Ces contraintes rendent l'exploitation de connaissances structurées comme source de données difficile et parfois même contre-productive. Nous cherchons à adapter un modèle de langage au domaine biomédical en l'entraînant sur du texte de synthèse issu d'un graphe de connaissances, de manière à exploiter ces informations dans le cadre d'une modalité maîtrisée par le modèle de langage.


Personnes connectées : 6 Vie privée
Chargement...