Un traitement hybride du vague textuel : du système expert VAGO à son clone neuronal
1 : Institut Jean-Nicod
CNRS : UMR8129
2 : Ecole Normale Supérieure
ENS Ulm
3 : École des hautes études en sciences sociales
ehess
4 : PSL University
PSL University
5 : IRISA
CNRS : UMR6074
6 : MONDECA
* : Auteur correspondant
sans
L'outil VAGO est un système expert de détection du vague lexical qui mesure aussi le degré de subjectivité du discours, ainsi que son niveau de détail. Dans cet article, nous construisons un clone neuronal de VAGO, fondé sur une architecture de type BERT, entraîné à partir des scores du VAGO symbolique sur un corpus de presse française (FreSaDa). L'analyse qualitative et quantitative montre la fidélité de la version neuronale. En exploitant des outils d'explicabilité (LIME), nous montrons ensuite l'intérêt de cette version neuronale d'une part pour l'enrichissement des lexiques de la version symbolique, et d'autre part pour la production de versions dans d'autres langues.