Sélection globale de segments pour la reconnaissance d'entités nommées
1 : Laboratoire d'Informatique de Paris-Nord
* : Auteur correspondant
Centre National de la Recherche Scientifique, Université Sorbonne Paris nord, Centre National de la Recherche Scientifique : UMR7030
La reconnaissance d'entités nommées est une tâche importante en traitement automatique du langage naturel avec des applications dans de nombreux domaines. Dans cet article, nous décrivons une nouvelle approche pour la reconnaissance d'entités nommées, dans laquelle nous produisons un ensemble de segmentations en maximisant un score global. Pendant l'entraînement, nous optimisons notre modèle en maximisant la probabilité de la segmentation correcte. Pendant l'inférence, nous utilisons la programmation dynamique pour sélectionner la meilleure segmentation avec une complexité linéaire. Nous prouvons que notre approche est supérieure aux modèles champs de Markov conditionnels et semi-CMC pour la reconnaissance d'entités nommées.