CORIA TALN RJCRI RECITAL 2023

coria-taln-2023 : CORIA TALN RJCRI RECITAL 2023

5-9 juin 2023 PARIS (France)

ATTENTION : Une migration de la base de données est programmée jeudi 21 août.
Elle peut occasionner des problèmes d'accès à Sciencesconf.

sciencesconf.org:coria-taln-2023:461766

Impact de l'apprentissage multi-labels actif appliqué aux transformers

Maxime Arens 1, *, @ , Charles Teissèdre 2, @ , Lucile Callebert 2, @ , Jose G Moreno 1, @ , Mohand Boughanem 1, @

1 : Institut de recherche en informatique de Toulouse

Université Toulouse III - Paul Sabatier

2 : Synapse-Dévelopemment

Synapse-Dévelopemment

* : Auteur correspondant

L'Apprentissage Actif (AA) est largement utilisé en apprentissage automatique afin de réduire l'effort d'annotation. Bien que la plupart des travaux d'AA soient antérieurs aux transformers, le succès récent de ces architectures a conduit la communauté à revisiter l'AA dans le contexte des modèles de langues pré-entraînés.
De plus, le mécanisme de fine-tuning, où seules quelques données annotées sont utilisées pour entraîner le modèle sur une nouvelle tâche, est parfaitement en accord avec l'objectif de l'AA.
Nous proposons d'étudier l'impact de l'AA dans le contexte des transformers pour la tâche de classification multi-labels. Or la plupart des stratégies AA, lorsqu'elles sont appliquées à ces modèles, conduisent à des temps de calcul excessifs, ce qui empêche leur utilisation au cours d'une interaction homme-machine en temps réel. Afin de pallier ce problème, nous utilisons des stratégies d'AA basées sur l'incertitude. L'article compare six stratégies d'AA basées sur l'incertitude dans le contexte des transformers et montre que si deux stratégies améliorent invariablement les performances, les autres ne surpassent pas l'échantillonnage aléatoire. L'étude montre également que les stratégies performantes ont tendance à sélectionner des ensembles d'instances plus diversifiées pour l'annotation.

Type :	:	CORIA - Longs
Langue du texte intégral	:	français
Thématiques	:	CORIA 2
Mots-Clés	:	Apprentissage Actif ; classification multi ; labels ; transformers

Vie privée | Accessibilité