Oublier ce qu’on sait, pour mieux apprendre ce qu’on ne sait pas : une étude sur les contraintes de type dans les modèles CRF

Nicolas Pécheux, Alexandre Allauzen, Thomas Lavergne, Guillaume Wisniewski, François Yvon


Abstract
Quand on dispose de connaissances a priori sur les sorties possibles d’un problème d’étiquetage, il semble souhaitable d’inclure cette information lors de l’apprentissage pour simplifier la tâche de modélisation et accélérer les traitements. Pourtant, même lorsque ces contraintes sont correctes et utiles au décodage, leur utilisation lors de l’apprentissage peut dégrader sévèrement les performances. Dans cet article, nous étudions ce paradoxe et montrons que le manque de contraste induit par les connaissances entraîne une forme de sous-apprentissage qu’il est cependant possible de limiter.
Anthology ID:
2015.jeptalnrecital-long.4
Volume:
Actes de la 22e conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
Month:
June
Year:
2015
Address:
Caen, France
Editors:
Jean-Marc Lecarpentier, Nadine Lucas
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
37–48
Language:
URL:
https://aclanthology.org/2015.jeptalnrecital-long.4
DOI:
Bibkey:
Cite (ACL):
Nicolas Pécheux, Alexandre Allauzen, Thomas Lavergne, Guillaume Wisniewski, and François Yvon. 2015. Oublier ce qu’on sait, pour mieux apprendre ce qu’on ne sait pas : une étude sur les contraintes de type dans les modèles CRF. In Actes de la 22e conférence sur le Traitement Automatique des Langues Naturelles. Articles longs, pages 37–48, Caen, France. ATALA.
Cite (Informal):
Oublier ce qu’on sait, pour mieux apprendre ce qu’on ne sait pas : une étude sur les contraintes de type dans les modèles CRF (Pécheux et al., JEP/TALN/RECITAL 2015)
Copy Citation:
PDF:
https://aclanthology.org/2015.jeptalnrecital-long.4.pdf