@inproceedings{arnold-etal-2022-extraction,
title = "Extraction d`informations de messages a{\'e}ronautiques ({NOTAM}s) avec des mod{\`e}les de langue appris de fa{\c{c}}on auto-supervis{\'e}e (Information extraction from aeronautical messages )",
author = "Arnold, Alexandre and
Ernez, Fares and
Kobus, Catherine and
Martin, Marion-C{\'e}cile",
editor = "Est{\`e}ve, Yannick and
Jim{\'e}nez, Tania and
Parcollet, Titouan and
Zanon Boito, Marcely",
booktitle = "Actes de la 29e Conf{\'e}rence sur le Traitement Automatique des Langues Naturelles. Volume 1 : conf{\'e}rence principale",
month = "6",
year = "2022",
address = "Avignon, France",
publisher = "ATALA",
url = "https://aclanthology.org/2022.jeptalnrecital-taln.33/",
pages = "335--344",
language = "fra",
abstract = "Avant un vol, les pilotes de ligne doivent lire une longue liste de messages appel{\'e}s NOTAM (pour NOtice To AirMen) donnant des informations sur des al{\'e}as potentiels le long du vol. Ces messages suivent une grammaire particuli{\`e}re, contiennent beaucoup d`acronymes et un vocabulaire sp{\'e}cifique a{\'e}ronautique. Dans cet article, un mod{\`e}le de langue de type BERT est pr{\'e}-entra{\^i}n{\'e} sur un grand nombre de ces messages ; il est ensuite affin{\'e} sur trois t{\^a}ches : l`estimation de criticit{\'e}, la reconnaissance d`entit{\'e}s nomm{\'e}es et la traduction vers un langage structur{\'e} appel{\'e} Airlang. L`apprentissage auto-supervis{\'e}, permettant de tirer parti du vaste nombre de donn{\'e}es non annot{\'e}es, est particuli{\`e}rement int{\'e}ressant dans le domaine a{\'e}ronautique, pour lequel les annotations sont tr{\`e}s co{\^u}teuses car n{\'e}cessitant une forte expertise. Nous montrons les r{\'e}sultats encourageants sur les trois t{\^a}ches."
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="arnold-etal-2022-extraction">
<titleInfo>
<title>Extraction d‘informations de messages aéronautiques (NOTAMs) avec des modèles de langue appris de façon auto-supervisée (Information extraction from aeronautical messages )</title>
</titleInfo>
<name type="personal">
<namePart type="given">Alexandre</namePart>
<namePart type="family">Arnold</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Fares</namePart>
<namePart type="family">Ernez</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Catherine</namePart>
<namePart type="family">Kobus</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Marion-Cécile</namePart>
<namePart type="family">Martin</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2022-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">fra</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la 29e Conférence sur le Traitement Automatique des Langues Naturelles. Volume 1 : conférence principale</title>
</titleInfo>
<name type="personal">
<namePart type="given">Yannick</namePart>
<namePart type="family">Estève</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Tania</namePart>
<namePart type="family">Jiménez</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Titouan</namePart>
<namePart type="family">Parcollet</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Marcely</namePart>
<namePart type="family">Zanon Boito</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA</publisher>
<place>
<placeTerm type="text">Avignon, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Avant un vol, les pilotes de ligne doivent lire une longue liste de messages appelés NOTAM (pour NOtice To AirMen) donnant des informations sur des aléas potentiels le long du vol. Ces messages suivent une grammaire particulière, contiennent beaucoup d‘acronymes et un vocabulaire spécifique aéronautique. Dans cet article, un modèle de langue de type BERT est pré-entraîné sur un grand nombre de ces messages ; il est ensuite affiné sur trois tâches : l‘estimation de criticité, la reconnaissance d‘entités nommées et la traduction vers un langage structuré appelé Airlang. L‘apprentissage auto-supervisé, permettant de tirer parti du vaste nombre de données non annotées, est particulièrement intéressant dans le domaine aéronautique, pour lequel les annotations sont très coûteuses car nécessitant une forte expertise. Nous montrons les résultats encourageants sur les trois tâches.</abstract>
<identifier type="citekey">arnold-etal-2022-extraction</identifier>
<location>
<url>https://aclanthology.org/2022.jeptalnrecital-taln.33/</url>
</location>
<part>
<date>2022-6</date>
<extent unit="page">
<start>335</start>
<end>344</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Extraction d‘informations de messages aéronautiques (NOTAMs) avec des modèles de langue appris de façon auto-supervisée (Information extraction from aeronautical messages )
%A Arnold, Alexandre
%A Ernez, Fares
%A Kobus, Catherine
%A Martin, Marion-Cécile
%Y Estève, Yannick
%Y Jiménez, Tania
%Y Parcollet, Titouan
%Y Zanon Boito, Marcely
%S Actes de la 29e Conférence sur le Traitement Automatique des Langues Naturelles. Volume 1 : conférence principale
%D 2022
%8 June
%I ATALA
%C Avignon, France
%G fra
%F arnold-etal-2022-extraction
%X Avant un vol, les pilotes de ligne doivent lire une longue liste de messages appelés NOTAM (pour NOtice To AirMen) donnant des informations sur des aléas potentiels le long du vol. Ces messages suivent une grammaire particulière, contiennent beaucoup d‘acronymes et un vocabulaire spécifique aéronautique. Dans cet article, un modèle de langue de type BERT est pré-entraîné sur un grand nombre de ces messages ; il est ensuite affiné sur trois tâches : l‘estimation de criticité, la reconnaissance d‘entités nommées et la traduction vers un langage structuré appelé Airlang. L‘apprentissage auto-supervisé, permettant de tirer parti du vaste nombre de données non annotées, est particulièrement intéressant dans le domaine aéronautique, pour lequel les annotations sont très coûteuses car nécessitant une forte expertise. Nous montrons les résultats encourageants sur les trois tâches.
%U https://aclanthology.org/2022.jeptalnrecital-taln.33/
%P 335-344
Markdown (Informal)
[Extraction d’informations de messages aéronautiques (NOTAMs) avec des modèles de langue appris de façon auto-supervisée (Information extraction from aeronautical messages )](https://aclanthology.org/2022.jeptalnrecital-taln.33/) (Arnold et al., JEP/TALN/RECITAL 2022)
ACL