Transformations syntaxiques entre niveaux de simplification dans le corpus Newsela (Syntactic transformations between simplification levels in the Newsela corpus)

Rita Hijazi


Abstract
La simplification de textes est une tâche complexe du traitement automatique des langues. Depuis quelques années, des corpus parallèles de textes originaux et simplifiés sont proposés, permettant d’apprendre différents types d’opérations de simplification à partir de corpus. Dans le but de pouvoir développer et évaluer des systèmes de simplification automatique de textes, cet article s’intéresse au corpus Newsela, un corpus parallèle de textes en langue anglaise avec quatre niveaux de simplification. Nous présentons en détail ce corpus et étudions les différentes transformations caractérisant le passage d’un niveau de simplification à l’autre sur un sous-ensemble de textes, en nous intéressant plus particulièrement aux transformations syntaxiques.
Anthology ID:
2020.jeptalnrecital-recital.11
Volume:
Actes de la 6e conférence conjointe Journées d'Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). Volume 3 : Rencontre des Étudiants Chercheurs en Informatique pour le TAL
Month:
6
Year:
2020
Address:
Nancy, France
Editors:
Christophe Benzitoun, Chloé Braud, Laurine Huber, David Langlois, Slim Ouni, Sylvain Pogodalla, Stéphane Schneider
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA et AFCP
Note:
Pages:
137–150
Language:
French
URL:
https://aclanthology.org/2020.jeptalnrecital-recital.11
DOI:
Bibkey:
Cite (ACL):
Rita Hijazi. 2020. Transformations syntaxiques entre niveaux de simplification dans le corpus Newsela (Syntactic transformations between simplification levels in the Newsela corpus). In Actes de la 6e conférence conjointe Journées d'Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). Volume 3 : Rencontre des Étudiants Chercheurs en Informatique pour le TAL, pages 137–150, Nancy, France. ATALA et AFCP.
Cite (Informal):
Transformations syntaxiques entre niveaux de simplification dans le corpus Newsela (Syntactic transformations between simplification levels in the Newsela corpus) (Hijazi, JEP/TALN/RECITAL 2020)
Copy Citation:
PDF:
https://aclanthology.org/2020.jeptalnrecital-recital.11.pdf