@inproceedings{randriatsitohaina-hamon-2020-identification,
title = "Identification des probl{\`e}mes d`annotation pour l`extraction de relations (Identification of annotation problem for the relation extraction)",
author = "Randriatsitohaina, Tsanta and
Hamon, Thierry",
editor = "Benzitoun, Christophe and
Braud, Chlo{\'e} and
Huber, Laurine and
Langlois, David and
Ouni, Slim and
Pogodalla, Sylvain and
Schneider, St{\'e}phane",
booktitle = "Actes de la 6e conf{\'e}rence conjointe Journ{\'e}es d'{\'E}tudes sur la Parole (JEP, 33e {\'e}dition), Traitement Automatique des Langues Naturelles (TALN, 27e {\'e}dition), Rencontre des {\'E}tudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (R{\'E}CITAL, 22e {\'e}dition). Volume 2 : Traitement Automatique des Langues Naturelles",
month = "6",
year = "2020",
address = "Nancy, France",
publisher = "ATALA et AFCP",
url = "https://aclanthology.org/2020.jeptalnrecital-taln.32/",
pages = "323--331",
language = "fra",
abstract = "L`annotation d`un corpus est une t{\^a}che difficile et laborieuse, notamment sur des textes de sp{\'e}cialit{\'e} comme les textes biom{\'e}dicaux. Ainsi, dans un contexte comme l`extraction des interactions alimentm{\'e}dicament (FDI), l`annotation du corpus POMELO a {\'e}t{\'e} r{\'e}alis{\'e}e par un seul annotateur et pr{\'e}sente des risques d`erreur. Dans cet article, nous proposons d`identifier ces probl{\`e}mes d`annotation en utilisant un corpus Silver Standard (CSS) que nous {\'e}tablissons {\`a} partir d`un vote majoritaire parmi les annotations propos{\'e}es par des mod{\`e}les entra{\^i}n{\'e}s sur un domaine similaire (interaction m{\'e}dicamentm{\'e}dicament {--} DDI) et l`annotation manuelle {\`a} {\'e}valuer. Les r{\'e}sultats obtenus montrent que l`annotation dans POMELO est consid{\'e}rablement {\'e}loign{\'e}e du CSS. L`analyse des erreurs permet d`en identifier les principales causes et de proposer des solutions pour corriger l`annotation existante."
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="randriatsitohaina-hamon-2020-identification">
<titleInfo>
<title>Identification des problèmes d‘annotation pour l‘extraction de relations (Identification of annotation problem for the relation extraction)</title>
</titleInfo>
<name type="personal">
<namePart type="given">Tsanta</namePart>
<namePart type="family">Randriatsitohaina</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Thierry</namePart>
<namePart type="family">Hamon</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2020-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">fra</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la 6e conférence conjointe Journées d’Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). Volume 2 : Traitement Automatique des Langues Naturelles</title>
</titleInfo>
<name type="personal">
<namePart type="given">Christophe</namePart>
<namePart type="family">Benzitoun</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Chloé</namePart>
<namePart type="family">Braud</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Laurine</namePart>
<namePart type="family">Huber</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">David</namePart>
<namePart type="family">Langlois</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Slim</namePart>
<namePart type="family">Ouni</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Sylvain</namePart>
<namePart type="family">Pogodalla</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Stéphane</namePart>
<namePart type="family">Schneider</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA et AFCP</publisher>
<place>
<placeTerm type="text">Nancy, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>L‘annotation d‘un corpus est une tâche difficile et laborieuse, notamment sur des textes de spécialité comme les textes biomédicaux. Ainsi, dans un contexte comme l‘extraction des interactions alimentmédicament (FDI), l‘annotation du corpus POMELO a été réalisée par un seul annotateur et présente des risques d‘erreur. Dans cet article, nous proposons d‘identifier ces problèmes d‘annotation en utilisant un corpus Silver Standard (CSS) que nous établissons à partir d‘un vote majoritaire parmi les annotations proposées par des modèles entraînés sur un domaine similaire (interaction médicamentmédicament – DDI) et l‘annotation manuelle à évaluer. Les résultats obtenus montrent que l‘annotation dans POMELO est considérablement éloignée du CSS. L‘analyse des erreurs permet d‘en identifier les principales causes et de proposer des solutions pour corriger l‘annotation existante.</abstract>
<identifier type="citekey">randriatsitohaina-hamon-2020-identification</identifier>
<location>
<url>https://aclanthology.org/2020.jeptalnrecital-taln.32/</url>
</location>
<part>
<date>2020-6</date>
<extent unit="page">
<start>323</start>
<end>331</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Identification des problèmes d‘annotation pour l‘extraction de relations (Identification of annotation problem for the relation extraction)
%A Randriatsitohaina, Tsanta
%A Hamon, Thierry
%Y Benzitoun, Christophe
%Y Braud, Chloé
%Y Huber, Laurine
%Y Langlois, David
%Y Ouni, Slim
%Y Pogodalla, Sylvain
%Y Schneider, Stéphane
%S Actes de la 6e conférence conjointe Journées d’Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). Volume 2 : Traitement Automatique des Langues Naturelles
%D 2020
%8 June
%I ATALA et AFCP
%C Nancy, France
%G fra
%F randriatsitohaina-hamon-2020-identification
%X L‘annotation d‘un corpus est une tâche difficile et laborieuse, notamment sur des textes de spécialité comme les textes biomédicaux. Ainsi, dans un contexte comme l‘extraction des interactions alimentmédicament (FDI), l‘annotation du corpus POMELO a été réalisée par un seul annotateur et présente des risques d‘erreur. Dans cet article, nous proposons d‘identifier ces problèmes d‘annotation en utilisant un corpus Silver Standard (CSS) que nous établissons à partir d‘un vote majoritaire parmi les annotations proposées par des modèles entraînés sur un domaine similaire (interaction médicamentmédicament – DDI) et l‘annotation manuelle à évaluer. Les résultats obtenus montrent que l‘annotation dans POMELO est considérablement éloignée du CSS. L‘analyse des erreurs permet d‘en identifier les principales causes et de proposer des solutions pour corriger l‘annotation existante.
%U https://aclanthology.org/2020.jeptalnrecital-taln.32/
%P 323-331
Markdown (Informal)
[Identification des problèmes d’annotation pour l’extraction de relations (Identification of annotation problem for the relation extraction)](https://aclanthology.org/2020.jeptalnrecital-taln.32/) (Randriatsitohaina & Hamon, JEP/TALN/RECITAL 2020)
ACL