@inproceedings{drame-etal-2019-indexation,
title = "Indexation et appariement de documents cliniques avec le mod{\`e}le vectoriel (Indexing and matching clinical documents using the vector space model)",
author = "Dram{\'e}, Khadim and
Diop, Ibrahima and
Faty, Lamine and
Ndoye, Birame",
editor = "Morin, Emmanuel and
Rosset, Sophie and
Zweigenbaum, Pierre",
booktitle = "Actes de la Conf{\'e}rence sur le Traitement Automatique des Langues Naturelles (TALN) PFIA 2019. D{\'e}fi Fouille de Textes (atelier TALN-RECITAL)",
month = "7",
year = "2019",
address = "Toulouse, France",
publisher = "ATALA",
url = "https://aclanthology.org/2019.jeptalnrecital-deft.9/",
pages = "91--97",
language = "fra",
abstract = "Dans ce papier, nous pr{\'e}sentons les m{\'e}thodes que nous avons d{\'e}velopp{\'e}es pour participer aux t{\^a}ches 1 et 2 de l'{\'e}dition 2019 du d{\'e}fi fouille de textes (DEFT 2019). Pour la premi{\`e}re t{\^a}che, qui s`int{\'e}resse {\`a} l`indexation de cas cliniques, une m{\'e}thode utilisant la pond{\'e}ration TF-IDF (term frequency {--} inverse document frequency) a {\'e}t{\'e} propos{\'e}e. Quant {\`a} la seconde t{\^a}che, la m{\'e}thode propos{\'e}e repose sur le mod{\`e}le vectoriel pour apparier des discussions aux cas cliniques correspondants ; pour cela, le cosinus est utilis{\'e} comme mesure de similarit{\'e}. L`indexation s{\'e}mantique latente (latent semantic indexing {--} LSI) est {\'e}galement exp{\'e}riment{\'e}e pour {\'e}tendre cette m{\'e}thode. Pour chaque m{\'e}thode, diff{\'e}rentes configurations ont {\'e}t{\'e} test{\'e}es et {\'e}valu{\'e}es sur les donn{\'e}es de test du DEFT 2019."
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="drame-etal-2019-indexation">
<titleInfo>
<title>Indexation et appariement de documents cliniques avec le modèle vectoriel (Indexing and matching clinical documents using the vector space model)</title>
</titleInfo>
<name type="personal">
<namePart type="given">Khadim</namePart>
<namePart type="family">Dramé</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Ibrahima</namePart>
<namePart type="family">Diop</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Lamine</namePart>
<namePart type="family">Faty</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Birame</namePart>
<namePart type="family">Ndoye</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2019-07</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">fra</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la Conférence sur le Traitement Automatique des Langues Naturelles (TALN) PFIA 2019. Défi Fouille de Textes (atelier TALN-RECITAL)</title>
</titleInfo>
<name type="personal">
<namePart type="given">Emmanuel</namePart>
<namePart type="family">Morin</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Sophie</namePart>
<namePart type="family">Rosset</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Pierre</namePart>
<namePart type="family">Zweigenbaum</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA</publisher>
<place>
<placeTerm type="text">Toulouse, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Dans ce papier, nous présentons les méthodes que nous avons développées pour participer aux tâches 1 et 2 de l’édition 2019 du défi fouille de textes (DEFT 2019). Pour la première tâche, qui s‘intéresse à l‘indexation de cas cliniques, une méthode utilisant la pondération TF-IDF (term frequency – inverse document frequency) a été proposée. Quant à la seconde tâche, la méthode proposée repose sur le modèle vectoriel pour apparier des discussions aux cas cliniques correspondants ; pour cela, le cosinus est utilisé comme mesure de similarité. L‘indexation sémantique latente (latent semantic indexing – LSI) est également expérimentée pour étendre cette méthode. Pour chaque méthode, différentes configurations ont été testées et évaluées sur les données de test du DEFT 2019.</abstract>
<identifier type="citekey">drame-etal-2019-indexation</identifier>
<location>
<url>https://aclanthology.org/2019.jeptalnrecital-deft.9/</url>
</location>
<part>
<date>2019-7</date>
<extent unit="page">
<start>91</start>
<end>97</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Indexation et appariement de documents cliniques avec le modèle vectoriel (Indexing and matching clinical documents using the vector space model)
%A Dramé, Khadim
%A Diop, Ibrahima
%A Faty, Lamine
%A Ndoye, Birame
%Y Morin, Emmanuel
%Y Rosset, Sophie
%Y Zweigenbaum, Pierre
%S Actes de la Conférence sur le Traitement Automatique des Langues Naturelles (TALN) PFIA 2019. Défi Fouille de Textes (atelier TALN-RECITAL)
%D 2019
%8 July
%I ATALA
%C Toulouse, France
%G fra
%F drame-etal-2019-indexation
%X Dans ce papier, nous présentons les méthodes que nous avons développées pour participer aux tâches 1 et 2 de l’édition 2019 du défi fouille de textes (DEFT 2019). Pour la première tâche, qui s‘intéresse à l‘indexation de cas cliniques, une méthode utilisant la pondération TF-IDF (term frequency – inverse document frequency) a été proposée. Quant à la seconde tâche, la méthode proposée repose sur le modèle vectoriel pour apparier des discussions aux cas cliniques correspondants ; pour cela, le cosinus est utilisé comme mesure de similarité. L‘indexation sémantique latente (latent semantic indexing – LSI) est également expérimentée pour étendre cette méthode. Pour chaque méthode, différentes configurations ont été testées et évaluées sur les données de test du DEFT 2019.
%U https://aclanthology.org/2019.jeptalnrecital-deft.9/
%P 91-97
Markdown (Informal)
[Indexation et appariement de documents cliniques avec le modèle vectoriel (Indexing and matching clinical documents using the vector space model)](https://aclanthology.org/2019.jeptalnrecital-deft.9/) (Dramé et al., JEP/TALN/RECITAL 2019)
ACL