@inproceedings{mariage-bernard-2004-categorisation,
title = "Cat{\'e}gorisation de patrons syntaxiques par Self Organizing Maps",
author = "Mariage, Jean-Jacques and
Bernard, Gilles",
editor = {Blache, Philippe and
Nguyen, No{\"e}l and
Chenfour, Nouredine and
Rajouani, Abdenbi},
booktitle = "Actes de la 11{\`e}me conf{\'e}rence sur le Traitement Automatique des Langues Naturelles. Articles longs",
month = apr,
year = "2004",
address = "F{\`e}s, Maroc",
publisher = "ATALA",
url = "https://aclanthology.org/2004.jeptalnrecital-long.9/",
pages = "80--89",
language = "fra",
abstract = "Dans cet article, nous pr{\'e}sentons quelques r{\'e}sultats en cat{\'e}gorisation automatique de donn{\'e}es du langage naturel sans recours {\`a} des connaissances pr{\'e}alables. Le syst{\`e}me part d`une liste de formes grammaticales fran{\c{c}}aises et en construit un graphe qui repr{\'e}sente les cha{\^i}nes rencontr{\'e}es dans un corpus de textes de taille raisonnable ; les liens sont pond{\'e}r{\'e}s {\`a} partir de donn{\'e}es statistiques extraites du corpus. Pour chaque cha{\^i}ne de formes grammaticales significative, un vecteur refl{\'e}tant sa distribution est extrait et pass{\'e} {\`a} un r{\'e}seau de neurones de type carte topologique auto-organisatrice. Une fois le processus d`apprentissage termin{\'e}, la carte r{\'e}sultante est convertie en un graphe d'{\'e}tiquettes g{\'e}n{\'e}r{\'e}es automatiquement, utilis{\'e} dans un tagger ou un analyseur de bas niveau. L`algorithme est ais{\'e}ment adaptable {\`a} toute langue dans la mesure o{\`u} il ne n{\'e}cessite qu`une liste de marques grammaticales et un corpus important (plus il est gros, mieux c`est). Il pr{\'e}sente en outre un int{\'e}r{\^e}t suppl{\'e}mentaire qui est son caract{\`e}re dynamique : il est extr{\^e}mement ais{\'e} de recalculer les donn{\'e}es {\`a} mesure que le corpus augmente."
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="mariage-bernard-2004-categorisation">
<titleInfo>
<title>Catégorisation de patrons syntaxiques par Self Organizing Maps</title>
</titleInfo>
<name type="personal">
<namePart type="given">Jean-Jacques</namePart>
<namePart type="family">Mariage</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Gilles</namePart>
<namePart type="family">Bernard</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2004-04</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">fra</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la 11ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs</title>
</titleInfo>
<name type="personal">
<namePart type="given">Philippe</namePart>
<namePart type="family">Blache</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Noël</namePart>
<namePart type="family">Nguyen</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Nouredine</namePart>
<namePart type="family">Chenfour</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Abdenbi</namePart>
<namePart type="family">Rajouani</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA</publisher>
<place>
<placeTerm type="text">Fès, Maroc</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Dans cet article, nous présentons quelques résultats en catégorisation automatique de données du langage naturel sans recours à des connaissances préalables. Le système part d‘une liste de formes grammaticales françaises et en construit un graphe qui représente les chaînes rencontrées dans un corpus de textes de taille raisonnable ; les liens sont pondérés à partir de données statistiques extraites du corpus. Pour chaque chaîne de formes grammaticales significative, un vecteur reflétant sa distribution est extrait et passé à un réseau de neurones de type carte topologique auto-organisatrice. Une fois le processus d‘apprentissage terminé, la carte résultante est convertie en un graphe d’étiquettes générées automatiquement, utilisé dans un tagger ou un analyseur de bas niveau. L‘algorithme est aisément adaptable à toute langue dans la mesure où il ne nécessite qu‘une liste de marques grammaticales et un corpus important (plus il est gros, mieux c‘est). Il présente en outre un intérêt supplémentaire qui est son caractère dynamique : il est extrêmement aisé de recalculer les données à mesure que le corpus augmente.</abstract>
<identifier type="citekey">mariage-bernard-2004-categorisation</identifier>
<location>
<url>https://aclanthology.org/2004.jeptalnrecital-long.9/</url>
</location>
<part>
<date>2004-04</date>
<extent unit="page">
<start>80</start>
<end>89</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Catégorisation de patrons syntaxiques par Self Organizing Maps
%A Mariage, Jean-Jacques
%A Bernard, Gilles
%Y Blache, Philippe
%Y Nguyen, Noël
%Y Chenfour, Nouredine
%Y Rajouani, Abdenbi
%S Actes de la 11ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
%D 2004
%8 April
%I ATALA
%C Fès, Maroc
%G fra
%F mariage-bernard-2004-categorisation
%X Dans cet article, nous présentons quelques résultats en catégorisation automatique de données du langage naturel sans recours à des connaissances préalables. Le système part d‘une liste de formes grammaticales françaises et en construit un graphe qui représente les chaînes rencontrées dans un corpus de textes de taille raisonnable ; les liens sont pondérés à partir de données statistiques extraites du corpus. Pour chaque chaîne de formes grammaticales significative, un vecteur reflétant sa distribution est extrait et passé à un réseau de neurones de type carte topologique auto-organisatrice. Une fois le processus d‘apprentissage terminé, la carte résultante est convertie en un graphe d’étiquettes générées automatiquement, utilisé dans un tagger ou un analyseur de bas niveau. L‘algorithme est aisément adaptable à toute langue dans la mesure où il ne nécessite qu‘une liste de marques grammaticales et un corpus important (plus il est gros, mieux c‘est). Il présente en outre un intérêt supplémentaire qui est son caractère dynamique : il est extrêmement aisé de recalculer les données à mesure que le corpus augmente.
%U https://aclanthology.org/2004.jeptalnrecital-long.9/
%P 80-89
Markdown (Informal)
[Catégorisation de patrons syntaxiques par Self Organizing Maps](https://aclanthology.org/2004.jeptalnrecital-long.9/) (Mariage & Bernard, JEP/TALN/RECITAL 2004)
ACL