@inproceedings{li-2003-un,
title = "Un syst{\`e}me de segmentation du chinois bas{\'e} sur des triplets",
author = "Li, Yiping",
editor = "Morin, Emmanuel",
booktitle = "Actes de la 10{\`e}me conf{\'e}rence sur le Traitement Automatique des Langues Naturelles. REncontres jeunes Chercheurs en Informatique pour le Traitement Automatique des Langues (Posters)",
month = jun,
year = "2003",
address = "Batz-sur-Mer, France",
publisher = "ATALA",
url = "https://aclanthology.org/2003.jeptalnrecital-recitalposter.6/",
pages = "533--538",
language = "fra",
abstract = "Un des probl{\`e}mes rencontr{\'e}s lors de l`analyse de textes en chinois est qu`il n`existe pas de s{\'e}parateur entr{\'e} l{\'e}s mots dans cette langue. Le mot {\'e}tant une unit{\'e} linguistique fondamentale en traitement automatique d{\'e} la langue, il est n{\'e}cessaire d`identifier les mots dans un texte chinois afin que des analys{\'e}s de plus haut niveau puissent {\^e}tre r{\'e}alis{\'e}es. Le but de cet article est d{\'e} pr{\'e}senter un syst{\`e}me d`id{\'e}ntification d{\'e}s mots bas{\'e} sur un algorithme utilisant des triplets d{\'e} cat{\'e}gories grammaticales {\'e}t d{\'e}s fr{\'e}quences de mots. C{\'e} syst{\`e}me comprend deux dictionnaires : l`un d{\'e}di{\'e} aux mots {\'e}t {\`a} l{\'e}urs fr{\'e}quences, l`autr{\'e} aux triplets d{\'e}s cat{\'e}gories correspondantes. Les tests qui ont {\'e}t{\'e} effectu{\'e}s r{\'e}v{\`e}lent que 98,5{\%} d{\'e}s phrases sont d{\'e}coup{\'e}es correctement. Certaines erreurs sont du{\'e}s {\`a} la taill{\'e} limit{\'e}e du dictionnaire utilis{\'e}. Une r{\'e}flexion sur la cr{\'e}ation de nouvelles cat{\'e}gories {\'e}t d{\'e}s {\'e}tudes proposant des r{\`e}gles grammaticales sont en cours de r{\'e}alisation afin d`aug1n{\'e}nter la performance du syst{\`e}me."
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="li-2003-un">
<titleInfo>
<title>Un système de segmentation du chinois basé sur des triplets</title>
</titleInfo>
<name type="personal">
<namePart type="given">Yiping</namePart>
<namePart type="family">Li</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2003-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">fra</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la 10ème conférence sur le Traitement Automatique des Langues Naturelles. REncontres jeunes Chercheurs en Informatique pour le Traitement Automatique des Langues (Posters)</title>
</titleInfo>
<name type="personal">
<namePart type="given">Emmanuel</namePart>
<namePart type="family">Morin</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA</publisher>
<place>
<placeTerm type="text">Batz-sur-Mer, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Un des problèmes rencontrés lors de l‘analyse de textes en chinois est qu‘il n‘existe pas de séparateur entré lés mots dans cette langue. Le mot étant une unité linguistique fondamentale en traitement automatique dé la langue, il est nécessaire d‘identifier les mots dans un texte chinois afin que des analysés de plus haut niveau puissent être réalisées. Le but de cet article est dé présenter un système d‘idéntification dés mots basé sur un algorithme utilisant des triplets dé catégories grammaticales ét dés fréquences de mots. Cé système comprend deux dictionnaires : l‘un dédié aux mots ét à léurs fréquences, l‘autré aux triplets dés catégories correspondantes. Les tests qui ont été effectués révèlent que 98,5% dés phrases sont découpées correctement. Certaines erreurs sont dués à la taillé limitée du dictionnaire utilisé. Une réflexion sur la création de nouvelles catégories ét dés études proposant des règles grammaticales sont en cours de réalisation afin d‘aug1nénter la performance du système.</abstract>
<identifier type="citekey">li-2003-un</identifier>
<location>
<url>https://aclanthology.org/2003.jeptalnrecital-recitalposter.6/</url>
</location>
<part>
<date>2003-06</date>
<extent unit="page">
<start>533</start>
<end>538</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Un système de segmentation du chinois basé sur des triplets
%A Li, Yiping
%Y Morin, Emmanuel
%S Actes de la 10ème conférence sur le Traitement Automatique des Langues Naturelles. REncontres jeunes Chercheurs en Informatique pour le Traitement Automatique des Langues (Posters)
%D 2003
%8 June
%I ATALA
%C Batz-sur-Mer, France
%G fra
%F li-2003-un
%X Un des problèmes rencontrés lors de l‘analyse de textes en chinois est qu‘il n‘existe pas de séparateur entré lés mots dans cette langue. Le mot étant une unité linguistique fondamentale en traitement automatique dé la langue, il est nécessaire d‘identifier les mots dans un texte chinois afin que des analysés de plus haut niveau puissent être réalisées. Le but de cet article est dé présenter un système d‘idéntification dés mots basé sur un algorithme utilisant des triplets dé catégories grammaticales ét dés fréquences de mots. Cé système comprend deux dictionnaires : l‘un dédié aux mots ét à léurs fréquences, l‘autré aux triplets dés catégories correspondantes. Les tests qui ont été effectués révèlent que 98,5% dés phrases sont découpées correctement. Certaines erreurs sont dués à la taillé limitée du dictionnaire utilisé. Une réflexion sur la création de nouvelles catégories ét dés études proposant des règles grammaticales sont en cours de réalisation afin d‘aug1nénter la performance du système.
%U https://aclanthology.org/2003.jeptalnrecital-recitalposter.6/
%P 533-538
Markdown (Informal)
[Un système de segmentation du chinois basé sur des triplets](https://aclanthology.org/2003.jeptalnrecital-recitalposter.6/) (Li, JEP/TALN/RECITAL 2003)
ACL
- Yiping Li. 2003. Un système de segmentation du chinois basé sur des triplets. In Actes de la 10ème conférence sur le Traitement Automatique des Langues Naturelles. REncontres jeunes Chercheurs en Informatique pour le Traitement Automatique des Langues (Posters), pages 533–538, Batz-sur-Mer, France. ATALA.