2013
pdf
bib
Checking, analysing and representing texts (Corriger, analyser et représenter le texte Synapse Développement) [in French]
Patrick Séguéla
|
Dominique Laurent
Proceedings of TALN 2013 (Volume 3: System Demonstrations)
2010
pdf
bib
abs
Question Answering on Web Data: The QA Evaluation in Quæro
Ludovic Quintard
|
Olivier Galibert
|
Gilles Adda
|
Brigitte Grau
|
Dominique Laurent
|
Véronique Moriceau
|
Sophie Rosset
|
Xavier Tannier
|
Anne Vilnat
Proceedings of the Seventh International Conference on Language Resources and Evaluation (LREC'10)
In the QA and information retrieval domains progress has been assessed via evaluation campaigns(Clef, Ntcir, Equer, Trec).In these evaluations, the systems handle independent questions and should provide one answer to each question, extracted from textual data, for both open domain and restricted domain. Quæro is a program promoting research and industrial innovation on technologies for automatic analysis and classification of multimedia and multilingual documents. Among the many research areas concerned by Quæro. The Quaero project organized a series of evaluations of Question Answering on Web Data systems in 2008 and 2009. For each language, English and French the full corpus has a size of around 20Gb for 2.5M documents. We describe the task and corpora, and especially the methodologies used in 2008 to construct the test of question and a new one in the 2009 campaign. Six types of questions were addressed, factual, Non-factual(How, Why, What), List, Boolean. A description of the participating systems and the obtained results is provided. We show the difficulty for a question-answering system to work with complex data and questions.
pdf
bib
abs
Named and Specific Entity Detection in Varied Data: The Quæro Named Entity Baseline Evaluation
Olivier Galibert
|
Ludovic Quintard
|
Sophie Rosset
|
Pierre Zweigenbaum
|
Claire Nédellec
|
Sophie Aubin
|
Laurent Gillard
|
Jean-Pierre Raysz
|
Delphine Pois
|
Xavier Tannier
|
Louise Deléger
|
Dominique Laurent
Proceedings of the Seventh International Conference on Language Resources and Evaluation (LREC'10)
The Quæro program that promotes research and industrial innovation on technologies for automatic analysis and classification of multimedia and multilingual documents. Within its context a set of evaluations of Named Entity recognition systems was held in 2009. Four tasks were defined. The first two concerned traditional named entities in French broadcast news for one (a rerun of ESTER 2) and of OCR-ed old newspapers for the other. The third was a gene and protein name extraction in medical abstracts. The last one was the detection of references in patents. Four different partners participated, giving a total of 16 systems. We provide a synthetic descriptions of all of them classifying them by the main approaches chosen (resource-based, rules-based or statistical), without forgetting the fact that any modern system is at some point hybrid. The metric (the relatively standard Slot Error Rate) and the results are also presented and discussed. Finally, a process is ongoing with preliminary acceptance of the partners to ensure the availability for the community of all the corpora used with the exception of the non-Quæro produced ESTER 2 one.
2009
pdf
bib
abs
Apport des cooccurrences à la correction et à l’analyse syntaxique
Dominique Laurent
|
Sophie Nègre
|
Patrick Séguéla
Actes de la 16ème conférence sur le Traitement Automatique des Langues Naturelles. Articles courts
Le correcteur grammatical Cordial utilise depuis de nombreuses années les cooccurrences pour la désambiguïsation sémantique. Un dictionnaire de cooccurrences ayant été constitué pour les utilisateurs du logiciel de correction et d’aides à la rédaction, la grande richesse de ce dictionnaire a incité à l’utiliser intensivement pour la correction, spécialement des homonymes et paronymes. Les résultats obtenus sont spectaculaires sur ces types d’erreurs mais la prise en compte des cooccurrences a également été utilisée avec profit pour la pure correction orthographique et pour le rattachement des groupes en analyse syntaxique.
pdf
bib
abs
L’analyseur syntaxique Cordial dans Passage
Dominique Laurent
|
Sophie Nègre
|
Patrick Séguéla
Actes de la 16ème conférence sur le Traitement Automatique des Langues Naturelles. Articles courts
Cordial est un analyseur syntaxique et sémantique développé par la société Synapse Développement. Largement utilisé par les laboratoires de TALN depuis plus de dix ans, cet analyseur participe à la campagne Passage (“Produire des Annotations Syntaxiques à Grande Échelle”). Comment fonctionne cet analyseur ? Quels résultats a-t-il obtenu lors de la première phase d’évaluation de cette campagne ? Au-delà de ces questions, cet article montre en quoi les contraintes industrielles façonnent les outils d’analyse automatique du langage naturel.
2007
pdf
bib
abs
Logiciel Cordial
Dominique Laurent
|
Sophie Nègre
|
Patrick Séguéla
Actes de la 14ème conférence sur le Traitement Automatique des Langues Naturelles. Démonstrations
Cordial est un correcteur efficace et discret enrichi d’un grand nombre de fonctions d’aide à la rédaction et d’analyse de documents. Très riche avec ces multiples dictionnaires et souvent pertinent dans ses propositions, Cordial est un compagnon précieux qui vous permet d’assurer la qualité de vos écrits. La version 2007 de Cordial s’intègre dans un vaste éventail de logiciels comme les traitements de texte (Word, Open Office, Word Perfect...), clients de messagerie (Outlook, Notes, Thunderbird, webmails...) ou navigateurs (Explorer, Mozilla).
2006
pdf
bib
QA better than IR ?
Dominique Laurent
|
Patrick Séguéla
|
Sophie Nègre
Proceedings of the Workshop on Multilingual Question Answering - MLQA ‘06
pdf
bib
abs
Evaluation of multilingual text alignment systems: the ARCADE II project
Yun-Chuang Chiao
|
Olivier Kraif
|
Dominique Laurent
|
Thi Minh Huyen Nguyen
|
Nasredine Semmar
|
François Stuck
|
Jean Véronis
|
Wajdi Zaghouani
Proceedings of the Fifth International Conference on Language Resources and Evaluation (LREC’06)
This paper describes the ARCADE II project, concerned with the evaluation of parallel text alignment systems. The ARCADE II project aims at exploring the techniques of multilingual text alignment through a fine evaluation of the existing techniques and the development of new alignment methods. The evaluation campaign consists of two tracks devoted to the evaluation of alignment at sentence and word level respectively. It differs from ARCADE I in the multilingual aspect and the investigation of lexical alignment.
2005
pdf
bib
abs
QRISTAL, système de Questions-Réponses
Dominique Laurent
|
Patrick Séguéla
Actes de la 12ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
QRISTAL (Questions-Réponses Intégrant un Système de Traitement Automatique des Langues) est un système de questions-réponses utilisant massivement le TAL, tant pour l’indexation des documents que pour l’extraction des réponses. Ce système s’est récemment classé premier lors de l’évaluation EQueR (Evalda, Technolanguez). Après une description fonctionnelle du système, ses performances sont détaillées. Ces résultats et des tests complémentaires permettent de mieux situer l’apport des différents modules de TAL. Les réactions des premiers utilisateurs incitent enfin à une réflexion sur l’ergonomie et les contraintes des systèmes de questions-réponses, face aux outils de recherche sur le Web.
2004
pdf
bib
Design and Implementation of a Semantic Search Engine for Portuguese
Carlos Amaral
|
Dominique Laurent
|
André Martins
|
Afonso Mendes
|
Cláudia Pinto
Proceedings of the Fourth International Conference on Language Resources and Evaluation (LREC’04)