Journées d'Etudes sur la Parole / Traitement Automatique de la Langue Naturelle / Rencontres des Etudiants Chercheurs en Informatique et Traitement Automatique des Langues (2013)


Proceedings of TALN 2013 (Volume 1: Long Papers)

Emmanuel Morin | Yannick Estève

Morphological analysis of the standard Amazigh language using NooJ platform (Analyse Automatique de la Morphologie Nominale Amazighe) [in French]
Fatima Zahra Nejme | Siham Boulaknadel | Driss Aboutajdine

Symbolic and statistical learning for chunking : comparison and combinations (Apprentissage symbolique et statistique pour le chunking:comparaison et combinaisons) [in French]
Isabelle Tellier | Yoann Dupont

Using POMDPs for Topic-Focused Multi-Document Summarization (L’utilisation des POMDP pour les résumés multi-documents orientés par une thématique) [in French]
Yllias Chali | Sadid A. Hasan | Mustapha Mojahid

Unsupervised selection of semantic relations for improving a distributional thesaurus (Sélection non supervisée de relations sémantiques pour améliorer un thésaurus distributionnel) [in French]
Olivier Ferret

Grouping of terms based on linguistic and semantic regularities in a cross-lingual context (Groupement de termes basé sur des régularités linguistiques et sémantiques dans un contexte cross-langue) [in French]
Marie Dupuch | Thierry Hamon | Natalia Grabar

WoNeF, an improved, extended and evaluated automatic French translation of WordNet (WoNeF : amélioration, extension et évaluation d’une traduction française automatique de WordNet) [in French]
Quentin Pradet | Jeanne Baguenier-Desormeaux | Gaël de Chalendar | Laurence Danlos

Discriminative statistical approaches for multilingual speech understanding (Approches statistiques discriminantes pour l’interprétation sémantique multilingue de la parole) [in French]
Bassam Jabaian | Fabrice Lefèvre | Laurent Besacier

Automatically identifying implicit discourse relations using annotated data and raw corpora (Identification automatique des relations discursives « implicites » à partir de données annotées et de corpus bruts) [in French]
Chloé Braud | Pascal Denis

Learning a hierarchy of specialized pairwise models for coreference resolution (Apprentissage d’une hiérarchie de modèles à paires spécialisés pour la résolution de la coréférence) [in French]
Emmanuel Lassalle | Pascal Denis

A Supervised learning for the identification of semantic relations in parallel enumerative structures (Apprentissage supervisé pour l’identification de relations sémantiques au sein de structures énumératives parallèles) [in French]
Jean-Philippe Fauconnier | Mouna Kamel | Bernard Rothenburger | Nathalie Aussenac-Gilles

NLP and corpus techniques for finding formulations that facilitate scientific writing in English (Techniques de TAL et corpus pour faciliter les formulations en anglais scientifique écrit) [in French]
Marie-Paule Jacques | Laura Hartwell | Achille Falaise

Construction of a Free Large Part-of-Speech Annotated Corpus in French (Construction d’un large corpus écrit libre annoté morpho-syntaxiquement en français) [in French]
Nicolas Hernandez | Florian Boudin

Towards a treebank of spoken French (Vers un treebank du français parlé) [in French]
Anne Abeillé | Benoit Crabbé

APPLYING A BEAM SEARCH TO TRANSITION-BASED DEPENDENCY PARSING: A CASE STUDY FOR FRENCH WITH THE TALISMANE SUITE (L’apport du faisceau dans l’analyse syntaxique en dépendances par transitions : études de cas avec l’analyseur Talismane) [in French]
Assaf Urieli | Ludovic Tanguy

A probabilistic segment model combining lexical cohesion and disruption for topic segmentation (Un modèle segmental probabiliste combinant cohésion lexicale et rupture lexicale pour la segmentation thématique) [in French]
Anca Simon | Guillaume Gravier | Pascale Sébillot

Treating ellipsis : two abstract categorial grammar perspectives (Traitements d’ellipses : deux approches par les grammaires catégorielles abstraites) [in French]
Pierre Bourreau

Chunks and the notion of activation : a facilitation model for sentence processing (Chunks et activation : un modèle de facilitation du traitement linguistique) [in French]
Philippe Blache

Bilingual Lexicon Extraction from Comparable Corpora by Combining Contextual Representations (Extraction de lexiques bilingues à partir de corpus comparables par combinaison de représentations contextuelles) [in French]
Amir Hazem | Emmanuel Morin

Unsupervised CRF for knowledge discovery (Découverte de connaissances dans les séquences par CRF non-supervisés) [in French]
Vincent Claveau | Abir Ncibi

Automatic tagging of a learner corpus of English with a modified version of the Penn Treebank tagset (Annotation automatique d’un corpus d’apprenants d’anglais avec un jeu d’étiquettes modifié du Penn Treebank) [in French]
Thomas Gaillat

GLÀFF, a Large Versatile French Lexicon (GLÀFF, un Gros Lexique À tout Faire du Français) [in French]
Franck Sajous | Nabil Hathout | Basilio Calderone

The constitution of an Arabic semantic resource from a multilingual aligned corpus (Constitution d’une ressource sémantique arabe à partir de corpus multilingue aligné) [in French]
Authoul Abdul Hay | Olivier Kraif

Identification, Alignment, and Tranlsation of Relational Adjectives from Comparable Corpora (Identification, alignement, et traductions des adjectifs relationnels en corpus comparables) [in French]
Rima Harastani | Beatrice Daille | Emmanuel Morin

(Utilisation de la similarité sémantique pour l’extraction de lexiques bilingues à partir de corpus comparables) [in French]
Dhouha Bouamor | Nasredine Semmar | Pierre Zweigenbaum

Inductive and deductive inferences in a Crowdsourced Lexical-Semantic Network (Inférences déductives et réconciliation dans un réseau lexico-sémantique) [in French]
Manel Zarrouk | Mathieu Lafourcade | Alain Joubert

Semantic relation clustering for unsupervised information extraction (Regroupement sémantique de relations pour l’extraction d’information non supervisée) [in French]
Wei Wang | Romaric Besançon | Olivier Ferret | Brigitte Grau

On the semantics of determiners in a rich type-theoretical framework (Sémantique des déterminants dans un cadre richement typé) [in French]
Christian Retoré

Parallel areas detection in multi-documents for multilingual alignment (Détection de zones parallèles à l’intérieur de multi-documents pour l’alignement multilingue) [in French]
Charlotte Lecluze | Romain Brixtel | Loïs Rigouste | Emmanuel Giguet | Régis Clouard | Gaël Lejeune | Patrick Constant

Translating verbs between MSA and arabic dialects through deep morphological analysis (Un système de traduction de verbes entre arabe standard et arabe dialectal par analyse morphologique profonde) [in French]
Ahmed Hamdi | Rahma Boujelbane | Nizar Habash | Alexis Nasr

Dynamic extension of a French morphological lexicon based a text stream (Extension dynamique de lexiques morphologiques pour le français à partir d’un flux textuel) [in French]
Benoît Sagot | Damien Nouvel | Virginie Mouilleron | Marion Baranes

Mining Partial Annotation Rules for Named Entity Recognition (Fouille de règles d’annotation partielles pour la reconnaissance des entités nommées) [in French]
Damien Nouvel | Jean-Yves Antoine | Nathalie Friburger | Arnaud Soulet

Segmenting Arabic Texts into Elementary Discourse Units (Segmentation de textes arabes en unités discursives minimales) [in French]
Iskandar Keskes | Farah Beanamara | Lamia Hadrich Belguith

A fully discriminative training framework for Statistical Machine Translation (Un cadre d’apprentissage intégralement discriminant pour la traduction statistique) [in French]
Thomas Lavergne | Alexandre Allauzen | François Yvon

Semantic Annotation in Specific Domains with rich Ontologies (Annotation sémantique pour des domaines spécialisés et des ontologies riches) [in French]
Yue Ma | François Lévy | Adeline Nazarenko

Web pages segmentation for document selection in Question Answering (Pré-segmentation de pages web et sélection de documents pertinents en Questions-Réponses) [in French]
Nicolas Foucault | Sophie Rosset | Gilles Adda

Studying frequency-based approaches to process lexical simplification (Approches à base de fréquences pour la simplification lexicale) [in French]
Anne-Laure Ligozat | Cyril Grouin | Anne Garcia-Fernandez | Delphine Bernhard


Emmanuel Morin | Yannick Estève

TALN Archives : a digital archive of French research articles in Natural Language Processing (TALN Archives : une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue) [in French]
Florian Boudin

Similarities induced by a comparability mapping : meaning and utility in the context of the clustering of comparable texts (Similarités induites par mesure de comparabilité : signification et utilité pour le clustering et l’alignement de textes comparables) [in French]
Pierre-Francois Marteau | Gildas Ménier

ProLMF 1.2, Proper Names with their Expansions (ProLMF version 1.2. Une ressource libre de noms propres avec des expansions contextuelles) [in French]
Denis Maurel | Béatrice Bouchou Markhoff

Driven Decoding for machine translation (Vers un décodage guidé pour la traduction automatique) [in French]
Benjamin Lecouteux | Laurent Besacier

Can lightweight pre-editing rules improve statistical MT of forum content? (La La préédition avec des règles peu coûteuses, utile pour la TA statistique des forums ?) [in French]
Johanna Gerlach | Victoria Porro | Pierrette Bouillon | Sabine Lehmann

Interactive editing of utterances in French sign language dedicated to signing avatars (Édition interactive d’énoncés en langue des signes française dédiée aux avatars signeurs) [in French]
Ludovic Hamon | Sylvie Gibet | Sabah Boustila

ANCOR, the first large French speaking corpus of conversational speech annotated in coreference to be freely available (ANCOR, premier corpus de français parlé d’envergure annoté en coréférence et distribué librement) [in French]
Judith Muzerelle | Anaïs Lefeuvre | Jean-Yves Antoine | Emmanuel Schang | Denis Maurel | Jeanne Villaneau | Iris Eshkol

Multilingual Compound Splitting (Segmentation Multilingue des Mots Composés) [in French]
Elizaveta Loginova-Clouet | Béatrice Daille

Complex terminologies management - the case of acronyms (Gestion des terminologies riches : l’exemple des acronymes) [in French]
Ying Zhang | Mathieu Mangeot

N-gram Language Models and POS Distribution for the Identification of Spanish Varieties (Ngrammes et Traits Morphosyntaxiques pour la Identification de Variétés de l’Espagnol) [in French]
Marcos Zampieri | Binyam Gebrekidan Gebre | Sascha Diwersy

Improving Minor Opinion Polarity Classification with Named Entity Analysis (L’apport des Entités Nommées pour la classification des opinions minoritaires) [in French]
Amel Fraisse | Patrick Paroubek | Gil Francopoulo

Lexical access via a simple co-occurrence network (Trouver les mots dans un simple réseau de co-occurrences) [in French]
Gemma Bel-Enguix | Michael Zock

Static Analysis of Interactions between Elementary Structures of a Grammar (Analyse statique des interactions entre structures élémentaires d’une grammaire) [in French]
Guy Perrier

Semantic annotation influence on coreference detection using perceptron approach (Influence des annotations sémantiques sur un système de détection de coréférence à base de perceptron multi-couches) [in French]
Eric Charton | Michel Gagnon | Ludovic Jean-Louis

Pre-processing and Language Analysis for Arabic to French Statistical Machine Translation (Traduction automatique statistique pour l’arabe-français améliorée par le prétraitement et l’analyse de la langue) [in French]
Fatiha Sadat | Emad Mohamed

Formalizing an annotation guide : some experiments towards assisted agile annotation (Expériences de formalisation d’un guide d’annotation : vers l’annotation agile assistée) [in French]
Bruno Guillaume | Karën Fort

Localizing toponyms in topographic map titles (Repérer des toponymes dans des titres de cartes topographiques) [in French]
Catherine Dominguès | Iris Eshkol-Taravella

Extraction of temporal relations between clinical events in clinical documents (Extraction des relations temporelles entre événements médicaux dans des comptes rendus hospitaliers) [in French]
Pierre Zweigenbaum | Xavier Tannier

Second order similarity for exploring multilingual textual databases (Similarité de second ordre pour l’exploration de bases textuelles multilingues) [in French]
Nikola Tulechki | Ludovic Tanguy

Cross-lingual and generic text categorization (Apprentissage d’une classification thématique générique et cross-langue à partir des catégories de la Wikipédia) [in French]
François-Régis Chaumartin

Supervised learning on encyclopaedic resources for the extension of a lexicon of proper names dedicated to the recognition of named entities (Apprentissage supervisé sur ressources encyclopédiques pour l’enrichissement d’un lexique de noms propres destiné à la reconnaissance des entités nommées) [in French]
Nadia Okinina | Damien Nouvel | Nathalie Friburger | Jean-Yves Antoine

Converting dependencies for syntactic analysis of French into PASSAGE functional relations (Convertir des analyses syntaxiques en dépendances vers les relations fonctionnelles PASSAGE) [in French]
Patrick Paroubek | Munshi Asadullah | Anne Vilnat

Anaphora Resolution for Machine Translation (Résolution d’anaphores et traitement des pronoms en traduction automatique à base de règles) [in French]
Sharid Loáiciga

Lexicons from Comparable Corpora for Multilingual Information Retrieval (Lexiques de corpus comparables et recherche d’information multilingue) [in French]
Frederik Cailliau | Ariane Cavet | Clément De Groc | Claude De Loupy

Using contexts for automatic or semi-automatic correction of customer complaints (Utilisation de contextes pour la correction automatique ou semi-automatique de réclamations clients) [in French]
Philippe Suignard | Sofiane Kerroua

SegCV : Eficient parsing of résumés with analysis and correction of errors (SegCV : traitement efficace de CV avec analyse et correction d’erreurs) [in French]
Luis Adrián Cabrera-Diego | Juan-Manuel Torres-Moreno | Marc El-Bèze

Search and usage of named conceptual entities in a categorisazion task (Recherche et utilisation d’entités nommées conceptuelles dans une tâche de catégorisation) [in French]
Jean-Valère Cossu | Juan-Manuel Torres-Moreno | Marc El-Bèze

A corpus of post-edited translations (Un corpus d’erreurs de traduction) [in French]
Guillaume Wisniewski | Anil Kumar Singh | Natalia Segal | François Yvon

An evaluation summary method based on combination of automatic and textual complexity metrics (Une méthode d’évaluation des résumés basée sur la combinaison de métriques automatiques et de complexité textuelle) [in French]
Samira Walha Ellouze | Maher Jaoua | Lamia Hadrich Belguith

An iterative topic segmentation algorithm with intra-content term weighting (Segmentation thématique : processus itératif de pondération intra-contenu) [in French]
Abdessalam Bouchekif | Géraldine Damnati | Delphine Charlet

Search and Visualization of Semantically Related Words (Recherche et visualisation de mots sémantiquement liés) [in French]
Alexander Panchenko | Hubert Naets | Laetitia Brouwers | Pavel Romanov | Cédrick Fairon

An extended morphological analyzer of German handling verbal forms with separated separable particles (Un analyseur morphologique étendu de l’allemand traitant les formes verbales à particule séparée) [in French]
Jean-Philippe Guilbaud | Christian Boitet | Vincent Berment

Building and exploiting a French corpus for sentiment analysis (Construction et exploitation d’un corpus français pour l’analyse de sentiment) [in French]
Marc Vincent | Grégoire Winterstein

Anaphora Resolution Applied to Collocation Identification: A Preliminary Evaluation (Résolution d’anaphores appliquée aux collocations: une évaluation préliminaire) [in French]
Luka Nerima | Éric Wehrli

Help enrich a terminological repository : proposals and experiments (Aide à l’enrichissement d’un référentiel terminologique : propositions et expérimentations) [in French]
Thibault Mondary | Adeline Nazarenko | Haïfa Zargayouna | Sabine Barreaux


Emmanuel Morin | Yannick Estève

DAnIEL, parsimonious yet high-coverage multilingual epidemic surveillance (DAnIEL : Veille épidémiologique multilingue parcimonieuse) [in French]
Gaël Lejeune | Romain Brixtel | Charlotte Lecluze | Antoine Doucet | Nadine Lucas

Multilingual lexical database in the framework of COMPRENO linguistic model developed by ABBYY (Lexique multilingue dans le cadre du modèle Compreno développé ABBYY) [in French]
Elena Kozlova | Maria Gontcharova | Tatiana Popova

Inbenta Semantic Search Engine: a semantic search engine inspired by the Meaning-Text Theory (Inbenta Semantic Search Engine : un moteur de recherche sémantique inspiré de la Théorie Sens-Texte) [in French]
Manon Quintana

FMO: a tool for automated opinion mining (FMO : un outil d’analyse automatique de l’opinion) [in French]
Jean-Leon Bouraoui | Marc Canitrot

Checking, analysing and representing texts (Corriger, analyser et représenter le texte Synapse Développement) [in French]
Patrick Séguéla | Dominique Laurent

An Interface for Validating and Evaluating Thematic Timelines (Une interface pour la validation et l’évaluation de chronologies thématiques) [in French]
Xavier Tannier | Véronique Moriceau | Erwan Le Flem

CasSys, a free transducer cascade system (CasSys Un système libre de cascades de transducteurs) [in French]
Denis Maurel | Nathalie Friburger

iMAG : MT-postediting, translation quality evaluation and parallel corpus production (iMAG : post-édition, évaluation de qualité de TA et production d’un corpus parallèle) [in French]
Lingxiao Wang | Ying Zhang

Semantic Web technologies for Lexical Linked Data management (Technologies du Web Sémantique pour l’exploitation de données lexicales en réseau (Lexical Linked Data)) [in French]
David Rouquet

Adaptation of the corpus platform ScienQuest for assistance to writing in a second language (Adaptation de la plateforme corporale ScienQuest pour l’aide à la rédaction en langue seconde) [in French]
Achille Falaise

Apopsis Demonstrator for Tweet Analysis (Démonstrateur Apopsis pour l’analyse des tweets) [in French]
Sebastián Peña Saldarriaga | Damien Vintache | Béatrice Daille

Sentiment Analysis for Call-centers (L’analyse des sentiments au service des centres d’appels) [in French]
Frederik Cailliau | Ariane Cavet

TTC TermSuite - Terminological Alignment from Comparable Corpora (TTC TermSuite alignement terminologique à partir de corpus comparables) [in French]
Béatrice Daille | Rima Harastani


Proceedings of RECITAL 2013

Florian Boudin | Loïc Barrault

Mining a Bilingual Lexicon of MultiWord Expressions : A Statistical Machine Translation Evaluation Perspective (Acquisition de lexique bilingue d’expressions polylexicales: Une application à la traduction automatique statistique) [in French]
Dhouha Bouamor

Some variations on quantitative comparability measures and evaluations on synthetic French-English comparable corpora (Quelques variations sur les mesures de comparabilité quantitatives et évaluations sur des corpus comparables Français-Anglais synthétiques) [in French]
Guiyao Ke

Clustering for categorial grammar induction (Inférence grammaticale guidée par clustering) [in French]
Noémie-Fleur Sandillon-Rezer

Enhance Multiword Expressions Extraction and Description with Transformational Rules (Améliorer l’extraction et la description d’expressions polylexicales grâce aux règles transformationnelles) [in French]
Aurélie Joseph

Multilingual document clustering : state of the art (Construction de corpus multilingues : état de l’art) [in French]
Manuela Yapomo

Development of resources for training and the use of the tagger TreeTagger on Arabic (Développement de ressources pour l’entrainement et l’utilisation de l’étiqueteur morphosyntaxique TreeTagger sur l’arabe) [in French]
Dhaou Ghoul

Polarity Opinion Detection in Arabic Forums by Fusing Multiple SVMs (Détection de polarité d’opinions dans les forums en langue arabe par fusion de plusieurs SVM) [in French]
Amel Ziani | Nabiha Azizi | Yamina Tlili-Guiassa

State of the Art of Automatic Keyphrase Extraction Methods (État de l’art des méthodes d’extraction automatique de termes-clés) [in French]
Adrien Bougouin

On the Effect of Head Tagging on Parsing Discontinuous Dependencies in French (Influence de l’étiquetage syntaxique des têtes sur l’analyse en dépendances discontinues du français) [in French]
Ophélie Lacroix

A linguistic approach for knowledge extraction from an Arabic text (Une approche linguistique pour l’extraction des connaissances dans un texte arabe) [in French]
Houda Saadane

Extraction of academic lexicon’s simple words in humanities writings (Extraction des mots simples du lexique scientifique transdisciplinaire dans les écrits de sciences humaines : une première expérimentation) [in French]
Sylvain Hatier

Towards an automatic identification of chiasmus of words (Vers une identification automatique du chiasme de mots) [in French]
Marie Dubremetz

ECD Knowledge Representation : Fundamental Concepts of the Unit Graphs Framework (Représentation des connaissances du DEC: Concepts fondamentaux du formalisme des Graphes d’Unités) [in French]
Maxime Lefrançois

Towards a generic graph rewriting system to enrich syntactic structures (Vers un système générique de réécriture de graphes pour l’enrichissement de structures syntaxiques) [in French]
Corentin Ribeyre

A State of the Art of Word Sense Induction: A Way Towards Word Sense Disambiguation for Under-Resourced Languages (État de l’art de l’induction de sens: une voie vers la désambiguïsation lexicale pour les langues peu dotées) [in French]
Mohammad Nasiruddin

Generation of tunisian dialect corpora for adapting language models (Génération des corpus en dialecte tunisien pour la modélisation de langage d’un système de reconnaissance) [in French]
Rahma Boujelbane

Automatic search session detection exploiting results similarity from an external document collection (Détection automatique des sessions de recherche par similarité des résultats provenant d’une collection de documents externe) [in French]
Simon Leva | Nicolas Faessel

A Mixed Morpho-Syntactic and Statistical Approach to Chinese Named Entity Recognition (Une approche mixte morpho-syntaxique et statistique pour la reconnaissance d’entités nommées en langue chinoise) [in French]
Zhen Wang