2023
pdf
bib
abs
A Linked Data Approach for linking and aligning Sign Language and Spoken Language Data
Thierry Declerck
|
Sam Bigeard
|
Fahad Khan
|
Irene Murtagh
|
Sussi Olsen
|
Mike Rosner
|
Ineke Schuurman
|
Andon Tchechmedjiev
|
Andy Way
Proceedings of the Second International Workshop on Automatic Translation for Signed and Spoken Languages
We present work dealing with a Linked Open Data (LOD)-compliant representation of Sign Language (SL) data, with the goal of supporting the cross-lingual alignment of SL data and their linking to Spoken Language (SpL) data. The proposed representation is based on activities of groups of researchers in the field of SL who have investigated the use of Open Multilingual Wordnet (OMW) datasets for (manually) cross-linking SL data or for linking SL and SpL data. Another group of researchers is proposing an XML encoding of articulatory elements of SLs and (manually) linking those to an SpL lexical resource. We propose an RDF-based representation of those various data. This unified formal representation offers a semantic repository of information on SL and SpL data that could be accessed for supporting the creation of datasets for training or evaluating NLP applications dealing with SLs, thinking for example of Machine Translation (MT) between SLs and between SLs and SpLs.
2020
pdf
abs
Can Knowledge Graph Embeddings Tell Us What Fact-checked Claims Are About?
Valentina Beretta
|
Sébastien Harispe
|
Katarina Boland
|
Luke Lo Seen
|
Konstantin Todorov
|
Andon Tchechmedjiev
Proceedings of the First Workshop on Insights from Negative Results in NLP
The web offers a wealth of discourse data that help researchers from various fields analyze debates about current societal issues and gauge the effects on society of important phenomena such as misinformation spread. Such analyses often revolve around claims made by people about a given topic of interest. Fact-checking portals offer partially structured information that can assist such analysis. However, exploiting the network structure of such online discourse data is as of yet under-explored. We study the effectiveness of using neural-graph embedding features for claim topic prediction and their complementarity with text embeddings. We show that graph embeddings are modestly complementary with text embeddings, but the low performance of graph embedding features alone indicate that the model fails to capture topological features pertinent of the topic prediction task.
2019
pdf
abs
DÉfi Fouille de Textes 2019 : indexation par extraction et appariement textuel (DEFT 2019 : extraction-based document indexing and textual document similarity matching )
Jean-Christophe Mensonides
|
Pierre-Antoine Jean
|
Andon Tchechmedjiev
|
Sébastien Harispe
Actes de la Conférence sur le Traitement Automatique des Langues Naturelles (TALN) PFIA 2019. Défi Fouille de Textes (atelier TALN-RECITAL)
Cet article présente la contribution de l’équipe du Laboratoire de Génie Informatique et d’Ingénierie de Production (LGI2P) d’IMT Mines Alès au DÉfi Fouille de Textes (DEFT) 2019. Il détaille en particulier deux approches proposées pour les tâches liées à (1) l’indexation et à (2) la similarité de documents. Ces méthodes reposent sur des techniques robustes et éprouvées du domaine de la Recherche d’Information et du Traitement Automatique du Langage Naturel, qui ont été adaptées à la nature spécifique du corpus (biomédical/clinique) et couplées à des mécanismes développés pour répondre aux spécificités des tâches traitées. Pour la tâche 1, nous proposons une méthode d’indexation par extraction appliquée sur une version normalisée du corpus (MAP de 0,48 à l’évaluation) ; les spécificités de la phase de normalisation seront en particulier détaillées. Pour la tâche 2, au-delà de la présentation de l’approche proposée basée sur l’évaluation de similarités sur des représentations de documents (score de 0,91 à l’évaluation), nous proposons une étude comparative de l’impact des choix de la distance et de la manière de représenter les textes sur la performance de l’approche.
2017
pdf
Enrichment of French Biomedical Ontologies with UMLS Concepts and Semantic Types for Biomedical Named Entity Recognition Though Ontological Semantic Annotation
Andon Tchechmedjiev
|
Clément Jonquet
Proceedings of Language, Ontology, Terminology and Knowledge Structures Workshop (LOTKS 2017)
2016
pdf
abs
Extension lexicale de définitions grâce à des corpus annotés en sens (Lexical Expansion of definitions based on sense-annotated corpus )
Loïc Vial
|
Andon Tchechmedjiev
|
Didier Schwab
Actes de la conférence conjointe JEP-TALN-RECITAL 2016. volume 2 : TALN (Articles longs)
Pour un certain nombre de tâches ou d’applications du TALN, il est nécessaire de déterminer la proximité sémantique entre des sens, des mots ou des segments textuels. Dans cet article, nous nous intéressons à une mesure basée sur des savoirs, la mesure de Lesk. La proximité sémantique de deux définitions est évaluée en comptant le nombre de mots communs dans les définitions correspondantes dans un dictionnaire. Dans cet article, nous étudions plus particulièrement l’extension de définitions grâce à des corpus annotés en sens. Il s’agit de prendre en compte les mots qui sont utilisés dans le voisinage d’un certain sens et d’étendre lexicalement la définition correspondante. Nous montrons une amélioration certaine des performances obtenues en désambiguïsation lexicale qui dépassent l’état de l’art.
2015
pdf
abs
Création rapide et efficace d’un système de désambiguïsation lexicale pour une langue peu dotée
Mohammad Nasiruddin
|
Andon Tchechmedjiev
|
Hervé Blanchon
|
Didier Schwab
Actes de la 22e conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
Nous présentons une méthode pour créer rapidement un système de désambiguïsation lexicale (DL) pour une langue L peu dotée pourvu que l’on dispose d’un système de traduction automatique statistique (TAS) d’une langue riche en corpus annotés en sens (ici l’anglais) vers L. Il est, en effet, plus facile de disposer des ressources nécessaires à la création d’un système de TAS que des ressources dédiées nécessaires à la création d’un système de DL pour la langue L. Notre méthode consiste à traduire automatiquement un corpus annoté en sens vers la langue L, puis de créer le système de désambiguïsation pour L par des méthodes supervisées classiques. Nous montrons la faisabilité de la méthode et sa généricité en traduisant le SemCor, un corpus en anglais annoté grâce au Princeton WordNet, de l’anglais vers le bangla et de l’anglais vers le français. Nous montrons la validité de l’approche en évaluant les résultats sur la tâche de désambiguïsation lexicale multilingue de Semeval 2013.
2014
pdf
Word Sense Induction for Lexical Resource Enrichment (Induction de sens pour enrichir des ressources lexicales) [in French]
Mohammad Nasiruddin
|
Didier Schwab
|
Andon Tchechmedjiev
|
Gilles Sérasset
|
Hervé Blanchon
Proceedings of TALN 2014 (Volume 2: Short Papers)
2013
pdf
Désambiguïsation lexicale de textes : efficacité qualitative et temporelle d’un algorithme à colonies de fourmis [Lexical disambiguation of texts: qualitative and temporal efficiency of an ant colony algorithm]
Didier Schwab
|
Jérôme Goulian
|
Andon Tchechmedjiev
Traitement Automatique des Langues, Volume 54, Numéro 1 : Varia [Varia]
pdf
GETALP System : Propagation of a Lesk Measure through an Ant Colony Algorithm
Didier Schwab
|
Andon Tchechmedjiev
|
Jérôme Goulian
|
Mohammad Nasiruddin
|
Gilles Sérasset
|
Hervé Blanchon
Second Joint Conference on Lexical and Computational Semantics (*SEM), Volume 2: Proceedings of the Seventh International Workshop on Semantic Evaluation (SemEval 2013)
2012
pdf
Ant Colony Algorithm for the Unsupervised Word Sense Disambiguation of Texts: Comparison and Evaluation
Didier Schwab
|
Jérôme Goulian
|
Andon Tchechmedjiev
|
Hervé Blanchon
Proceedings of COLING 2012
pdf
Parameter estimation under uncertainty with Simulated Annealing applied to an ant colony based probabilistic WSD algorithm
Andon Tchechmedjiev
|
Jérôme Goulian
|
Didier Schwab
|
Gilles Sérasset
Proceedings of the First International Workshop on Optimization Techniques for Human Language Technology
pdf
État de l’art : mesures de similarité sémantique locales et algorithmes globaux pour la désambiguïsation lexicale à base de connaissances (State of the art : Local Semantic Similarity Measures and Global Algorithmes for Knowledge-based Word Sense Disambiguation) [in French]
Andon Tchechmedjiev
Proceedings of the Joint Conference JEP-TALN-RECITAL 2012, volume 3: RECITAL