pdf
bib
Actes de la Conférence sur le Traitement Automatique des Langues Naturelles (TALN) PFIA 2019. Terminologie et Intelligence Artificielle (atelier TALN-RECITAL \& IC)
Emmanuel Morin
|
Sophie Rosset
|
Pierre Zweigenbaum
pdf
bib
abs
Terminology systematization for Cybersecurity domain in Italian Language
Claudia Lanza
|
Béatrice Daille
This paper aims at presenting the first steps to improve the quality of the first draft of an Italian thesaurus for Cybersecurity terminology that has been realized for a specific project activity in collaboration with CybersecurityLab at Informatics and Telematics Institute (IIT) of the National Council of Research (CNR) in Italy. In particular, the paper will focus, first, on the terminological knowledge base built to retrieve the most representative candidate terms of Cybersecurity domain in Italian language, giving examples of the main gold standard repositories that have been used to build this semantic tool. Attention will be then given to the methodology and software employed to configure a system of NLP rules to get the desired semantic results and to proceed with the enhancement of the candidate terms selection which are meant to be inserted in the controlled vocabulary.
pdf
bib
abs
Identification des catégories de relations aliment-médicament (Identification of categories of food-drug relations)
Tsanta Randriatsitohaina
|
Thierry Hamon
Les interactions aliment-médicament se produisent lorsque des aliments et des médicaments pris ensembles provoquent un effet inattendu. Leur reconnaissance automatique dans les textes peut être considérée comme une tâche d’extraction de relation à l’aide de méthodes de classification. Toutefois, étant donné que ces interactions sont décrites de manière très fine, nous sommes confrontés au manque de données et au manque d’exemples par type de relation. Pour résoudre ce problème, nous proposons une approche efficace pour regrouper des relations partageant une représentation similaire en groupes et réduire le manque d’exemples. Notre approche améliore les performances de la classification des FDI. Enfin, nous contrastons une méthode de regroupement intuitive basée sur la définition des types de relation et un apprentissage non supervisé basé sur les instances de chaque type de relation.
pdf
abs
Terminology-based Text Embedding for Computing Document Similarities on Technical Content
Hamid Mirisaee
|
Eric Gaussier
|
Cedric Lagnier
|
Agnes Guerraz
We propose in this paper a new, hybrid document embedding approach in order to address the problem of document similarities with respect to the technical content. To do so, we employ a state-of-the-art graph techniques to first extract the keyphrases (composite keywords) of documents and, then, use them to score the sentences. Using the ranked sentences, we propose two approaches to embed documents and show their performances with respect to two baselines. With domain expert annotations, we illustrate that the proposed methods can find more relevant documents and outperform the baselines up to 27% in terms of NDCG.
pdf
abs
Exploiter un réseau lexico-sémantique pour la construction d’ontologie (Lexical Semantic Network Use for Ontology Building )
Nadia Bebeshina-Clairet
|
Sylvie Desprès
Dans le présent article nous nous intéressons à l’exploitation des ressources de connaissance lexicosémantiques dans le cadre de la construction et de l’enrichissement d’ontologie. En effet, la construction d’ontologie est souvent menée de manière descendante où ses concepts de haut niveau sont définis pour ensuite être spécifiés sur la base d’un consensus entre les experts humains. Nous explorons une technique d’utilisation des réseaux lexico-sémantiques (RLS) multilingue et monolingue pour enrichir une ontologie existante. Cette technique vise à réduire l’effort humain nécessaire à la localisation ou à l’enrichissement d’une ontologie.
pdf
abs
Entropic characterisation of termino-conceptual structure : A preliminary study
Kyo Kageura
|
Long-Huei Chen
Terms represent concepts, which consist of conceptual characteristics. In actual concept-term formation, which is done by researchers, the process is in reverse: conceptual elements/characteristics are consolidated to form concepts, which are represented by terms. As concepts do not exist on the fly, what we may call termino-conceptual system provides scaffolding in this process. Terminologists, both in practice and in research, do not only collect and list terms but also analyse, describe and define terms and systematise terminologies. To carry out these tasks, terminologists must refer to conceptual systems, to the extent that they contribute to systematising terminologies; terminologists thus also deal with the sphere of termino-conceptual system. In this paper, we consolidate the status of termino-conceptual sphere and propose a way to characterise the structure of termino-conceptual system by using entropy. The entropic characterisation of English terminologies of six domain, i.e. agriculture, botany, chemistry, computer science, physics and psychology are presented.
pdf
TemPO : towards a conceptualisation of pathology in speech and language therapy
Frédérique Brin-Henry
|
Rute Costa
|
Sylvie Desprès