François-Régis Chaumartin

Also published as: Francois-Regis Chaumartin


2017

pdf
Proxem Studio : la plate-forme d’analyse sémantique qui transforme l’utilisateur métier en text scientist (ProxemStudio: the semantic analysis platform that turns the business user into a text scientist)
Francois-Regis Chaumartin
Actes des 24ème Conférence sur le Traitement Automatique des Langues Naturelles. Volume 3 - Démonstrations

Proxem édite depuis 2011 une plate-forme d’analyse sémantique multilingue utilisé en entreprise pour de multiples usages : relation clients, ressources humaines, veille stratégique... La version la plus récente du logiciel, lancée en mars 2017, lève le principal goulet d’étranglement des outils classiques de text mining : un utilisateur métier devient enfin autonome pour définir lui-même les ressources linguistiques nécessaires à l’analyse sémantique d’un corpus donné. Une fois le corpus chargé, la plate-forme en extrait une terminologie et organise les termes en regroupements hiérarchisés de proto-concepts ; l’utilisateur n’a plus qu’à valider ces concepts au niveau de granularité qui lui semble pertinent pour constituer un extracteur d’entités nommées de granularité fine, adapté au corpus à traiter, avec un rappel élevé grâce à l’identification automatique des quasisynonymes. La plate-forme détecte aussi dans ces termes les homonymes potentiels et propose à l’utilisateur des contextes de désambiguïsation, fournissant ainsi une bonne précision.

2014

pdf
Ubiq: a platform for crawling, analyzing and exploiting corpora (Ubiq : une plateforme de collecte, analyse et valorisation des corpus) [in French]
François-Régis Chaumartin
Proceedings of TALN 2014 (Volume 3: System Demonstrations)

2013

pdf
Cross-lingual and generic text categorization (Apprentissage d’une classification thématique générique et cross-langue à partir des catégories de la Wikipédia) [in French]
François-Régis Chaumartin
Proceedings of TALN 2013 (Volume 2: Short Papers)

2012

pdf
Solution Proxem d’analyse sémantique verticale : adaptation au domaine des Ressources Humaines (How to adapt the Proxem semantic analysis engine to the Human Resources field) [in French]
François-Régis Chaumartin
Proceedings of the Joint Conference JEP-TALN-RECITAL 2012, volume 5: Software Demonstrations

2011

pdf
Proxem Ubiq : une solution d’e-réputation par analyse de feedbacks clients (Proxem Ubiq: a solution of e-reputation by analyzing customer feedback)
François-Régis Chaumartin
Actes de la 18e conférence sur le Traitement Automatique des Langues Naturelles. Démonstrations

2010

pdf
Une approche paresseuse de l’analyse sémantique ou comment construire une interface syntaxe-sémantique à partir d’exemples
François-Régis Chaumartin | Sylvain Kahane
Actes de la 17e conférence sur le Traitement Automatique des Langues Naturelles. Articles courts

Cet article montre comment calculer une interface syntaxe-sémantique à partir d’un analyseur en dépendance quelconque et interchangeable, de ressources lexicales variées et d’une base d’exemples associés à leur représentation sémantique. Chaque exemple permet de construire une règle d’interface. Nos représentations sémantiques sont des graphes hiérarchisés de relations prédicat-argument entre des acceptions lexicales et notre interface syntaxe-sémantique est une grammaire de correspondance polarisée. Nous montrons comment obtenir un système très modulaire en calculant certaines règles par « soustraction » de règles moins modulaires.

2008

pdf
La polysémie régulière dans WordNet
Lucie Barque | François-Régis Chaumartin
Actes de la 15ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs

Cette étude propose une analyse et une modélisation des relations de polysémie dans le lexique électronique anglais WordNet. Elle exploite pour cela la hiérarchie des concepts (représentés par des synsets), et la définition associée à chacun de ces concepts. Le résultat est constitué d’un ensemble de règles qui nous ont permis d’identifier d’une façon largement automatisée, avec une précision voisine de 91%, plus de 2100 paires de synsets liés par une relation de polysémie régulière. Notre méthode permet aussi une désambiguïsation lexicale partielle des mots de la définition associée à ces synsets.

2007

pdf
UPAR7: A knowledge-based system for headline sentiment tagging
François-Régis Chaumartin
Proceedings of the Fourth International Workshop on Semantic Evaluations (SemEval-2007)

pdf
Extraction de paraphrases désambiguïsées à partir d’un corpus d’articles encyclopédiques alignés automatiquement
François-Régis Chaumartin
Actes de la 14ème conférence sur le Traitement Automatique des Langues Naturelles. REncontres jeunes Chercheurs en Informatique pour le Traitement Automatique des Langues

Nous décrivons ici comment enrichir automatiquement WordNet en y important des articles encyclopédiques. Ce processus permet de créer des nouvelles entrées, en les rattachant au bon hyperonyme. Par ailleurs, les entrées préexistantes de WordNet peuvent être enrichies de descriptions complémentaires. La répétition de ce processus sur plusieurs encyclopédies permet de constituer un corpus d’articles comparables. On peut ensuite extraire automatiquement des paraphrases à partir des couples d’articles ainsi créés. Grâce à l’application d’une mesure de similarité, utilisant la hiérarchie de verbes de WordNet, les constituants de ces paraphrases peuvent être désambiguïsés.

2006

pdf bib
Construction automatique d’une interface syntaxe / sémantique utilisant des ressources de large couverture en langue anglaise
François-Régis Chaumartin
Actes de la 13ème conférence sur le Traitement Automatique des Langues Naturelles. REncontres jeunes Chercheurs en Informatique pour le Traitement Automatique des Langues (Posters)

Nous décrivons ici une approche pour passer d’une représentation syntaxique (issue d’une analyse grammaticale) à une représentation sémantique (sous forme de prédicats). Nous montrons ensuite que la construction de cette interface est automatisable. Nous nous appuyons sur l’interopérabilité de plusieurs ressources couvrant des aspects d’ordre syntaxique (Link Grammar Parser), lexical (WordNet) et syntaxico-sémantique (VerbNet) de la langue anglaise. L’utilisation conjointe de ces ressources de large couverture permet d’obtenir une désambiguïsation syntaxique et lexicale au moins partielle.