UPERY : un outil d’analyse distributionnelle étendue pour la construction d’ontologies à partir de corpus

Didier Bourigault


Abstract
Nous présentons un module mettant en oeuvre une méthode d’analyse distributionnelle dite “étendue”. L’analyseur syntaxique de corpus SYNTEX effectue l’analyse en dépendance de chacune des phrases du corpus, puis construit un réseau de mots et syntagmes, dans lequel chaque syntagme est relié à sa tête et à ses expansions. A partir de ce réseau, le module d’analyse distributionnelle UPERY construit pour chaque terme du réseau l’ensemble de ses contextes syntaxiques. Les termes et les contextes syntaxiques peuvent être simples ou complexes. Le module rapproche ensuite les termes, ainsi que les contextes syntaxiques, sur la base de mesures de proximité distributionnelle. L’ensemble de ces résultats est utilisé comme aide à la construction d’ontologie à partir de corpus spécialisés.
Anthology ID:
2002.jeptalnrecital-long.5
Volume:
Actes de la 9ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
Month:
June
Year:
2002
Address:
Nancy, France
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
75–84
Language:
French
URL:
https://aclanthology.org/2002.jeptalnrecital-long.5
DOI:
Bibkey:
Cite (ACL):
Didier Bourigault. 2002. UPERY : un outil d’analyse distributionnelle étendue pour la construction d’ontologies à partir de corpus. In Actes de la 9ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs, pages 75–84, Nancy, France. ATALA.
Cite (Informal):
UPERY : un outil d’analyse distributionnelle étendue pour la construction d’ontologies à partir de corpus (Bourigault, JEP/TALN/RECITAL 2002)
Copy Citation:
PDF:
https://preview.aclanthology.org/emnlp-22-attachments/2002.jeptalnrecital-long.5.pdf