Utiliser des sens de mots pour la segmentation thématique ?

Olivier Ferret


Abstract
La segmentation thématique est un domaine de l’analyse discursive ayant donné lieu à de nombreux travaux s’appuyant sur la notion de cohésion lexicale. La plupart d’entre eux n’exploitent que la simple récurrence lexicale mais quelques uns ont néanmoins exploré l’usage de connaissances rendant compte de cette cohésion lexicale. Celles-ci prennent généralement la forme de réseaux lexicaux, soit construits automatiquement à partir de corpus, soit issus de dictionnaires élaborés manuellement. Dans cet article, nous examinons dans quelle mesure une ressource d’une nature un peu différente peut être utilisée pour caractériser la cohésion lexicale des textes. Il s’agit en l’occurrence de sens de mots induits automatiquement à partir de corpus, à l’instar de ceux produits par la tâche «Word Sense Induction and Discrimination » de l’évaluation SemEval 2007. Ce type de ressources apporte une structuration des réseaux lexicaux au niveau sémantique dont nous évaluons l’apport pour la segmentation thématique.
Anthology ID:
2009.jeptalnrecital-court.46
Volume:
Actes de la 16ème conférence sur le Traitement Automatique des Langues Naturelles. Articles courts
Month:
June
Year:
2009
Address:
Senlis, France
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
423–432
Language:
French
URL:
https://aclanthology.org/2009.jeptalnrecital-court.46
DOI:
Bibkey:
Cite (ACL):
Olivier Ferret. 2009. Utiliser des sens de mots pour la segmentation thématique ?. In Actes de la 16ème conférence sur le Traitement Automatique des Langues Naturelles. Articles courts, pages 423–432, Senlis, France. ATALA.
Cite (Informal):
Utiliser des sens de mots pour la segmentation thématique ? (Ferret, JEP/TALN/RECITAL 2009)
Copy Citation:
PDF:
https://preview.aclanthology.org/auto-file-uploads/2009.jeptalnrecital-court.46.pdf