Abstract
Nous décrivons une méthode de segmentation morphologique automatique. L’algorithme utilise uniquement une liste des mots d’un corpus et tire parti des probabilités conditionnelles observées entre les sous-chaînes extraites de ce lexique. La méthode est également fondée sur l’utilisation de graphes d’alignement de segments de mots. Le résultat est un découpage de chaque mot sous la forme (préfixe*) + base + (suffixe*). Nous évaluons la pertinence des familles morphologiques découvertes par l’algorithme sur un corpus de textes médicaux français contenant des mots à la structure morphologique complexe.- Anthology ID:
- 2005.jeptalnrecital-recital.4
- Volume:
- Actes de la 12ème conférence sur le Traitement Automatique des Langues Naturelles. REncontres jeunes Chercheurs en Informatique pour le Traitement Automatique des Langues
- Month:
- June
- Year:
- 2005
- Address:
- Dourdan, France
- Editors:
- Nicolas Hernandez, Guillaume Pitel
- Venue:
- JEP/TALN/RECITAL
- SIG:
- Publisher:
- ATALA
- Note:
- Pages:
- 555–564
- Language:
- French
- URL:
- https://aclanthology.org/2005.jeptalnrecital-recital.4
- DOI:
- Cite (ACL):
- Delphine Bernhard. 2005. Segmentation morphologique à partir de corpus. In Actes de la 12ème conférence sur le Traitement Automatique des Langues Naturelles. REncontres jeunes Chercheurs en Informatique pour le Traitement Automatique des Langues, pages 555–564, Dourdan, France. ATALA.
- Cite (Informal):
- Segmentation morphologique à partir de corpus (Bernhard, JEP/TALN/RECITAL 2005)
- PDF:
- https://preview.aclanthology.org/nschneid-patch-4/2005.jeptalnrecital-recital.4.pdf