Abstract
Cet article décrit une méthode qui combine des hypothèses graphémiques et phonétiques au niveau de la phrase, à l’aide d’une réprésentation en automates à états finis et d’un modèle de langage, pour la réécriture de phrases tapées au clavier par des dysorthographiques. La particularité des écrits dysorthographiés qui empêche les correcteurs orthographiques d’être efficaces pour cette tâche est une segmentation en mots parfois incorrecte. La réécriture diffère de la correction en ce sens que les phrases réécrites ne sont pas à destination de l’utilisateur mais d’un système automatique, tel qu’un moteur de recherche. De ce fait l’évaluation est conduite sur des versions filtrées et lemmatisées des phrases. Le taux d’erreurs mots moyen passe de 51 % à 20 % avec notre méthode, et est de 0 % sur 43 % des phrases testées.- Anthology ID:
- 2007.jeptalnrecital-poster.26
- Volume:
- Actes de la 14ème conférence sur le Traitement Automatique des Langues Naturelles. Posters
- Month:
- June
- Year:
- 2007
- Address:
- Toulouse, France
- Editors:
- Nabil Hathout, Philippe Muller
- Venue:
- JEP/TALN/RECITAL
- SIG:
- Publisher:
- ATALA
- Note:
- Pages:
- 263–272
- Language:
- French
- URL:
- https://aclanthology.org/2007.jeptalnrecital-poster.26
- DOI:
- Cite (ACL):
- Laurianne Sitbon, Patrice Bellot, and Philippe Blache. 2007. Traitements phrastiques phonétiques pour la réécriture de phrases dysorthographiées. In Actes de la 14ème conférence sur le Traitement Automatique des Langues Naturelles. Posters, pages 263–272, Toulouse, France. ATALA.
- Cite (Informal):
- Traitements phrastiques phonétiques pour la réécriture de phrases dysorthographiées (Sitbon et al., JEP/TALN/RECITAL 2007)
- PDF:
- https://preview.aclanthology.org/proper-vol2-ingestion/2007.jeptalnrecital-poster.26.pdf