Identification of complex words and passages in medical documents in French
Kim Cheng Sheang, Anaïs Koptient, Natalia Grabar, Horacio Saggion
Abstract
Identification de mots et passages difficiles dans les documents médicaux en français. L’objectif de la simplification automatique des textes consiste à fournir une nouvelle version de documents qui devient plus facile à comprendre pour une population donnée ou plus facile à traiter par d’autres applications du TAL. Cependant, avant d’effectuer la simplification, il est important de savoir ce qu’il faut simplifier exactement dans les documents. En effet, même dans les documents techniques et spécialisés, il n’est pas nécessaire de tout simplifier mais juste les segments qui présentent des difficultés de compréhension. Il s’agit typiquement de la tâche d’identification de mots complexes : effectuer le diagnostic de difficulté d’un document donné pour y détecter les mots et passages complexes. Nous proposons de travail sur l’identification de mots et passages complexes dans les documents biomédicaux en français.- Anthology ID:
- 2022.jeptalnrecital-taln.11
- Volume:
- Actes de la 29e Conférence sur le Traitement Automatique des Langues Naturelles. Volume 1 : conférence principale
- Month:
- 6
- Year:
- 2022
- Address:
- Avignon, France
- Venue:
- JEP/TALN/RECITAL
- SIG:
- Publisher:
- ATALA
- Note:
- Pages:
- 116–125
- Language:
- URL:
- https://aclanthology.org/2022.jeptalnrecital-taln.11
- DOI:
- Cite (ACL):
- Kim Cheng Sheang, Anaïs Koptient, Natalia Grabar, and Horacio Saggion. 2022. Identification of complex words and passages in medical documents in French. In Actes de la 29e Conférence sur le Traitement Automatique des Langues Naturelles. Volume 1 : conférence principale, pages 116–125, Avignon, France. ATALA.
- Cite (Informal):
- Identification of complex words and passages in medical documents in French (Cheng Sheang et al., JEP/TALN/RECITAL 2022)
- PDF:
- https://preview.aclanthology.org/ingestion-script-update/2022.jeptalnrecital-taln.11.pdf