Normalisation de documents par analyse du contenu à l’aide d’un modèle sémantique et d’un générateur
Abstract
La problématique de la normalisation de documents est introduite et illustrée par des exemples issus de notices pharmaceutiques. Un paradigme pour l’analyse du contenu des documents est proposé. Ce paradigme se base sur la spécification formelle de la sémantique des documents et utilise une notion de similarité floue entre les prédictions textuelles d’un générateur de texte et le texte du document à analyser. Une implémentation initiale du paradigme est présentée.- Anthology ID:
- 2002.jeptalnrecital-recital.8
- Volume:
- Actes de la 9ème conférence sur le Traitement Automatique des Langues Naturelles. REncontres jeunes Chercheurs en Informatique pour le Traitement Automatique des Langues
- Month:
- June
- Year:
- 2002
- Address:
- Nancy, France
- Editor:
- Azim Roussanaly
- Venue:
- JEP/TALN/RECITAL
- SIG:
- Publisher:
- ATALA
- Note:
- Pages:
- 475–484
- Language:
- French
- URL:
- https://aclanthology.org/2002.jeptalnrecital-recital.8
- DOI:
- Cite (ACL):
- Aurélien Max. 2002. Normalisation de documents par analyse du contenu à l’aide d’un modèle sémantique et d’un générateur. In Actes de la 9ème conférence sur le Traitement Automatique des Langues Naturelles. REncontres jeunes Chercheurs en Informatique pour le Traitement Automatique des Langues, pages 475–484, Nancy, France. ATALA.
- Cite (Informal):
- Normalisation de documents par analyse du contenu à l’aide d’un modèle sémantique et d’un générateur (Max, JEP/TALN/RECITAL 2002)
- PDF:
- https://preview.aclanthology.org/nschneid-patch-4/2002.jeptalnrecital-recital.8.pdf