Classification multi-label de cas cliniques avec CamemBERT (Multi-label classification of clinical cases with CamemBERT )

Alexandre Bailly, Corentin Blanc, Thierry Guillotin


Abstract
La quantité de documents textuels médicaux allant grandissant, la nécessité d’en extraire automatiquement des informations concernant des patients devient de plus en plus grande. La prédiction du profil clinique permet de gagner du temps pour le praticien tout en extrayant l’essentiel de l’information concernant un patient. Avec l’explosion du nombre de documents (médicaux ou non), des modèles pré-entraînés tels que BERT pour l’anglais ou CamemBERT pour le français ont émergé. L’utilisation de ces modèles permet d’encoder contextuellement du texte afin de l’utiliser dans des réseaux neuronaux pour notamment prédire des profils cliniques. Cet article vise à comparer différentes méthodes de prédiction de profil clinique en se basant sur l’utilisation de CamemBERT. Dans un premier temps, uniquement du texte provenant de documents médicaux a été utilisé. Dans un second temps, des entités nommées ont été injectées en plus du texte par concaténation ou par sommation pondérée. Les résultats ont montré un succès limité et dépendant de la prévalence des chapitres à prédire dans le corpus ainsi qu’une dégradation des performances lors de l’ajout des entités nommées.
Anthology ID:
2021.jeptalnrecital-deft.2
Volume:
Actes de la 28e Conférence sur le Traitement Automatique des Langues Naturelles. Atelier DÉfi Fouille de Textes (DEFT)
Month:
6
Year:
2021
Address:
Lille, France
Editors:
Cyril Grouin, Natalia Grabar, Gabriel Illouz
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
14–20
Language:
French
URL:
https://aclanthology.org/2021.jeptalnrecital-deft.2
DOI:
Bibkey:
Cite (ACL):
Alexandre Bailly, Corentin Blanc, and Thierry Guillotin. 2021. Classification multi-label de cas cliniques avec CamemBERT (Multi-label classification of clinical cases with CamemBERT ). In Actes de la 28e Conférence sur le Traitement Automatique des Langues Naturelles. Atelier DÉfi Fouille de Textes (DEFT), pages 14–20, Lille, France. ATALA.
Cite (Informal):
Classification multi-label de cas cliniques avec CamemBERT (Multi-label classification of clinical cases with CamemBERT ) (Bailly et al., JEP/TALN/RECITAL 2021)
Copy Citation:
PDF:
https://preview.aclanthology.org/landing_page/2021.jeptalnrecital-deft.2.pdf