Ljudmila Petkovic


2024

pdf bib
Analyse multilingue de l’impact de la correction automatique de la ROC sur la reconnaissance d’entités nommées spatiales dans des corpus littéraires [Multilingual Analysis of the Impact of Automatic OCR Correction on Spatial Recognition of Spatial Named Entities in Literary Corpora]
Caroline Koudoro-Parfait | Ljudmila Petkovic | Glenn Roe
Traitement Automatique des Langues, Volume 64, Numéro 2 : Robustesse et limites des modèles de traitement automatique des langues [Robustness and limits of NLP models]

2022

pdf bib
Toolbox : une chaîne de traitement de corpus pour les humanités numériques (Toolbox : a corpus processing pipeline for digital humanities)
Johanna Mayra Cordova | Yoann Dupont | Ljudmila Petkovic | James Gawley | Motasem Alrahabi | Glenn Roe
Actes de la 29e Conférence sur le Traitement Automatique des Langues Naturelles. Volume 3 : Démonstrations

Le projet Toolbox propose une chaîne de traitement pour la manipulation et le traitement de corpus textuels incluant la numérisation (OCR/HTR), la conversion au format TEI, la fouille de texte (reconnaissance d’entités nommées) et la visualisation de données. Les fonctionnalités sont accessibles via une interface en ligne qui sert de surcouche graphique à des scripts développés par nos soins ou utilisant des outils externes. Elles permettent d’automatiser les tâches élémentaires de traitement de corpus pour les chercheurs en humanités numériques. Cet outil est ouvert aux contributions externes.