2019
pdf
bib
Traitement Automatique des Langues, Volume 60, Numéro 3 : TAL et humanités numériques [NLP and Digital Humanities]
Jean-Gabriel Ganascia
|
Francesca Frontini
Traitement Automatique des Langues, Volume 60, Numéro 3 : TAL et humanités numériques [NLP and Digital Humanities]
pdf
bib
TAL et humanités numériques [NLP and Digital Humanities]
Jean-Gabriel Ganascia
|
Francesca Frontini
Traitement Automatique des Langues, Volume 60, Numéro 3 : TAL et humanités numériques [NLP and Digital Humanities]
2015
pdf
abs
Une mesure d’intérêt à base de surreprésentation pour l’extraction des motifs syntaxiques stylistiques
Mohamed Amine Boukhaled
|
Francesca Frontini
|
Jean-Gabriel Ganascia
Actes de la 22e conférence sur le Traitement Automatique des Langues Naturelles. Articles courts
Dans cette contribution, nous présentons une étude sur la stylistique computationnelle des textes de la littérature classiques française fondée sur une approche conduite par données, où la découverte des motifs linguistiques intéressants se fait sans aucune connaissance préalable. Nous proposons une mesure objective capable de capturer et d’extraire des motifs syntaxiques stylistiques significatifs à partir d’un œuvre d’un auteur donné. Notre hypothèse de travail est fondée sur le fait que les motifs syntaxiques les plus pertinents devraient refléter de manière significative le choix stylistique de l’auteur, et donc ils doivent présenter une sorte de comportement de surreprésentation contrôlé par les objectifs de l’auteur. Les résultats analysés montrent l’efficacité dans l’extraction de motifs syntaxiques intéressants dans le texte littéraire français classique, et semblent particulièrement prometteurs pour les analyses de ce type particulier de texte.
pdf
abs
Extraction et analyse automatique des comparaisons et des pseudo-comparaisons pour la détection des comparaisons figuratives
Suzanne Mpouli
|
Jean-Gabriel Ganascia
Actes de la 22e conférence sur le Traitement Automatique des Langues Naturelles. Articles courts
Le présent article s’intéresse à la détection et à la désambiguïsation des comparaisons figuratives. Il décrit un algorithme qui utilise un analyseur syntaxique de surface (chunker) et des règles manuelles afin d’extraire et d’analyser les (pseudo-)comparaisons présentes dans un texte. Cet algorithme, évalué sur un corpus de textes littéraires, donne de meilleurs résultats qu’un système reposant sur une analyse syntaxique profonde.
pdf
bib
abs
MEDITE : logiciel d’alignement de textes pour l’étude de la génétique textuelle
Zied Sellami
|
Jean-Gabriel Ganascia
|
Mohamed Amine Boukhaled
Actes de la 22e conférence sur le Traitement Automatique des Langues Naturelles. Démonstrations
MEDITE est un logiciel d’alignement de textes permettant l’identification de transformations entre une version et une autre d’un même texte. Dans ce papier nous présentons les aspects théoriques et techniques de MEDITE.
pdf
bib
abs
Phœbus : un Logiciel d’Extraction de Réutilisations dans des Textes Littéraires
Mohamed Amine Boukhaled
|
Zied Sellami
|
Jean-Gabriel Ganascia
Actes de la 22e conférence sur le Traitement Automatique des Langues Naturelles. Démonstrations
Phœbus est un logiciel d’extraction de réutilisations dans des textes littéraires. Il a été développé comme un outil d’analyse littéraire assistée par ordinateur. Dans ce contexte, ce logiciel détecte automatiquement et explore des réseaux de réutilisation textuelle dans la littérature classique.
2007
pdf
abs
Alignements monolingues avec déplacements
Julien Bourdaillet
|
Jean-Gabriel Ganascia
Actes de la 14ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
Ce travail présente une application d’alignement monolingue qui répond à une problématique posée par la critique génétique textuelle, une école d’études littéraires qui s’intéresse à la genèse textuelle en comparant les différentes versions d’une oeuvre. Ceci nécessite l’identification des déplacements, cependant, le problème devient ainsi NP-complet. Notre algorithme heuristique est basé sur la reconnaissance des homologies entre séquences de caractères. Nous présentons une validation expérimentale et montrons que notre logiciel obtient de bons résultats ; il permet notamment l’alignement de livres entiers.
2005
pdf
abs
Etiquetage morpho-syntaxique du français à base d’apprentissage supervisé
Julien Bourdaillet
|
Jean-Gabriel Ganascia
Actes de la 12ème conférence sur le Traitement Automatique des Langues Naturelles. Articles courts
Nous présentons un étiqueteur morpho-syntaxique du français. Celui-ci utilise l’apprentissage supervisé à travers un modèle de Markov caché. Le modèle de langage est appris à partir d’un corpus étiqueté. Nous décrivons son fonctionnement et la méthode d’apprentissage. L’étiqueteur atteint un score de précision de 89 % avec un jeu d’étiquettes très riche. Nous présentons ensuite des résultats détaillés pour chaque classe grammaticale et étudions en particulier la reconnaissance des homographes.
2001
pdf
abs
Extraction automatique de motifs syntaxiques
Jean-Gabriel Ganascia
Actes de la 8ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
Cet article présente un nouvel algorithme de détection de motifs syntaxiques récurrents dans les textes écrits en langage naturel. Il décrit d’abord l’algorithme d’extraction fondé sur un modèle d’édition généralisé à des arbres stratifiés ordonnés (ASO). Il décrit ensuite les expérimentations qui valident l’approche préconisée sur des textes de la littérature française classique des XVIIIe et XIXe siècle. Une sous-partie est consacrée à l’évaluation empirique de la complexité algorithmique. La dernière sous-partie donnera quelques exemples de motifs récurrents typiques d’un auteur du XVIIIe siècle, Madame de Lafayette.