Abstract
L’objectif de notre travail est d’évaluer l’intérêt d’employer les n-grammes et l’analyse factorielle des correspondances (AFC) pour comparer les genres textuels dans les études contrastives interlinguistiques. Nous exploitons un corpus bilingue anglais-français constitué de textes originaux comparables. Le corpus réunit trois genres : les débats parlementaires européens, les éditoriaux de presse et les articles scientifiques. Dans un premier temps, les n-grammes d’une longueur de 2 à 4 mots sont extraits dans chaque langue. Ensuite, pour chaque longueur, les 1 000 n-grammes les plus fréquents dans chaque langue sont traités par l’AFC pour déterminer quels n-grammes sont particulièrement saillants dans les genres étudiés. Enfin, les n-grammes sont catégorisés manuellement en distinguant les expressions d’opinion et de certitude, les marqueurs discursifs et les expressions référentielles. Les résultats montrent que les n-grammes permettent de mettre au jour des caractéristiques typiques des genres étudiés, de même que des contrastes interlangues intéressants.- Anthology ID:
- 2016.jeptalnrecital-poster.31
- Volume:
- Actes de la conférence conjointe JEP-TALN-RECITAL 2016. volume 2 : TALN (Posters)
- Month:
- 7
- Year:
- 2016
- Address:
- Paris, France
- Editors:
- Laurence Danlos, Thierry Hamon
- Venue:
- JEP/TALN/RECITAL
- SIG:
- Publisher:
- AFCP - ATALA
- Note:
- Pages:
- 555–563
- Language:
- French
- URL:
- https://aclanthology.org/2016.jeptalnrecital-poster.31
- DOI:
- Cite (ACL):
- Marie-Aude Lefer, Yves Bestgen, and Natalia Grabar. 2016. Vers une analyse des différences interlinguistiques entre les genres textuels : étude de cas basée sur les n-grammes et l’analyse factorielle des correspondances (Towards a cross-linguistic analysis of genres: A case study based on n-grams and Correspondence Analysis). In Actes de la conférence conjointe JEP-TALN-RECITAL 2016. volume 2 : TALN (Posters), pages 555–563, Paris, France. AFCP - ATALA.
- Cite (Informal):
- Vers une analyse des différences interlinguistiques entre les genres textuels : étude de cas basée sur les n-grammes et l’analyse factorielle des correspondances (Towards a cross-linguistic analysis of genres: A case study based on n-grams and Correspondence Analysis) (Lefer et al., JEP/TALN/RECITAL 2016)
- PDF:
- https://preview.aclanthology.org/nschneid-patch-4/2016.jeptalnrecital-poster.31.pdf