@inproceedings{radola-yvon-2025-alignements,
title = "Alignements divisifs de textes parall{\`e}les: donn{\'e}es, algorithme et {\'e}valuation",
author = "Rado{\l}a, Joanna and
Yvon, Fran{\c{c}}ois",
editor = "Bechet, Fr{\'e}d{\'e}ric and
Chifu, Adrian-Gabriel and
Pinel-sauvagnat, Karen and
Favre, Benoit and
Maes, Eliot and
Nurbakova, Diana",
booktitle = "Actes des 32{\`e}me Conf{\'e}rence sur le Traitement Automatique des Langues Naturelles (TALN), volume 1 : articles scientifiques originaux",
month = "6",
year = "2025",
address = "Marseille, France",
publisher = "ATALA {\textbackslash}{\textbackslash}{\&} ARIA",
url = "https://preview.aclanthology.org/corrections-2025-10/2025.jeptalnrecital-taln.5/",
pages = "84--99",
language = "fra",
abstract = "Nous pr{\'e}sentons Alibi - un corpus d{'}alignements hi{\'e}rarchiques sous-phrastiques fran{\c{c}}ais-anglais, annot{\'e} manuellement {\`a} l{'}aide d{'}une strat{\'e}gie divisive. Nous comparons globalement les alignements ainsi obtenus avec plusieurs corpus parall{\`e}les align{\'e}s mot-{\`a}-mot et {\'e}talonnons sa difficult{\'e} en r{\'e}alisant des alignements automatiques par des m{\'e}thodes de l'{\'e}tat de l{'}art. Nous proposons {\'e}galement un algorithme exploitant des repr{\'e}sentations neuronales des mots et des groupes de mots afin de repro- duire les alignements hi{\'e}rarchiques de r{\'e}f{\'e}rence. Enfin, nous proposons une m{\'e}trique d'{\'e}valuation des arbres d{'}alignement avec laquelle nous comparons les performances de plusieurs variantes de l{'}algorithme d{'}alignement, obtenues en faisant varier les mesures d{'}appariemment de groupes de mots. Nos r{\'e}sultats montrent que (a) les arbres d{'}alignements de r{\'e}f{\'e}rence sont tr{\`e}s ambigus et difficiles {\`a} reproduire automatiquement, cependant, les alignements mot-{\`a}-mot sont pr{\'e}dits de mani{\`e}re fiable ; (b) l{'}utilisation d{'}alternatives {\`a} la similarit{\'e} cosinus pour {\'e}valuer l{'}appariemment de blocs permet d{'}am{\'e}liorer significativement les r{\'e}sultats du syst{\`e}me de base."
}
Markdown (Informal)
[Alignements divisifs de textes parallèles: données, algorithme et évaluation](https://preview.aclanthology.org/corrections-2025-10/2025.jeptalnrecital-taln.5/) (Radoła & Yvon, JEP/TALN/RECITAL 2025)
ACL