@inproceedings{simard-etal-2005-une,
title = "Une approche {\`a} la traduction automatique statistique par segments discontinus",
author = "Simard, Michel and
Cancedda, Nicola and
Cavestro, Bruno and
Dymetman, Marc and
Gaussier, Eric and
Goutte, Cyril and
Langlais, Philippe and
Mauser, Arne and
Yamada, Kenji",
booktitle = "Actes de la 12{\`e}me conf{\'e}rence sur le Traitement Automatique des Langues Naturelles. Articles longs",
month = jun,
year = "2005",
address = "Dourdan, France",
publisher = "ATALA",
url = "https://aclanthology.org/2005.jeptalnrecital-long.24",
pages = "231--240",
abstract = {Cet article pr{\'e}sente une m{\'e}thode de traduction automatique statistique bas{\'e}e sur des segments non-continus, c{'}est-{\`a}-dire des segments form{\'e}s de mots qui ne se pr{\'e}sentent pas n{\'e}c{\'e}ssairement de fa{\c{c}}on contigu{\"e} dans le texte. On propose une m{\'e}thode pour produire de tels segments {\`a} partir de corpus align{\'e}s au niveau des mots. On pr{\'e}sente {\'e}galement un mod{\`e}le de traduction statistique capable de tenir compte de tels segments, de m{\^e}me qu{'}une m{\'e}thode d{'}apprentissage des param{\`e}tres du mod{\`e}le visant {\`a} maximiser l{'}exactitude des traductions produites, telle que mesur{\'e}e avec la m{\'e}trique NIST. Les traductions optimales sont produites par le biais d{'}une recherche en faisceau. On pr{\'e}sente finalement des r{\'e}sultats exp{\'e}rimentaux, qui d{\'e}montrent comment la m{\'e}thode propos{\'e}e permet une meilleure g{\'e}n{\'e}ralisation {\`a} partir des donn{\'e}es d{'}entra{\^\i}nement.},
language = "French",
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="simard-etal-2005-une">
<titleInfo>
<title>Une approche à la traduction automatique statistique par segments discontinus</title>
</titleInfo>
<name type="personal">
<namePart type="given">Michel</namePart>
<namePart type="family">Simard</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Nicola</namePart>
<namePart type="family">Cancedda</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Bruno</namePart>
<namePart type="family">Cavestro</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Marc</namePart>
<namePart type="family">Dymetman</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Eric</namePart>
<namePart type="family">Gaussier</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Cyril</namePart>
<namePart type="family">Goutte</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Philippe</namePart>
<namePart type="family">Langlais</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Arne</namePart>
<namePart type="family">Mauser</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Kenji</namePart>
<namePart type="family">Yamada</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2005-jun</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">French</languageTerm>
<languageTerm type="code" authority="iso639-2b">fre</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la 12ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs</title>
</titleInfo>
<originInfo>
<publisher>ATALA</publisher>
<place>
<placeTerm type="text">Dourdan, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Cet article présente une méthode de traduction automatique statistique basée sur des segments non-continus, c’est-à-dire des segments formés de mots qui ne se présentent pas nécéssairement de façon contiguë dans le texte. On propose une méthode pour produire de tels segments à partir de corpus alignés au niveau des mots. On présente également un modèle de traduction statistique capable de tenir compte de tels segments, de même qu’une méthode d’apprentissage des paramètres du modèle visant à maximiser l’exactitude des traductions produites, telle que mesurée avec la métrique NIST. Les traductions optimales sont produites par le biais d’une recherche en faisceau. On présente finalement des résultats expérimentaux, qui démontrent comment la méthode proposée permet une meilleure généralisation à partir des données d’entraînement.</abstract>
<identifier type="citekey">simard-etal-2005-une</identifier>
<location>
<url>https://aclanthology.org/2005.jeptalnrecital-long.24</url>
</location>
<part>
<date>2005-jun</date>
<extent unit="page">
<start>231</start>
<end>240</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Une approche à la traduction automatique statistique par segments discontinus
%A Simard, Michel
%A Cancedda, Nicola
%A Cavestro, Bruno
%A Dymetman, Marc
%A Gaussier, Eric
%A Goutte, Cyril
%A Langlais, Philippe
%A Mauser, Arne
%A Yamada, Kenji
%S Actes de la 12ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
%D 2005
%8 jun
%I ATALA
%C Dourdan, France
%G French
%F simard-etal-2005-une
%X Cet article présente une méthode de traduction automatique statistique basée sur des segments non-continus, c’est-à-dire des segments formés de mots qui ne se présentent pas nécéssairement de façon contiguë dans le texte. On propose une méthode pour produire de tels segments à partir de corpus alignés au niveau des mots. On présente également un modèle de traduction statistique capable de tenir compte de tels segments, de même qu’une méthode d’apprentissage des paramètres du modèle visant à maximiser l’exactitude des traductions produites, telle que mesurée avec la métrique NIST. Les traductions optimales sont produites par le biais d’une recherche en faisceau. On présente finalement des résultats expérimentaux, qui démontrent comment la méthode proposée permet une meilleure généralisation à partir des données d’entraînement.
%U https://aclanthology.org/2005.jeptalnrecital-long.24
%P 231-240
Markdown (Informal)
[Une approche à la traduction automatique statistique par segments discontinus](https://aclanthology.org/2005.jeptalnrecital-long.24) (Simard et al., JEP/TALN/RECITAL 2005)
ACL
- Michel Simard, Nicola Cancedda, Bruno Cavestro, Marc Dymetman, Eric Gaussier, Cyril Goutte, Philippe Langlais, Arne Mauser, and Kenji Yamada. 2005. Une approche à la traduction automatique statistique par segments discontinus. In Actes de la 12ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs, pages 231–240, Dourdan, France. ATALA.