@inproceedings{njomgue-sado-fontaine-2005-de,
title = "De la linguistique aux statistiques pour indexer des documents dans un r{\'e}f{\'e}rentiel m{\'e}tier",
author = "Njomgue Sado, Wilfried and
Fontaine, Dominique",
booktitle = "Actes de la 12{\`e}me conf{\'e}rence sur le Traitement Automatique des Langues Naturelles. REncontres jeunes Chercheurs en Informatique pour le Traitement Automatique des Langues (articles courts)",
month = jun,
year = "2005",
address = "Dourdan, France",
publisher = "ATALA",
url = "https://aclanthology.org/2005.jeptalnrecital-recitalcourt.9",
pages = "685--690",
abstract = "Cet article pr{\'e}sente une m{\'e}thode d{'}indexation automatique de documents bas{\'e}e sur une approche linguistique et statistique. Cette derni{\`e}re est une combinaison s{\'e}quentielle de l{'}analyse linguistique du document {\`a} indexer par l{'}extraction des termes significatifs du document et de l{'}analyse statistique par la d{\'e}composition en valeurs singuli{\`e}res des mots composant le document. La pond{\'e}ration des termes tire avantage de leur contexte local, par rapport au document, global, par rapport {\`a} la base de donn{\'e}es, et de leur position par rapport aux autres termes, les co-occurrences. Le syst{\`e}me d{'}indexation pr{\'e}sent{\'e} fait des propositions d{'}affectations du document {\`a} un r{\'e}f{\'e}rentiel m{\'e}tier dont les th{\`e}mes sont pr{\'e}d{\'e}finis. Nous pr{\'e}sentons les r{\'e}sultats de l{'}exp{\'e}rimentation de ce syst{\`e}me men{\'e}e sur un corpus des p{\^o}les m{\'e}tiers de la soci{\'e}t{\'e} Suez-Environnement.",
language = "French",
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="njomgue-sado-fontaine-2005-de">
<titleInfo>
<title>De la linguistique aux statistiques pour indexer des documents dans un référentiel métier</title>
</titleInfo>
<name type="personal">
<namePart type="given">Wilfried</namePart>
<namePart type="family">Njomgue Sado</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Dominique</namePart>
<namePart type="family">Fontaine</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2005-jun</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">French</languageTerm>
<languageTerm type="code" authority="iso639-2b">fre</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la 12ème conférence sur le Traitement Automatique des Langues Naturelles. REncontres jeunes Chercheurs en Informatique pour le Traitement Automatique des Langues (articles courts)</title>
</titleInfo>
<originInfo>
<publisher>ATALA</publisher>
<place>
<placeTerm type="text">Dourdan, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Cet article présente une méthode d’indexation automatique de documents basée sur une approche linguistique et statistique. Cette dernière est une combinaison séquentielle de l’analyse linguistique du document à indexer par l’extraction des termes significatifs du document et de l’analyse statistique par la décomposition en valeurs singulières des mots composant le document. La pondération des termes tire avantage de leur contexte local, par rapport au document, global, par rapport à la base de données, et de leur position par rapport aux autres termes, les co-occurrences. Le système d’indexation présenté fait des propositions d’affectations du document à un référentiel métier dont les thèmes sont prédéfinis. Nous présentons les résultats de l’expérimentation de ce système menée sur un corpus des pôles métiers de la société Suez-Environnement.</abstract>
<identifier type="citekey">njomgue-sado-fontaine-2005-de</identifier>
<location>
<url>https://aclanthology.org/2005.jeptalnrecital-recitalcourt.9</url>
</location>
<part>
<date>2005-jun</date>
<extent unit="page">
<start>685</start>
<end>690</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T De la linguistique aux statistiques pour indexer des documents dans un référentiel métier
%A Njomgue Sado, Wilfried
%A Fontaine, Dominique
%S Actes de la 12ème conférence sur le Traitement Automatique des Langues Naturelles. REncontres jeunes Chercheurs en Informatique pour le Traitement Automatique des Langues (articles courts)
%D 2005
%8 jun
%I ATALA
%C Dourdan, France
%G French
%F njomgue-sado-fontaine-2005-de
%X Cet article présente une méthode d’indexation automatique de documents basée sur une approche linguistique et statistique. Cette dernière est une combinaison séquentielle de l’analyse linguistique du document à indexer par l’extraction des termes significatifs du document et de l’analyse statistique par la décomposition en valeurs singulières des mots composant le document. La pondération des termes tire avantage de leur contexte local, par rapport au document, global, par rapport à la base de données, et de leur position par rapport aux autres termes, les co-occurrences. Le système d’indexation présenté fait des propositions d’affectations du document à un référentiel métier dont les thèmes sont prédéfinis. Nous présentons les résultats de l’expérimentation de ce système menée sur un corpus des pôles métiers de la société Suez-Environnement.
%U https://aclanthology.org/2005.jeptalnrecital-recitalcourt.9
%P 685-690
Markdown (Informal)
[De la linguistique aux statistiques pour indexer des documents dans un référentiel métier](https://aclanthology.org/2005.jeptalnrecital-recitalcourt.9) (Njomgue Sado & Fontaine, JEP/TALN/RECITAL 2005)
ACL