@inproceedings{coch-adam-2023-temitalc,
title = "{TEMITALC} : Text Mining et {TAL} pour Analyser le Langage des Cachalots",
author = "Coch, Jose and
Adam, Olivier",
editor = "Servan, Christophe and
Vilnat, Anne",
booktitle = "Actes de CORIA-TALN 2023. Actes de la 30e Conf{\'e}rence sur le Traitement Automatique des Langues Naturelles (TALN), volume 6 : projets",
month = "6",
year = "2023",
address = "Paris, France",
publisher = "ATALA",
url = "https://preview.aclanthology.org/jlcl-multiple-ingestion/2023.jeptalnrecital-projet.4/",
pages = "23--25",
language = "fra",
abstract = {Les cachalots (Physeter macrocephalus) sont les plus grands des c{\'e}tac{\'e}s {\`a} dents. Comme tous les c{\'e}tac{\'e}s, ils communiquent notamment par des {\'e}missions vocales. Les cachalots produisent des clics au cours de leurs activit{\'e}s vitales et leurs interactions sociales. Certains de ces sons sont organis{\'e}s en s{\'e}quences temporelles, appel{\'e}es {\guillemotleft} codas {\guillemotright}. Depuis plus d`une dizaine d`ann{\'e}es, des {\'e}changes audio ou {\guillemotleft} conversations {\guillemotright} entre cachalots sont enregistr{\'e}s dans de nombreux endroits dans le monde, par exemple dans l`Oc{\'e}an Pacifique, dans les Cara{\"i}bes et dans l`Oc{\'e}an Indien. La particularit{\'e} des {\'e}changes vocaux entre cachalots fait que ces codas sont num{\'e}risables relativement facilement. Ainsi, il existe des corpus de transcriptions de conversations en particulier venant des origines g{\'e}ographiques cit{\'e}es. Durant 2022, une collaboration entre le Service NLP de Dassault Syst{\`e}mes et l'{\'e}quipe Bioacoustique de Sorbonne Universit{\'e}, bas{\'e}e sur les enregistrements sonores collect{\'e}s et mis {\`a} disposition par Longitude 181 et Label Bleu Production, nous a permis d`initier un projet d`application des techniques de Text Mining et Traitement Automatique du Langage {\`a} l'{\'e}tude du langage des cachalots. Nous avons expos{\'e} les premiers r{\'e}sultats du projet dans un article publi{\'e} dans les Actes de l`atelier TextMine`23 de la conf{\'e}rence EGC`2023 concernant un corpus de cachalots r{\'e}sidents au large de l`Ile Maurice et identifi{\'e}s individuellement. Nous utilisons dans ce projet le logiciel Proxem Studio, qui a la particularit{\'e} de pouvoir {\^e}tre appliqu{\'e} sans mod{\`e}le de langue pr{\'e}alable car il peut construire des mod{\`e}les de langue {\`a} partir des corpus {\`a} analyser. L`objectif du projet couvre les points suivants : - Optimiser et automatiser la transcription en codas des {\'e}changes audio entre cachalots, - Analyser les propri{\'e}t{\'e}s formelles du langage des cachalots : mettre en {\'e}vidence que l`ordre entre codas a une importance, et d{\'e}couvrir s{\textquoteleft}il est possible de d{\'e}crire une proto-syntaxe de ce langage, - Mettre au point un r{\'e}f{\'e}rentiel d'{\'e}l{\'e}ments non linguistiques (comportements sociaux, donn{\'e}es d{\'e}mographiques, relations familiales) et identifier des codas ou des s{\'e}quences de codas montrant une corr{\'e}lation avec ces {\'e}l{\'e}ments non linguistiques, et in fine, avancer des hypoth{\`e}ses sur la fonction de certaines codas ou s{\'e}quences de codas, - Etudier les corr{\'e}lations entre les participants {\`a} chaque conversation et les codas {\'e}mis afin de d{\'e}terminer si des codas ou s{\'e}quences de codas peuvent {\^e}tre associ{\'e}es {\`a} des individus. Le projet b{\'e}n{\'e}ficie d`un financement de Dassault Syst{\`e}mes et de Sorbonne Universit{\'e}. La fin du projet est pr{\'e}vue pour d{\'e}cembre 2024. Nos r{\'e}sultats vont contribuer ainsi {\`a} d{\'e}crire le sophistiqu{\'e} langage d`une esp{\`e}ce non-humaine.}
}
Markdown (Informal)
[TEMITALC : Text Mining et TAL pour Analyser le Langage des Cachalots](https://preview.aclanthology.org/jlcl-multiple-ingestion/2023.jeptalnrecital-projet.4/) (Coch & Adam, JEP/TALN/RECITAL 2023)
ACL