@inproceedings{moughit-hafidi-2025-amelioration,
    title = "Am{\'e}lioration et Automatisation de la G{\'e}n{\'e}ration des Cas de Tests Logiciels {\`a} l{'}Aide du Mod{\`e}le Llama",
    author = "Moughit, Imane  and
      Hafidi, Imad",
    editor = "Bechet, Fr{\'e}d{\'e}ric  and
      Chifu, Adrian-Gabriel  and
      Pinel-sauvagnat, Karen  and
      Favre, Benoit  and
      Maes, Eliot  and
      Nurbakova, Diana",
    booktitle = "Actes de l'atelier {\'E}valuation des mod{\`e}les g{\'e}n{\'e}ratifs (LLM) et challenge 2025 (EvalLLM)",
    month = "6",
    year = "2025",
    address = "Marseille, France",
    publisher = "ATALA {\textbackslash}{\textbackslash}{\&} ARIA",
    url = "https://preview.aclanthology.org/ingest-emnlp/2025.jeptalnrecital-evalllm.3/",
    pages = "22--35",
    language = "fra",
    abstract = "L'{\'e}mergence des Large Language Models (LLM) a r{\'e}volutionn{\'e} l{'}ing{\'e}nierie logicielle gr{\^a}ce {\`a} leurs capacit{\'e}s de compr{\'e}hension et de g{\'e}n{\'e}ration du langage naturel. Bien qu{'}ils soient utilis{\'e}s pour la g{\'e}n{\'e}ration automatique de cas de test, les approches actuelles reposant uniquement sur les m{\'e}thodes focales ou sur des descriptions textuelles pr{\'e}sentent des limites: elles peinent {\`a} capturer les comportements attendus, les cas limites et les sc{\'e}narios d{'}erreur, et sont peu compatibles avec le d{\'e}veloppement pilot{\'e} par les tests (TDD). Pour r{\'e}pondre {\`a} ces contraintes, nous proposons une approche hybride (Texte, M{\'e}thodes focales {\textrightarrow} Cas de test), combinant les commentaires pr{\'e}sents dans le code avec la logique de la m{\'e}thode cible. En exploitant le mod{\`e}le LLaMA 3-8B et des techniques de prompt engineering, ainsi que l'{\'e}valuation des cas de test g{\'e}n{\'e}r{\'e}s {\`a} l{'}aide d{'}un LLM en tant que juge, notre m{\'e}thode vise {\`a} automatiser et am{\'e}liorer la g{\'e}n{\'e}ration des cas de test. Test{\'e}e sur des projets open source, elle a permis de g{\'e}n{\'e}rer 7 606 cas de test, avec un taux de correction syntaxique de 97 {\%}."
}Markdown (Informal)
[Amélioration et Automatisation de la Génération des Cas de Tests Logiciels à l’Aide du Modèle Llama](https://preview.aclanthology.org/ingest-emnlp/2025.jeptalnrecital-evalllm.3/) (Moughit & Hafidi, JEP/TALN/RECITAL 2025)
ACL