Wangari Kimotho - ACL Anthology

This is an internal, incomplete preview of a proposed change to the ACL Anthology. For efficiency reasons, we generate only three BibTeX files per volume, and the preview may be incomplete in other ways, or contain mistakes. Do not treat this content as an official publication.

Wangari Kimotho

2024

pdf abs
AfriMTE and AfriCOMET: Enhancing COMET to Embrace Under-resourced African Languages
Jiayi Wang | David Adelani | Sweta Agrawal | Marek Masiak | Ricardo Rei | Eleftheria Briakou | Marine Carpuat | Xuanli He | Sofia Bourhim | Andiswa Bukula | Muhidin Mohamed | Temitayo Olatoye | Tosin Adewumi | Hamam Mokayed | Christine Mwase | Wangui Kimotho | Foutse Yuehgoh | Anuoluwapo Aremu | Jessica Ojo | Shamsuddeen Muhammad | Salomey Osei | Abdul-Hakeem Omotayo | Chiamaka Chukwuneke | Perez Ogayo | Oumaima Hourrane | Salma El Anigri | Lolwethu Ndolela | Thabiso Mangwana | Shafie Mohamed | Hassan Ayinde | Oluwabusayo Awoyomi | Lama Alkhaled | Sana Al-azzawi | Naome Etori | Millicent Ochieng | Clemencia Siro | Njoroge Kiragu | Eric Muchiri | Wangari Kimotho | Toadoum Sari Sakayo | Lyse Naomi Wamba | Daud Abolade | Simbiat Ajao | Iyanuoluwa Shode | Ricky Macharm | Ruqayya Iro | Saheed Abdullahi | Stephen Moore | Bernard Opoku | Zainab Akinjobi | Abeeb Afolabi | Nnaemeka Obiefuna | Onyekachi Ogbu | Sam Ochieng’ | Verrah Otiende | Chinedu Mbonu | Yao Lu | Pontus Stenetorp
Proceedings of the 2024 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies (Volume 1: Long Papers)

Despite the recent progress on scaling multilingual machine translation (MT) to several under-resourced African languages, accurately measuring this progress remains challenging, since evaluation is often performed on n-gram matching metrics such as BLEU, which typically show a weaker correlation with human judgments. Learned metrics such as COMET have higher correlation; however, the lack of evaluation data with human ratings for under-resourced languages, complexity of annotation guidelines like Multidimensional Quality Metrics (MQM), and limited language coverage of multilingual encoders have hampered their applicability to African languages. In this paper, we address these challenges by creating high-quality human evaluation data with simplified MQM guidelines for error detection and direct assessment (DA) scoring for 13 typologically diverse African languages. Furthermore, we develop AfriCOMET: COMET evaluation metrics for African languages by leveraging DA data from well-resourced languages and an African-centric multilingual encoder (AfroXLM-R) to create the state-of-the-art MT evaluation metrics for African languages with respect to Spearman-rank correlation with human judgments (0.441).

2023

pdf
MasakhaNEWS: News Topic Classification for African languages
David Ifeoluwa Adelani | Marek Masiak | Israel Abebe Azime | Jesujoba Alabi | Atnafu Lambebo Tonja | Christine Mwase | Odunayo Ogundepo | Bonaventure F. P. Dossou | Akintunde Oladipo | Doreen Nixdorf | Chris Chinenye Emezue | Sana Al-azzawi | Blessing Sibanda | Davis David | Lolwethu Ndolela | Jonathan Mukiibi | Tunde Ajayi | Tatiana Moteu | Brian Odhiambo | Abraham Owodunni | Nnaemeka Obiefuna | Muhidin Mohamed | Shamsuddeen Hassan Muhammad | Teshome Mulugeta Ababu | Saheed Abdullahi Salahudeen | Mesay Gemeda Yigezu | Tajuddeen Gwadabe | Idris Abdulmumin | Mahlet Taye | Oluwabusayo Awoyomi | Iyanuoluwa Shode | Tolulope Adelani | Habiba Abdulganiyu | Abdul-Hakeem Omotayo | Adetola Adeeko | Abeeb Afolabi | Anuoluwapo Aremu | Olanrewaju Samuel | Clemencia Siro | Wangari Kimotho | Onyekachi Ogbu | Chinedu Mbonu | Chiamaka Chukwuneke | Samuel Fanijo | Jessica Ojo | Oyinkansola Awosan | Tadesse Kebede | Toadoum Sari Sakayo | Pamela Nyatsine | Freedmore Sidume | Oreen Yousuf | Mardiyyah Oduwole | Kanda Tshinu | Ussen Kimanuka | Thina Diko | Siyanda Nxakama | Sinodos Nigusse | Abdulmejid Johar | Shafie Mohamed | Fuad Mire Hassan | Moges Ahmed Mehamed | Evrard Ngabire | Jules Jules | Ivan Ssenkungu | Pontus Stenetorp
Proceedings of the 13th International Joint Conference on Natural Language Processing and the 3rd Conference of the Asia-Pacific Chapter of the Association for Computational Linguistics (Volume 1: Long Papers)

Co-authors

Abdul-Hakeem Omotayo 2

Chiamaka Chukwuneke 2

Lolwethu Ndolela 2

Shafie Mohamed 2

Oluwabusayo Awoyomi 2

Sana Al-Azzawi 2

Clemencia Siro 2

Toadoum Sari Sakayo 2

Iyanuoluwa Shode 2

Abeeb Afolabi 2

Nnaemeka Obiefuna 2

Onyekachi Ogbu 2

Chinedu Mbonu 2

Pontus Stenetorp 2

David Adelani 1

Sweta Agrawal 1

Eleftheria Briakou 1

Marine Carpuat 1

Sofia Bourhim 1

Andiswa Bukula 1

Temitayo Olatoye 1

Tosin Adewumi 1

Hamam Mokayed 1

Wangui Kimotho 1

Foutse Yuehgoh 1

Shamsuddeen Muhammad 1

Oumaima Hourrane 1

Salma El Anigri 1

Thabiso Mangwana 1

Hassan Ayinde 1

Lama Alkhaled 1

Millicent Ochieng 1

Njoroge Kiragu 1

Lyse Naomi Wamba 1

Ricky Macharm 1

Saheed Abdullahi 1

Stephen Moore 1

Bernard Opoku 1

Zainab Akinjobi 1

Sam Ochieng’ 1

Verrah Otiende 1

David Ifeoluwa Adelani 1

Israel Abebe Azime 1

Jesujoba Alabi 1

Atnafu Lambebo Tonja 1

Odunayo Ogundepo 1

Bonaventure F. P. Dossou 1

Akintunde Oladipo 1

Doreen Nixdorf 1

Chris Chinenye Emezue 1

Blessing Sibanda 1

Jonathan Mukiibi 1

Tatiana Moteu 1

Brian Odhiambo 1

Abraham Owodunni 1

Shamsuddeen Hassan Muhammad 1

Teshome Mulugeta Ababu 1

Saheed Abdullahi Salahudeen 1

Mesay Gemeda Yigezu 1

Tajuddeen Gwadabe 1

Idris Abdulmumin 1

Tolulope Adelani 1

Habiba Abdulganiyu 1

Adetola Adeeko 1

Olanrewaju Samuel 1

Samuel Fanijo 1

Oyinkansola Awosan 1

Tadesse Kebede 1

Pamela Nyatsine 1

Freedmore Sidume 1

Mardiyyah Oduwole 1

Ussen Kimanuka 1

Siyanda Nxakama 1

Sinodos Nigusse 1

Abdulmejid Johar 1

Fuad Mire Hassan 1

Moges Ahmed Mehamed 1

Evrard Ngabire 1

Ivan Ssenkungu 1

Venues