Publications – RiTUAL Group at MBZUAI

2026

ACL

Afri-MCQA: Multimodal Cultural Question Answering for African Languages

Atnafu Lambebo Tonja , Srija Anand , Emilio Villa-Cueva , Israel Abebe Azime , Jesujoba Oluwadara Alabi , Muhidin A Mohamed, et al. Show all authors

Paper Dataset

ACL

Towards Fast and Accurate Modeling for Cross-Lingual Label Projection

Thang Le, Huy Huu Nguyen, Anh Tuan Luu, Thamar Solorio, Thien Huu Nguyen

Paper

EACL

Beyond Understanding: Evaluating the Pragmatic Gap in LLMs' Cultural Processing of Figurative Language

Mena Attia, Aashiq Muhamed, Mai Alkhamissi, Thamar Solorio, Mona Diab

Paper Code Dataset

ICLR

Tell me Habibi, is it Real or Fake?

Kartik Kuckreja, Parul Gupta, Injy Hamed, Thamar Solorio, Muhammad Haris Khan, Abhinav Dhall

Paper Dataset

2025

COLING

A Survey of Code-switched Arabic NLP: Progress, Challenges, and Future Directions

Injy Hamed, Caroline Sabty, Slim Abdennadher, Ngoc Thang Vu, Thamar Solorio, Nizar Habash

Paper

CVPR

All languages matter: Evaluating lmms on culturally diverse 100 languages

Ashmal Vayani , Dinura Dissanayake , Hasindri Watawana , Noor Ahsan , Nevasini Sasikumar , Omkar Thawakar, et al. Show all authors

Paper Code Dataset

INTERSPEECH

CS-FLEURS: A Massively Multilingual and Code-Switched Speech Dataset

Brian Yan , Injy Hamed , Shuichiro Shimizu , Vasista Lodagala , William Chen , Olga Iakovenko, et al. Show all authors

Paper Dataset

EMNLP Findings

CaMMT: Benchmarking Culturally Aware Multimodal Machine Translation

Emilio Villa-Cueva , Sholpan Bolatzhanova , Diana Turmakhan , Kareem Elzeky , Henok Biadglign Ademtew , Alham Fikri Aji, et al. Show all authors

Paper Dataset

EMNLP Findings

MoMentS: A Comprehensive Multimodal Benchmark for Theory of Mind

Emilio Villa-Cueva , S M Masrur Ahmed , Rendi Chevi , Jan Christian Blaise Cruz , Kareem Elzeky , Fermin Cristobal, et al. Show all authors

Paper Dataset

SemEval

Emotion Train at SemEval-2025 Task 11: Comparing Generative and Discriminative Models in Emotion Recognition

Anastasiia Demidova, Injy Hamed, Teresa Lynn, Thamar Solorio

Paper Code

2024

NeurIPS

Cvqa: Culturally-diverse multilingual visual question answering benchmark

David Orlando Romero Mogrovejo , Chenyang Lyu , Haryo Akbarianto Wibowo , Santiago Góngora , Aishik Mandal , Sukannya Purkayastha, et al. Show all authors

Paper Dataset

ACL Findings

Question-Instructed Visual Descriptions for Zero-Shot Video Answering

David Mogrovejo, Thamar Solorio

Paper Code

NAACL

Adaptive Cross-lingual Text Classification through In-Context One-Shot Demonstrations

Emilio Cueva, Adrian Lopez Monroy, Fernando Sánchez-Vega, Thamar Solorio

Paper Code

ACL Findings

SemRel2024: A Collection of Semantic Textual Relatedness Datasets for 13 Languages

Nedjma Ousidhoum , Shamsuddeen Muhammad , Mohamed Abdalla , Idris Abdulmumin , Ibrahim Ahmad , Sanchit Ahuja, et al. Show all authors

Paper Code Dataset

LREC-COLING

Labeling Comic Mischief Content in Online Videos with a Multimodal Hierarchical-Cross-Attention Model

Elaheh Baharlouei, Mahsa Shafaei, Yigeng Zhang, Hugo Jair Escalante, Thamar Solorio

Paper Code

LREC-COLING

OATS: A Challenge Dataset for Opinion Aspect Target Sentiment Joint Detection

Siva Uday Sampreeth Chebolu, Franck Dernoncourt, Nedim Lipka, Thamar Solorio

Paper Code

LREC-COLING

Positive and Risky Message Assessment for Music Products

Yigeng Zhang, Mahsa Shafaei, Fabio Gonzalez, Thamar Solorio

Paper Code

LREC-COLING

Interpreting Themes from Educational Stories

Yigeng Zhang, Fabio Gonzalez, Thamar Solorio

Paper Code

W-NUT

Enhancing NER Performance in Low-Resource Pakistani Languages using Cross-Lingual Data Augmentation

Toqeer Ehsan, Thamar Solorio

Paper

2023

ACL Findings

The Decades Progress on Code-Switching Research in NLP: A Systematic Survey on Trends and Challenges

Genta Winata, Alham Fikri Aji, Zheng Xin Yong, Thamar Solorio

Paper Code

CALCS

Prompting multilingual large language models to generate code-mixed texts: The case of south East Asian languages

Zheng-Xin Yong , Ruochen Zhang , Jessica Forde , Skyler Wang , Arjun Subramonian , Holy Lovenia, et al. Show all authors

Paper

EACL Findings

Distillation of Encoder-Decoder Transformers for Sequence Labelling

Marco Farina, Duccio Pappadopulo, Anant Gupta, Leslie Huang, Ozan Irsoy, Thamar Solorio

Paper