Compositional Generalization

CoGe

More data

Study and develop models that can generalize to unseen compositions of known concepts.

Neighbor communities

51015

Featured Papers

0 / 0 papers shown

All papers

50 / 1,113 papers shown

Can Vision Language Models Assess Graphic Design Aesthetics? A Benchmark, Evaluation, and Dataset Perspective Arctanx An Shizhao Sun Danqing Huang Mingxi Cheng Yan Gao Ji Li Yu Qiao Jiang Bian CoGe VLM 12 0 0 01 Mar 2026
Compositional Generalization Requires Linear, Orthogonal Representations in Vision Embedding Models Arnas Uselis Andrea Dittadi Seong Joon Oh OCL CoGe 18 0 0 27 Feb 2026
WARM-CAT: Warm-Started Test-Time Comprehensive Knowledge Accumulation for Compositional Zero-Shot Learning Xudong Yan Songhe Feng Jiaxin Wang Xin Su Yi Jin CoGe VLM 35 0 0 26 Feb 2026
CxMP: A Linguistic Minimal-Pair Benchmark for Evaluating Constructional Understanding in Language Models Miyu Oba Saku Sugawara ALM ELM CoGe LRM 49 0 0 25 Feb 2026
SpatiaLQA: A Benchmark for Evaluating Spatial Logical Reasoning in Vision-Language Models Yuechen Xie Xiaoyan Zhang Yicheng Shan Hao Zhu Rui Tang Rong Wei Mingli Song Yuanyu Wan Jie Song ReLM CoGe LRM 36 0 0 24 Feb 2026
VLANeXt: Recipes for Building Strong VLA Models Xiao-Ming Wu Bin Fan Kang Liao Jian-Jian Jiang Runze Yang Yihang Luo Zhonghua Wu Wei-Shi Zheng Chen Change Loy CoGe VLM 34 0 0 20 Feb 2026
Understanding the Fine-Grained Knowledge Capabilities of Vision-Language Models Dhruba Ghosh Yuhui Zhang Ludwig Schmidt VLM CoGe 36 0 0 19 Feb 2026
Evaluating Disentangled Representations for Controllable Music Generation Laura Ibáñez-Martínez Chukwuemeka Nkama Andrea Poltronieri Xavier Serra Martín Rocamora CoGe 32 0 0 10 Feb 2026
Mutual Information Collapse Explains Disentanglement Failure in $β$ -VAEs Minh Vu Xiaoliang Wan Shuangqing Wei DRL AAML CoGe 40 0 0 09 Feb 2026
VLM-UQBench: A Benchmark for Modality-Specific and Cross-Modality Uncertainties in Vision Language Models Chenyu Wang Tianle Chen H. M. Sabbir Ahmad Kayhan Batmanghelich Wenchao Li CoGe 24 0 0 09 Feb 2026
When Is Compositional Reasoning Learnable from Verifiable Rewards? Daniel Barzilai Yotam Wolf Ronen Basri OffRL CoGe LRM 52 0 0 08 Feb 2026
Disentanglement by means of action-induced representations Gorka Muñoz-Gil Hendrik Poulsen Nautrup Arunava Majumder Paulin de Schoulepnikoff Florian Fürrutter Marius Krumm Hans J. Briegel DRL CoGe OCL CML 78 0 0 06 Feb 2026
Disentangled Representation Learning via Flow Matching Jinjin Chi Taoping Liu Mengtao Yin Ximing Li Yongcheng Jing Dacheng Tao DRL DiffM OOD CoGe 75 0 0 05 Feb 2026
VRIQ: Benchmarking and Analyzing Visual-Reasoning IQ of VLMs Tina Khezresmaeilzadeh Jike Zhong Konstantinos Psounis ReLM CoGe LRM 97 0 0 05 Feb 2026
VISTA-Bench: Do Vision-Language Models Really Understand Visualized Text as Well as Pure Text? Qingán Liu Juntong Feng Yuhao Wang Xinzhe Han Yujie Cheng Yue Zhu Haiwen Diao Yunzhi Zhuge Huchuan Lu CoGe VLM 68 0 0 04 Feb 2026
Sequential Group Composition: A Window into the Mechanics of Deep Learning Giovanni Luca Marchetti Daniel Kunin Adele Myers Francisco Acosta Nina Miolane CoGe 46 0 0 03 Feb 2026
The Geometry of Representational Failures in Vision Language Models Daniele Savietto Declan Campbell André Panisson Marco Nurisso Giovanni Petri Jonathan D. Cohen Alan Perotti CoGe 19 0 0 02 Feb 2026
Auto-Comp: An Automated Pipeline for Scalable Compositional Probing of Contrastive Vision-Language Models Cristian Sbrolli Matteo Matteucci Toshihiko Yamasaki CoGe 43 0 0 02 Feb 2026
SANEval: Open-Vocabulary Compositional Benchmarks with Failure-mode Diagnosis Rishav Pramanik Ian E. Nielsen Jeff Smith Saurav Pandit Ravi P. Ramachandran Zhaozheng Yin CoGe 32 0 0 30 Jan 2026
XFACTORS: Disentangled Information Bottleneck via Contrastive Supervision Alexandre Myara Nicolas Bourriez Thomas Boyer Thomas Lemercier Ihab Bendidi Auguste Genovesio CML CoGe 85 0 0 29 Jan 2026
FlexCausal: Flexible Causal Disentanglement via Structural Flow Priors and Manifold-Aware Interventions Yutao Jin Yuang Tao Junyong Zhai CML CoGe 101 0 0 29 Jan 2026
Do Images Speak Louder than Words? Investigating the Effect of Textual Misinformation in VLMs Chi Zhang Wenxuan Ding Jiale Liu Mingrui Wu Qingyun Wu Ray Mooney CoGe 94 0 0 27 Jan 2026
Structural Compositional Function Networks: Interpretable Functional Compositions for Tabular Discovery Fang Li CoGe 50 0 0 27 Jan 2026
LOGICAL-COMMONSENSEQA: A Benchmark for Logical Commonsense Reasoning Obed Junias Maria Leonor Pacheco ReLM LRM CoGe 144 0 0 23 Jan 2026
Rethinking Composed Image Retrieval Evaluation: A Fine-Grained Benchmark from Image Editing Tingyu Song Yanzhao Zhang Mingxin Li Zhuoning Guo Dingkun Long Pengjun Xie Siyue Zhang Yilun Zhao Shu Wu CoGe 35 0 0 22 Jan 2026
ConceptCaps: a Distilled Concept Dataset for Interpretability in Music Models Bruno Sienkiewicz Łukasz Neumann Mateusz Modrzejewski CoGe 33 0 0 20 Jan 2026
CtD: Composition through Decomposition in Emergent CommunicationInternational Conference on Learning Representations (ICLR), 2026 Boaz Carmeli Ron Meir Yonatan Belinkov CoGe 67 0 0 15 Jan 2026
The Spatial Blindspot of Vision-Language Models Nahid Alam Leema Krishna Murali Siddhant Bharadwaj Patrick Liu Timothy Chung Drishti Sharma Akshata A Kranthi Kiran Wesley Tam Bala Krishna S Vegesna VLM CoGe 82 0 0 15 Jan 2026
Beyond Accuracy: Evaluating Grounded Visual Evidence in Thinking with Images Xuchen Li Xuzhao Li Renjie Pi Shiyu Hu Jian Zhao Jiahui Gao CoGe 54 0 0 14 Jan 2026
VULCA-Bench: A Multicultural Vision-Language Benchmark for Evaluating Cultural Understanding Haorui Yu Diji Yang Hang He Fengrui Zhang Qiufeng Yi CoGe VLM 166 0 0 12 Jan 2026
Evaluating the encoding competence of visual language models using uncommon actions Chen Ling Nai Ding CoGe 39 0 0 12 Jan 2026
LitVISTA: A Benchmark for Narrative Orchestration in Literary Text Mingzhe Lu Yiwen Wang Yanbing Liu Qi You Chong Liu ... Haoyu Dong Wenyu Zhang Jiarui Zhang Yue Hu Yunpeng Li CoGe 135 0 0 10 Jan 2026
Boosting Latent Diffusion Models via Disentangled Representation Alignment John Page Xuesong Niu Kai Wu Kun Gai DiffM CoGe 197 0 0 09 Jan 2026
V-FAT: Benchmarking Visual Fidelity Against Text-bias Ziteng Wang Yujie He Guanliang Li Siqi Yang Jiaqi Xiong Songxiang Liu CoGe 120 0 0 08 Jan 2026
Eye-Q: A Multilingual Benchmark for Visual Word Puzzle Solving and Image-to-Phrase Reasoning Ali Najar Alireza Mirrokni Arshia Izadyari Sadegh Mohammadian Amir Homayoon Sharifizade Asal Meskin Mobin Bagherian Ehsaneddin Asgari CoGe LRM 147 0 0 06 Jan 2026
SPoRC-VIST: A Benchmark for Evaluating Generative Natural Narrative in Vision-Language Models Yunlin Zeng CoGe 157 0 0 03 Jan 2026
When Does Quantum Differential Privacy Compose? Daniel Alabi Theshani Nuradha CoGe 155 0 0 01 Jan 2026
Exploring Compositionality in Vision Transformers using Wavelet Representations Akshad Shyam Purushottamdas Pranav K Nayak Divya Mehul Rajparia Deekshith Patel Yashmitha Gogineni Konda Reddy Mopuri Sumohana S. Channappayya ViT CoGe 222 0 0 30 Dec 2025
Same or Not? Enhancing Visual Perception in Vision-Language Models Damiano Marsili Aditya Mehta Ryan Y. Lin Georgia Gkioxari MLLM ObjD VLM CoGe 257 0 0 29 Dec 2025
COMPACT: COMPositional Atomic-to-Complex Visual Capability Tuning Xindi Wu Hee Seung Hwang Polina Kirichenko Olga Russakovsky Olga Russakovsky VLM CoGe 451 4 0 24 Dec 2025
VisRes Bench: On Evaluating the Visual Reasoning Capabilities of VLMs Brigitta Malagurski Törtei Yasser Dahou Ngoc Dung Huynh Wamiq Reyaz Para Phúc H. Lê Khac Ankit Singh Sofian Chaybouti Sanath Narayan CoGe LRM 170 0 0 24 Dec 2025
VL4Gaze: Unleashing Vision-Language Models for Gaze Following Shijing Wang Chaoqun Cui Yaping Huang Hyung Jin Chang Yihua Cheng VLM CoGe 260 0 0 23 Dec 2025
Self-Attention with State-Object Weighted Combination for Compositional Zero Shot Learning Cheng-Hong Chang Pei-Hsuan Tsai CoGe 397 0 0 22 Dec 2025
TextEditBench: Evaluating Reasoning-aware Text Editing Beyond Rendering Rui Gui Yang Wan Haochen Han Dongxing Mao Fangming Liu Min Li Alex Jinpeng Wang CoGe 160 0 0 18 Dec 2025
From Isolation to Entanglement: When Do Interpretability Methods Identify and Disentangle Known Concepts? Aaron Mueller Andrew Lee Shruti Joshi Ekdeep Singh Lubana Dhanya Sridhar Patrik Reizinger CoGe 347 0 0 17 Dec 2025
DeX-Portrait: Disentangled and Expressive Portrait Animation via Explicit and Latent Motion Representations Yuxiang Shi Zhe Li Yanwen Wang Hao Zhu Xun Cao Ligang Liu DiffM VGen CoGe 188 0 0 17 Dec 2025
Infinity and Beyond: Compositional Alignment in VAR and Diffusion T2I Models Hossein Shahabadi Niki Sepasian Arash Marioriyad Ali Sharifi-Zarchi Mahdieh Soleymani Baghshah CoGe 204 0 0 12 Dec 2025
FactorPortrait: Controllable Portrait Animation via Disentangled Expression, Pose, and Viewpoint Jiapeng Tang Kai Li Chengxiang Yin Liuhao Ge Fei Jiang ... Matthias Nießner Christian Häne Timur Bagautdinov Egor Zakharov Peihong Guo DiffM VGen CoGe 60 0 0 12 Dec 2025
Learning by Analogy: A Causal Framework for Composition Generalization Lingjing Kong Shaoan Xie Yang Jiao Yetian Chen Yanhui Guo Simone Shao Yan Gao Guangyi Chen Kun Zhang CoGe 253 0 0 11 Dec 2025
Disentangled and Distilled Encoder for Out-of-Distribution Reasoning with Rademacher Guarantees Zahra Rahiminasab Michael Yuhas Arvind Easwaran DRL OODD CoGe 362 0 0 11 Dec 2025

Loading #Papers per Month with "CoGe"

Past speakers

Name (-)

Top Contributors

Name (-)

Top Organizations at ResearchTrend.AI

Name (-)

Social Events

Date	Location	Event
No social events available