Compositional Generalization

CoGe

More data

Study and develop models that can generalize to unseen compositions of known concepts.

Neighbor communities

51015

Featured Papers

0 / 0 papers shown

All papers

50 / 1,461 papers shown

Identifiability of Potentially Degenerate Gaussian Mixture Models With Piecewise Affine Mixing Danru Xu Sébastien Lachapelle Sara Magliacane CML CoGe 0 0 0 14 Apr 2026
A Sanity Check on Composed Image Retrieval Yikun Liu Jiangchao Yao Weidi Xie Yanfeng Wang EGVM CoGe 4 0 0 14 Apr 2026
Information-Geometric Decomposition of Generalization Error in Unsupervised Learning Gilhan Kim CoGe 5 0 0 14 Apr 2026
KL Divergence Between Gaussians: A Step-by-Step Derivation for the Variational Autoencoder Objective Andrés Muñoz Rodrigo Ramele DRL CML CoGe 13 0 0 13 Apr 2026
CArtBench: Evaluating Vision-Language Models on Chinese Art Understanding, Interpretation, and Authenticity Xuefeng Wei Zhixuan Wang Xuan Zhou Zhi Qu Hongyao Li Yusuke Sakai Hidetaka Kamigaito Taro Watanabe CoGe 8 0 0 13 Apr 2026
Revisiting Compositionality in Dual-Encoder Vision-Language Models: The Role of Inference Imanol Miranda Ander Salaberria Eneko Agirre Gorka Azkune CoGe VLM 6 0 0 13 Apr 2026
Variational Latent Entropy Estimation Disentanglement: Controlled Attribute Leakage for Face Recognition Ünsal Öztürk Vedrana Krivokuća Hahn Sushil Bhattacharjee Sébastien Marcel DRL FedML CML CoGe 10 0 0 13 Apr 2026
Panoptic Pairwise Distortion Graph Muhammad Kamran Janjua Abdul Wahab Bahador Rashidi CoGe 7 0 0 13 Apr 2026
When Verification Fails: How Compositionally Infeasible Claims Escape Rejection Muxin Liu Delip Rao Grace Kim Chris Callison-Burch CoGe 8 0 0 13 Apr 2026
ReplicateAnyScene: Zero-Shot Video-to-3D Composition via Textual-Visual-Spatial Alignment Mingyu Dong Chong Xia Mingyuan Jia Weichen Lyu Long Xu Zheng Zhu Yueqi Duan VGen CoGe 9 0 0 12 Apr 2026
BareBones: Benchmarking Zero-Shot Geometric Comprehension in VLMs Aaditya Baranwal Vishal Yadav Abhishek Rajora CoGe VLM 6 0 0 12 Apr 2026
DiningBench: A Hierarchical Multi-view Benchmark for Perception and Reasoning in the Dietary Domain Song Jin Juntian Zhang Xun Zhang Zeying Tian Fei Jiang Guojun Yin Wei Lin Yong Liu Rui Yan CoGe 7 0 0 12 Apr 2026
Replicable Composition Kiarash Banihashem MohammadHossein Bateni Hossein Esfandiari Samira Goudarzi MohammadTaghi Hajiaghayi CoGe 8 0 0 12 Apr 2026
LASQ: A Low-resource Aspect-based Sentiment Quadruple Extraction Dataset Aizihaierjiang Yusufu Jiang Liu Kamran Aziz Abidan Ainiwaer Bobo Li Fei Li Donghong Ji Aizierguli Yusufu CoGe 8 0 0 12 Apr 2026
VGA-Bench: A Unified Benchmark and Multi-Model Framework for Video Aesthetics and Generation Quality Evaluation Longteng Jiang DanDan Zheng Qianqian Qiao Heng Huang Huaye Wang Yihang Bo Bao Peng Jingdong Chen Jun Zhou Xin Jin EGVM VGen CoGe 11 0 0 11 Apr 2026
I Walk the Line: Examining the Role of Gestalt Continuity in Object Binding for Vision Transformers Alexa R. Tartaglini Michael A. Lepori OCL CoGe 7 0 0 10 Apr 2026
VisionFoundry: Teaching VLMs Visual Perception with Synthetic Images Guanyu Zhou Yida Yin Wenhao Chai Shengbang Tong Xingyu Fu Zhuang Liu CoGe VLM LRM 16 0 0 10 Apr 2026
Decompose, Look, and Reason: Reinforced Latent Reasoning for VLMs Mengdan Zhu Senhao Cheng Liang Zhao ObjD ReLM LRM CoGe 22 0 0 10 Apr 2026
CompoDistill: Attention Distillation for Compositional Reasoning in Multimodal LLMs Jiwan Kim Kibum Kim Sangwoo Seo Chanyoung Park VLM CoGe LRM 193 5 0 10 Apr 2026
PokeGym: A Visually-Driven Long-Horizon Benchmark for Vision-Language Models Ruizhi Zhang Ye Huang Yuangang Pan Chuanfu Shen Zhilin Liu Ting Xie Wen Li Lixin Duan VLM CoGe LRM 35 0 0 10 Apr 2026
Can Vision Language Models Judge Action Quality? An Empirical Evaluation Miguel Monte e Freitas Rui Henriques Ricardo Rei Pedro Henrique Martins CoGe 34 0 0 10 Apr 2026
Capture-Quiet Decomposition: A Verification Theorem for Chess Endgame Tablebases Alexander Pavlov LMTD CoGe 19 0 0 10 Apr 2026
SemEval-2026 Task 3: Dimensional Aspect-Based Sentiment Analysis (DimABSA) Liang-Chih Yu Jonas Becker Shamsuddeen Hassan Muhammad Idris Abdulmumin Lung-Hao Lee ... Lilian Wanzare Nelson Odhiambo Bela Gipp Kai-Wei Chang Saif M. Mohammad CoGe 37 0 0 08 Apr 2026
How Well Do Vision-Language Models Understand Sequential Driving Scenes? A Sensitivity Study Roberto Brusnicki Mattia Piccinini Johannes Betz CoGe 33 0 0 08 Apr 2026
AICA-Bench: Holistically Examining the Capabilities of VLMs in Affective Image Content Analysis Dong She Xianrong Yao Liqun Chen Jinghe Yu Yang Gao Zhanpeng Jin CoGe 24 0 0 07 Apr 2026
VLA-InfoEntropy: A Training-Free Vision-Attention Information Entropy Approach for Vision-Language-Action Models Inference Acceleration and Success Chuhang Liu Yayun He Zuheng Kang Xiaoyang Qu Jianzong Wang FAtt VLM CoGe 23 0 0 07 Apr 2026
DISSECT: Diagnosing Where Vision Ends and Language Priors Begin in Scientific VLMs Dikshant Kukreja Kshitij Sah Karan Goyal Mukesh Mohania Vikram Goyal CoGe 33 0 0 06 Apr 2026
Erasure or Erosion? Evaluating Compositional Degradation in Unlearned Text-To-Image Diffusion Models Arian Komaei Koma Seyed Amir Kasaei Ali Aghayari AmirMahdi Sadeghzadeh Mohammad Hossein Rohban CoGe 40 0 0 06 Apr 2026
PortraitCraft: A Benchmark for Portrait Composition Understanding and Generation Yuyang Sha Zijie Lou Youyun Tang Xiaochao Qu Haoxiang Li Ting Liu Luoqi Liu EGVM CoGe 34 0 0 04 Apr 2026
SpectralSplat: Appearance-Disentangled Feed-Forward Gaussian Splatting for Driving Scenes Quentin Herau Tianshuo Xu Depu Meng Jiezhi Yang Chensheng Peng Spencer Sherk Yihan Hu Wei Zhan 3DGS CoGe 51 0 0 03 Apr 2026
$Power one sequential tests exist for weakly compact $\mathscr P$ against $\mathscr P^c$$ Power one sequential tests exist for weakly compact $\mathscr P$ against $\mathscr P^c$ Ashwin Ram Aaditya Ramdas CoGe ELM 32 0 0 03 Apr 2026
Can VLMs Truly Forget? Benchmarking Training-Free Visual Concept Unlearning Zhangyun Tan Zeliang Zhang Susan Liang Yolo Yunlong Tang Lisha Chen Chenliang Xu MU CoGe VLM 48 0 0 03 Apr 2026
Learning Additively Compositional Latent Actions for Embodied AI Hangxing Wei Xiaoyu Chen Chuheng Zhang Tim Pearce Jianyu Chen Alex Lamb Li Zhao Jiang Bian PINN CLL CoGe 34 0 0 03 Apr 2026
Semantic Richness or Geometric Reasoning? The Fragility of VLM's Visual Invariance Jason Qiu Zachary Meurer Xavier Thomas Deepti Ghadiyaram CoGe LRM 35 0 0 02 Apr 2026
Benchmarking and Mechanistic Analysis of Vision-Language Models for Cross-Depiction Assembly Instruction Alignment Zhuchenyang Liu Yao Zhang Yu Xiao CoGe 38 0 0 01 Apr 2026
Event Embedding of Protein Networks : Compositional Learning of Biological Function Antonin Sulc CoGe 29 0 0 01 Apr 2026
FED-Bench: A Cross-Granular Benchmark for Disentangled Evaluation of Facial Expression Editing Fengjian Xue Xuecheng Wu Heli Sun Yunyun Shi Shi Chen ... Jinheng Xie Dingkang Yang Hao Wang Junxiao Xue Liang He EGVM CoGe 42 0 0 31 Mar 2026
Known Intents, New Combinations: Clause-Factorized Decoding for Compositional Multi-Intent Detection Abhilash Nandy CoGe 23 0 0 30 Mar 2026
GEditBench v2: A Human-Aligned Benchmark for General Image Editing Zhangqi Jiang Zheng Sun Xianfang Zeng Yufeng Yang Xuanyang Zhang Yongliang Wu Wei Cheng Gang Yu Xu Yang Bihan Wen CoGe 33 0 0 30 Mar 2026
AIBench: Evaluating Visual-Logical Consistency in Academic Illustration Generation Zhaohe Liao Kaixun Jiang Zhihang Liu Yujie Wei Junqiu Yu ... Zhen Xing Shiwei Zhang Chen-Wei Xie Yun Zheng Xihui Liu CoGe 37 0 0 30 Mar 2026
CARV: A Diagnostic Benchmark for Compositional Analogical Reasoning in Multimodal LLMs Yongkang Du Xiaohan Zou Minhao Cheng Lu Lin ReLM CoGe ELM LRM 40 0 0 30 Mar 2026
A Power-Weighted Noncentral Complex Gaussian Distribution Toru Nakashika CoGe 23 0 0 30 Mar 2026
ExtrinSplat: Decoupling Geometry and Semantics for Open-Vocabulary Understanding in 3D Gaussian Splatting Jiayu Ding Xinpeng Liu Zhiyi Pan Shiqiang Long Ge Li 3DGS CoGe VLM 142 1 0 30 Mar 2026
CREval: An Automated Interpretable Evaluation for Creative Image Manipulation under Complex Instructions Chonghuinan Wang Zihan Chen Yuxiang Wei Tianyi Jiang Xiaohe Wu Fan Li Wangmeng Zuo Hongxun Yao CoGe ELM 31 0 0 30 Mar 2026
HandVQA: Diagnosing and Improving Fine-Grained Spatial Reasoning about Hands in Vision-Language Models MD Khalequzzaman Chowdhury Sayem Mubarrat Tajoar Chowdhury Yihalem Yimolal Tiruneh Muneeb A. Khan Muhammad Salman Ali Binod Bhattarai Seungryul Baek CoGe 23 0 0 30 Mar 2026
The Limits of Learning from Pictures and Text: Vision-Language Models and Embodied Scene Understanding Gillian Rosenberg Skylar Stadhard Bruce C. Hansen Michelle R. Greene CoGe 33 0 0 30 Mar 2026
PerceptionComp: A Video Benchmark for Complex Perception-Centric Reasoning Shaoxuan Li Zhixuan Zhao Hanze Deng Zirun Ma Shulin Tian ... Haoning Wu Yuhao Dong Benlin Liu Ziwei Liu Ranjay Krishna VOS VLM CoGe LRM 60 0 0 30 Mar 2026
ImagenWorld: Stress-Testing Image Generation Models with Explainable Human Evaluation on Open-ended Real-World Tasks Samin Mahdizadeh Sani Max Ku Nima Jamali Matina Mahdizadeh Sani Paria Khoshtab ... I-Sheng Fang Shih-Ying Yeh Ho Kei Cheng Ping Nie Wenhu Chen VGen VLM CoGe 33 0 0 29 Mar 2026
When Surfaces Lie: Exploiting Wrinkle-Induced Attention Shift to Attack Vision-Language Models Chengyin Hu Xuemeng Sun Jiajun Han Qike Zhang Xiang Chen Xin Wang Yiwei Wei Jiahua Long CoGe 43 0 0 29 Mar 2026
Inference-Time Structural Reasoning for Compositional Vision-Language Understanding Amartya Bhattacharya ReLM CoGe LRM 39 0 0 28 Mar 2026

Loading #Papers per Month with "CoGe"

Past speakers

Name (-)

Top Contributors

Name (-)

Top Organizations at ResearchTrend.AI

Name (-)

Social Events

Date	Location	Event
No social events available