CLEVRER: CoLlision Events for Video REpresentation and Reasoning

3 October 2019

Yunzhu Li

Jiajun Wu

Papers citing "CLEVRER: CoLlision Events for Video REpresentation and Reasoning"

50 / 98 papers shown

Title
SSR: Enhancing Depth Perception in Vision-Language Models via Rationale-Guided Spatial Reasoning Yang Liu Ming Ma Xiaomin Yu Pengxiang Ding Han Zhao Mingyang Sun Siteng Huang Donglin Wang LRM 17 0 0 18 May 2025
NSFlow: An End-to-End FPGA Framework with Scalable Dataflow Architecture for Neuro-Symbolic AI Hanchen Yang Zishen Wan Ritik Raj Joongun Park Ziwei Li A. Samajdar A. Raychowdhury Tushar Krishna 26 0 0 27 Apr 2025
How Can Objects Help Video-Language Understanding? Zitian Tang Shijie Wang Junho Cho Jaewook Yoo Chen Sun 45 0 0 10 Apr 2025
When Counterfactual Reasoning Fails: Chaos and Real-World Complexity Yahya Aalaila Gerrit Großmann Sumantrak Mukherjee Jonas Wahl Sebastian Vollmer CML LRM 64 0 0 31 Mar 2025
BIMBA: Selective-Scan Compression for Long-Range Video Question Answering Md. Mohaiminul Islam Tushar Nagarajan Huiyu Wang Gedas Bertasius Lorenzo Torresani 198 0 0 12 Mar 2025
M2-omni: Advancing Omni-MLLM for Comprehensive Modality Support with Competitive Performance Qingpei Guo Kaiyou Song Zipeng Feng Ziping Ma Qinglong Zhang ... Yunxiao Sun Tai-WeiChang Jingdong Chen Ming Yang Jun Zhou MLLM VLM 90 3 0 26 Feb 2025
Can Hallucination Correction Improve Video-Language Alignment? Lingjun Zhao Mingyang Xie Paola Cascante-Bonilla Hal Daumé III Kwonjoon Lee HILM VLM 64 0 0 20 Feb 2025
When language and vision meet road safety: leveraging multimodal large language models for video-based traffic accident analysis Ruixuan Zhang Beichen Wang Juexiao Zhang Zilin Bian Chen Feng K. Ozbay 45 3 0 17 Jan 2025
TimeLogic: A Temporal Logic Benchmark for Video QA S. Swetha Hilde Kuehne Mubarak Shah 52 1 0 13 Jan 2025
HoVLE: Unleashing the Power of Monolithic Vision-Language Models with Holistic Vision-Language Embedding Chenxin Tao Shiqian Su X. Zhu Chenyu Zhang Zhe Chen ... Wenhai Wang Lewei Lu Gao Huang Yu Qiao Jifeng Dai MLLM VLM 108 2 0 20 Dec 2024
InterDyn: Controllable Interactive Dynamics with Video Diffusion Models Rick Akkerman Haiwen Feng M. Black Dimitrios Tzionas Victoria Fernandez-Abrevaya VGen AI4CE 105 3 0 16 Dec 2024
Black Swan: Abductive and Defeasible Video Reasoning in Unpredictable Events Aditya Chinchure Sahithya Ravi R. Ng Vered Shwartz Boyang Albert Li Leonid Sigal ReLM LRM VLM 77 2 0 07 Dec 2024
Learning to Reason Iteratively and Parallelly for Complex Visual Reasoning Scenarios Shantanu Jaiswal Debaditya Roy Basura Fernando Cheston Tan ReLM LRM 79 2 0 20 Nov 2024
FACTS: A Factored State-Space Framework For World Modelling Li Nanbo Firas Laakom Yucheng Xu Wenyi Wang Jürgen Schmidhuber AI4TS 190 0 0 28 Oct 2024
TRACE: Temporal Grounding Video LLM via Causal Event Modeling Yongxin Guo Jingyu Liu Mingda Li Xiaoying Tang Qingbin Liu Xiaoying Tang 42 14 0 08 Oct 2024
QTG-VQA: Question-Type-Guided Architectural for VideoQA Systems Zhixian He Pengcheng Zhao Fuwei Zhang Shujin Lin 41 0 0 14 Sep 2024
Tarsier: Recipes for Training and Evaluating Large Video Description Models Jiawei Wang Liping Yuan Yuchen Zhang 47 52 0 30 Jun 2024
Compositional 4D Dynamic Scenes Understanding with Physics Priors for Video Question Answering Xingrui Wang Wufei Ma Angtian Wang Shuo Chen Adam Kortylewski Alan Yuille 34 3 0 02 Jun 2024
SOK-Bench: A Situated Video Reasoning Benchmark with Aligned Open-World Knowledge Andong Wang Bo Wu Sunli Chen Zhenfang Chen Haotian Guan Wei-Ning Lee Li Erran Li Chuang Gan LRM RALM 37 16 0 15 May 2024
STAR: A Benchmark for Situated Reasoning in Real-World Videos Bo Wu Shoubin Yu Zhenfang Chen Joshua B Tenenbaum Chuang Gan 38 178 0 15 May 2024
Unsupervised Dynamics Prediction with Object-Centric Kinematics Yeon-Ji Song Suhyung Choi Jaein Kim Jin-Hwa Kim Byoung-Tak Zhang 43 0 0 29 Apr 2024
A Survey on the Integration of Generative AI for Critical Thinking in Mobile Networks Athanasios Karapantelakis Alexandros Nikou Ajay Kattepur Jean Martins Leonid Mokrushin S. Mohalik Marin Orlic Aneta Vulgarakis Feljan 29 1 0 10 Apr 2024
CausalChaos! Dataset for Comprehensive Causal Action Question Answering Over Longer Causal Chains Grounded in Dynamic Visual Scenes Paritosh Parmar Eric Peh Ruirui Chen Ting En Lam Yuhan Chen Elston Tan Basura Fernando CML 40 7 0 01 Apr 2024
TempCompass: Do Video LLMs Really Understand Videos? Yuanxin Liu Shicheng Li Yi Liu Yuxiang Wang Shuhuai Ren Lei Li Sishuo Chen Xu Sun Lu Hou VLM 41 101 0 01 Mar 2024
OLViT: Multi-Modal State Tracking via Attention-Based Embeddings for Video-Grounded Dialog Adnen Abdessaied Manuel von Hochmeister Andreas Bulling 40 2 0 20 Feb 2024
MVBench: A Comprehensive Multi-modal Video Understanding Benchmark Kunchang Li Yali Wang Yinan He Yizhuo Li Yi Wang ... Jilan Xu Guo Chen Ping Luo Limin Wang Yu Qiao VLM MLLM 82 410 0 28 Nov 2023
3D-Aware Visual Question Answering about Parts, Poses and Occlusions Xingrui Wang Wufei Ma Zhuowan Li Adam Kortylewski Alan Yuille CoGe 27 12 0 27 Oct 2023
CLEVRER-Humans: Describing Physical and Causal Events the Human Way Jiayuan Mao Xuelin Yang Xikun Zhang Noah D. Goodman Jiajun Wu NAI 30 22 0 05 Oct 2023
DetermiNet: A Large-Scale Diagnostic Dataset for Complex Visually-Grounded Referencing using Determiners Clarence Lee M Ganesh Kumar Cheston Tan 28 3 0 07 Sep 2023
Does Visual Pretraining Help End-to-End Reasoning? Chen Sun Calvin Luo Xingyi Zhou Anurag Arnab Cordelia Schmid OCL LRM ViT 38 3 0 17 Jul 2023
Coupling Large Language Models with Logic Programming for Robust and General Reasoning from Text Zhun Yang Adam Ishay Joohyung Lee LRM ELM 36 52 0 15 Jul 2023
Learning Differentiable Logic Programs for Abstract Visual Reasoning Hikaru Shindo Viktor Pfanschilling Devendra Singh Dhami Kristian Kersting NAI 32 6 0 03 Jul 2023
Physics-Informed Computer Vision: A Review and Perspectives C. Banerjee Kien Nguyen Clinton Fookes G. Karniadakis PINN AI4CE 34 30 0 29 May 2023
Visual Reasoning: from State to Transformation Xin Hong Yanyan Lan Liang Pang J. Guo Xueqi Cheng LRM 19 4 0 02 May 2023
Reusable Slotwise Mechanisms Trang Nguyen Amin Mansouri Kanika Madan Khuong N. Nguyen Kartik Ahuja Dianbo Liu Yoshua Bengio OCL 28 4 0 21 Feb 2023
Using Artificial Intelligence to aid Scientific Discovery of Climate Tipping Points Jennifer Sleeman David Chung C. Ashcraft Jay Brett A. Gnanadesikan ... M. Pradal R. Gelderloos Caroline Tang Anshu Saksena Larry White AI4CE 14 3 0 14 Feb 2023
A Survey of Methods, Challenges and Perspectives in Causality Gaël Gendron Michael Witbrock Gillian Dobbie OOD AI4CE CML 31 13 0 01 Feb 2023
Evaluating Temporal Observation-Based Causal Discovery Techniques Applied to Road Driver Behaviour Rhys Howard Lars Kunze CML 23 7 0 31 Jan 2023
Integrating Earth Observation Data into Causal Inference: Challenges and Opportunities Connor Jerzak Fredrik D. Johansson Adel Daoud CML 41 11 0 30 Jan 2023
See, Think, Confirm: Interactive Prompting Between Vision and Language Models for Knowledge-based Visual Reasoning Zhenfang Chen Qinhong Zhou Songlin Yang Yining Hong Hao Zhang Chuang Gan LRM VLM 35 36 0 12 Jan 2023
Multi-Task Edge Prediction in Temporally-Dynamic Video Graphs Osman Ulger Julian Wiederer Mohsen Ghafoorian Vasileios Belagiannis Pascal Mettes 43 0 0 06 Dec 2022
Visual Question Answering From Another Perspective: CLEVR Mental Rotation Tests Christopher Beckham Martin Weiss Florian Golemo S. Honari Derek Nowrouzezahrai C. Pal 28 7 0 03 Dec 2022
Super-CLEVR: A Virtual Benchmark to Diagnose Domain Robustness in Visual Reasoning Zhuowan Li Xingrui Wang Elias Stengel-Eskin Adam Kortylewski Wufei Ma Benjamin Van Durme Max Planck Institute for Informatics OOD LRM 29 58 0 01 Dec 2022
Geoclidean: Few-Shot Generalization in Euclidean Geometry Joy Hsu Jiajun Wu Noah D. Goodman 27 6 0 30 Nov 2022
Dance of SNN and ANN: Solving binding problem by combining spike timing and reconstructive attention Hao Zheng Hui Lin Rong Zhao Luping Shi 31 5 0 11 Nov 2022
Solving Reasoning Tasks with a Slot Transformer Ryan Faulkner Daniel Zoran LRM 26 1 0 20 Oct 2022
Learning Physical Dynamics with Subequivariant Graph Neural Networks Jiaqi Han Wenbing Huang Hengbo Ma Jiachen Li J. Tenenbaum Chuang Gan AI4CE PINN 40 43 0 13 Oct 2022
On the Learning Mechanisms in Physical Reasoning Shiqian Li Ke Wu Chi Zhang Yixin Zhu AI4CE 44 13 0 05 Oct 2022
Entropy-driven Unsupervised Keypoint Representation Learning in Videos A. Younes Simone Schaub-Meyer Georgia Chalvatzaki SSL 33 0 0 30 Sep 2022
Neuro-Symbolic Learning: Principles and Applications in Ophthalmology Muhammad Hassan Haifei Guan Aikaterini Melliou Yuqi Wang Qianhui Sun ... Qi Huang Jiefu Tan Qinwang Xing Peiwu Qin Dongmei Yu NAI 44 14 0 31 Jul 2022