v1v2 (latest)

FiLM: Visual Reasoning with a General Conditioning Layer

22 September 2017

Aaron Courville

Papers citing "FiLM: Visual Reasoning with a General Conditioning Layer"

50 / 1,349 papers shown

Title
aMUSEd: An Open MUSE Reproduction Suraj Patil William Berman Robin Rombach Patrick von Platen VLM 72 20 0 03 Jan 2024
Balanced Multi-modal Federated Learning via Cross-Modal Infiltration Yunfeng Fan Wenchao Xu Yining Qi Jiaqi Zhu Song Guo 67 0 0 31 Dec 2023
Classifier-free graph diffusion for molecular property targeting Matteo Ninniri Marco Podda Davide Bacciu 105 9 0 28 Dec 2023
Efficient Deweather Mixture-of-Experts with Uncertainty-aware Feature-wise Linear Modulation Rongyu Zhang Yulin Luo Jiaming Liu Huanrui Yang Zhen Dong ... Tomoyuki Okuno Yohei Nakata Kurt Keutzer Yuan Du Shanghang Zhang MoMe MoE 74 3 0 27 Dec 2023
Active Third-Person Imitation Learning Timo Klein Susanna Weinberger Adish Singla Sebastian Tschiatschek 66 1 0 27 Dec 2023
Personalized Federated Learning with Contextual Modulation and Meta-Learning Anna Vettoruzzo Mohamed-Rafik Bouguelia Thorsteinn Rögnvaldsson FedML 78 2 0 23 Dec 2023
$Towards End-to-End Structure Solutions from Information-Compromised Diffraction Data via Generative Deep Learning$ Towards End-to-End Structure Solutions from Information-Compromised Diffraction Data via Generative Deep Learning Gabriel Guo Judah Goldfeder Ling Lan Aniv Ray Albert Hanming Yang Boyuan Chen S. Billinge Hod Lipson 51 4 0 23 Dec 2023
QUAR-VLA: Vision-Language-Action Model for Quadruped Robots Pengxiang Ding Han Zhao Wenxuan Song Zhitao Wang Zhenyu Wei Shangke Lyu Ningxi Yang Donglin Wang 131 26 0 22 Dec 2023
Zero-Shot Metric Depth with a Field-of-View Conditioned Diffusion Model Saurabh Saxena Junhwa Hur Charles Herrmann Deqing Sun David J. Fleet DiffM 99 29 0 20 Dec 2023
Diffusion Models With Learned Adaptive Noise Subham Sekhar Sahoo Aaron Gokaslan Christopher De Sa Volodymyr Kuleshov DiffM 120 16 0 20 Dec 2023
Splatter Image: Ultra-Fast Single-View 3D Reconstruction Stanislaw Szymanowicz Christian Rupprecht Andrea Vedaldi 3DGS 134 194 0 20 Dec 2023
Leveraging Normalization Layer in Adapters With Progressive Learning and Adaptive Distillation for Cross-Domain Few-Shot Learning Yongjin Yang Taehyeon Kim SeYoung Yun 71 5 0 18 Dec 2023
GraspLDM: Generative 6-DoF Grasp Synthesis using Latent Diffusion Models K. R. Barad Andrej Orsula Antoine Richard Jan Dentler Miguel Olivares-Mendez Carol Martinez 83 16 0 18 Dec 2023
How to Train Neural Field Representations: A Comprehensive Study and Benchmark Samuele Papa Riccardo Valperga David M. Knigge Miltiadis Kofinas Phillip Lippe Jan-Jakob Sonke E. Gavves 110 7 0 16 Dec 2023
FaceTalk: Audio-Driven Motion Diffusion for Neural Parametric Head Models Shivangi Aneja Justus Thies Angela Dai Matthias Nießner DiffM VGen 123 33 0 13 Dec 2023
Modality Plug-and-Play: Elastic Modality Adaptation in Multimodal LLMs for Embodied AI Kai Huang Boyuan Yang Wei Gao 68 1 0 13 Dec 2023
More than Vanilla Fusion: a Simple, Decoupling-free, Attention Module for Multimodal Fusion Based on Signal Theory Peiwen Sun Yifan Zhang Zishan Liu Donghao Chen Honggang Zhang 79 0 0 12 Dec 2023
One-Step Diffusion Distillation via Deep Equilibrium Models Zhengyang Geng Ashwini Pokle Trevor Killeen 75 33 0 12 Dec 2023
Photorealistic Video Generation with Diffusion Models Agrim Gupta Lijun Yu Kihyuk Sohn Xiuye Gu Meera Hahn Fei-Fei Li Irfan Essa Lu Jiang José Lezama VGen 145 201 0 11 Dec 2023
Spatial and Temporal Hierarchy for Autonomous Navigation using Active Inference in Minigrid Environment Daria de Tinguy Toon Van de Maele Tim Verbelen Bart Dhoedt 122 6 0 08 Dec 2023
Neural Concatenative Singing Voice Conversion: Rethinking Concatenation-Based Approach for One-Shot Singing Voice Conversion Binzhu Sha Xu Li Zhiyong Wu Yin Shan Helen M. Meng 56 7 0 08 Dec 2023
GenTron: Diffusion Transformers for Image and Video Generation Shoufa Chen Mengmeng Xu Jiawei Ren Yuren Cong Sen He Yanping Xie Animesh Sinha Ping Luo Tao Xiang Juan-Manuel Perez-Rua VGen 101 41 0 07 Dec 2023
Guided Reconstruction with Conditioned Diffusion Models for Unsupervised Anomaly Detection in Brain MRIs F. Behrendt Debayan Bhattacharya R. Mieling Lennart Maack Julia Kruger R. Opfer Alexander Schlaefer DiffM MedIm 87 10 0 07 Dec 2023
Scaling transformer neural networks for skillful and reliable medium-range weather forecasting Tung Nguyen Rohan Shah Hritik Bansal T. Arcomano Sandeep Madireddy R. Maulik V. Kotamarthi Ian Foster Aditya Grover AI4TS 68 68 0 06 Dec 2023
C3: High-performance and low-complexity neural compression from a single image or video Hyunjik Kim Matthias Bauer Lucas Theis Jonathan Richard Schwarz Emilien Dupont VGen 94 31 0 05 Dec 2023
DiffiT: Diffusion Vision Transformers for Image Generation Ali Hatamizadeh Jiaming Song Guilin Liu Jan Kautz Arash Vahdat 103 75 0 04 Dec 2023
Diffusion Models Without Attention Jing Nathan Yan Jiatao Gu Alexander M. Rush 111 69 0 30 Nov 2023
Transfer Learning in Robotics: An Upcoming Breakthrough? A Review of Promises and Challenges Noémie Jaquier Michael C. Welle A. Gams Kunpeng Yao Bernardo Fichera A. Billard Aleš Ude Tamim Asfour Danica Kragic 100 14 0 29 Nov 2023
SODA: Bottleneck Diffusion Models for Representation Learning Drew A. Hudson Daniel Zoran Mateusz Malinowski Andrew Kyle Lampinen Andrew Jaegle James L. McClelland Loic Matthey Felix Hill Alexander Lerchner DiffM 106 56 0 29 Nov 2023
Task adaption by biologically inspired stochastic comodulation Gauthier Boeshertz Caroline Haimerl Cristina Savin 59 0 0 25 Nov 2023
Coordinate-Aware Modulation for Neural Fields J. Lee Daniel Rho Seungtae Nam Jong Hwan Ko Eunbyung Park 53 5 0 25 Nov 2023
GAN-Avatar: Controllable Personalized GAN-based Human Head Avatar Berna Kabadayi Wojciech Zielonka Bharat Lal Bhatnagar Gerard Pons-Moll Justus Thies 3DH 100 7 0 22 Nov 2023
Self-Supervised Music Source Separation Using Vector-Quantized Source Category Estimates Marco Pasini Stefan Lattner George Fazekas 67 1 0 21 Nov 2023
Multi-Task Reinforcement Learning with Mixture of Orthogonal Experts Ahmed Hendawy Jan Peters Carlo DÉramo MoE 82 19 0 19 Nov 2023
Multimodal Representation Learning by Alternating Unimodal Adaptation Xiaohui Zhang Jaehong Yoon Mohit Bansal Huaxiu Yao 116 26 0 17 Nov 2023
Attribute Diversity Determines the Systematicity Gap in VQA Ian Berlot-Attwell Kumar Krishna Agrawal A. M. Carrell Yash Sharma Naomi Saphra 80 1 0 15 Nov 2023
Large Language Models for Robotics: A Survey Fanlong Zeng Wensheng Gan Yongheng Wang Ning Liu Philip S. Yu LM&Ro 190 140 0 13 Nov 2023
Personalizing Keyword Spotting with Speaker Information Beltrán Labrador Pai Zhu Guanlong Zhao Angelo Scorza Scarpati Quan Wang Alicia Lozano-Diez Alex Park Ignacio López Moreno 59 2 0 06 Nov 2023
Sparse Training of Discrete Diffusion Models for Graph Generation Yiming Qin Clément Vignac Pascal Frossard 76 14 0 03 Nov 2023
ACQUIRED: A Dataset for Answering Counterfactual Questions In Real-Life Videos Te-Lin Wu Zi-Yi Dou Qingyuan Hu Yu Hou Nischal Reddy Chandra Marjorie Freedman R. Weischedel Nanyun Peng 116 8 0 02 Nov 2023
E3 TTS: Easy End-to-End Diffusion-based Text to Speech Yuan Gao Nobuyuki Morioka Yu Zhang Nanxin Chen DiffM 87 33 0 02 Nov 2023
Adaptive Latent Diffusion Model for 3D Medical Image to Image Translation: Multi-modal Magnetic Resonance Imaging Study Jonghun Kim Hyunjin Park MedIm 128 40 0 01 Nov 2023
Latent Field Discovery In Interacting Dynamical Systems With Neural Fields Miltiadis Kofinas Erik J. Bekkers N. S. Nagaraja E. Gavves AI4CE 137 8 0 31 Oct 2023
Sim2Real for Environmental Neural Processes Jonas Scholz Tom R. Andersson Anna Vaughan James Requeima Richard Turner 58 3 0 30 Oct 2023
A Survey on Knowledge Editing of Neural Networks Vittorio Mazzia Alessandro Pedrani Andrea Caciolai Kay Rottmann Davide Bernardi KELM 125 25 0 30 Oct 2023
Generative Neural Fields by Mixtures of Neural Implicit Functions Tackgeun You Mijeong Kim Jungtaek Kim Bohyung Han DiffM 67 6 0 30 Oct 2023
Controllable Group Choreography using Contrastive Diffusion Nhat Le Tuong Khanh Long Do Khoa Do Hien Nguyen Erman Tjiputra Quang-Dieu Tran Anh Nguyen 129 13 0 29 Oct 2023
3D-Aware Visual Question Answering about Parts, Poses and Occlusions Xingrui Wang Wufei Ma Zhuowan Li Adam Kortylewski Alan Yuille CoGe 105 14 0 27 Oct 2023
HyperFields: Towards Zero-Shot Generation of NeRFs from Text Sudarshan Babu Richard Liu Avery Zhou Michael Maire Greg Shakhnarovich Rana Hanocka AI4CE 111 11 0 26 Oct 2023
Dynamics Generalisation in Reinforcement Learning via Adaptive Context-Aware Policies Michael Beukman Devon Jarvis Richard Klein Steven D. James Benjamin Rosman 109 13 0 25 Oct 2023