Title
The Waymo Open Sim Agents Challenge Nico Montali John Lambert Paul Mougin Alex Kuefler Nick Rhinehart ... Tristan Emrich Zoey Yang Shimon Whiteson Brandyn White Drago Anguelov LLMAG 101 54 0 19 May 2023
AI's Regimes of Representation: A Community-centered Study of Text-to-Image Models in South Asia Rida Qadri Renee Shelby Cynthia L. Bennett Emily Denton 79 76 0 19 May 2023
Towards Accurate Image Coding: Improved Autoregressive Image Generation with Dynamic Vector Quantization Mengqi Huang Zhendong Mao Zhuowei Chen Yongdong Zhang MQ 132 41 0 19 May 2023
Efficient Cross-Lingual Transfer for Chinese Stable Diffusion with Images as Pivots Jinyi Hu Xu Han Xiaoyuan Yi Yutong Chen Wenhao Li Zhiyuan Liu Maosong Sun DiffM 37 4 0 19 May 2023
A Survey of Safety and Trustworthiness of Large Language Models through the Lens of Verification and Validation Xiaowei Huang Wenjie Ruan Wei Huang Gao Jin Yizhen Dong ... Sihao Wu Peipei Xu Dengyu Wu André Freitas Mustafa A. Mustafa ALM 132 96 0 19 May 2023
Inspecting the Geographical Representativeness of Images from Text-to-Image Models Aparna Basu R. Venkatesh Babu Danish Pruthi DiffM 120 40 0 18 May 2023
X-IQE: eXplainable Image Quality Evaluation for Text-to-Image Generation with Visual Large Language Models Yixiong Chen Li Liu C. Ding 75 22 0 18 May 2023
What You See is What You Read? Improving Text-Image Alignment Evaluation Michal Yarom Yonatan Bitton Soravit Changpinyo Roee Aharoni Jonathan Herzig Oran Lang E. Ofek Idan Szpektor EGVM 144 85 0 17 May 2023
Sequence-to-Sequence Pre-training with Unified Modality Masking for Visual Document Understanding ShuWei Feng Tianyang Zhan Zhanming Jie Trung Quoc Luong Xiaoran Jin 49 1 0 16 May 2023
DATED: Guidelines for Creating Synthetic Datasets for Engineering Design Applications Cyril Picard Jürg Schiffmann Faez Ahmed 81 9 0 15 May 2023
Make-A-Protagonist: Generic Video Editing with An Ensemble of Experts Yuyang Zhao Enze Xie Lanqing Hong Zhenguo Li G. Lee DiffM VGen 102 34 0 15 May 2023
MMoT: Mixture-of-Modality-Tokens Transformer for Composed Multimodal Conditional Image Synthesis Jinsheng Zheng Daqing Liu Chaoyue Wang Minghui Hu Zuopeng Yang Changxing Ding Dacheng Tao 72 1 0 10 May 2023
Recommender Systems with Generative Retrieval Shashank Rajput Nikhil Mehta Anima Singh Raghunandan H. Keshavan T. Vu ... Vinh Q. Tran Jonah Samost Maciej Kula Ed H. Chi M. Sathiamoorthy RALM 3DV 101 90 0 08 May 2023
ReGeneration Learning of Diffusion Models with Rich Prompts for Zero-Shot Image Translation Yupei Lin Senyang Zhang Xiaojun Yang Tianlin Li Yukai Shi DiffM 49 7 0 08 May 2023
Towards Prompt-robust Face Privacy Protection via Adversarial Decoupling Augmentation Framework Ruijia Wu Yuhang Wang Huafeng Shi Zhipeng Yu Yichao Wu Ding Liang DiffM 67 9 0 06 May 2023
Controllable Visual-Tactile Synthesis Ruihan Gao Wenzhen Yuan Jun-Yan Zhu DiffM 59 6 0 04 May 2023
Shap-E: Generating Conditional 3D Implicit Functions Heewoo Jun Alex Nichol DiffM 287 322 0 03 May 2023
Nonparametric Generative Modeling with Conditional Sliced-Wasserstein Flows Chao Du Tianbo Li Tianyu Pang Shuicheng Yan Min Lin DiffM BDL 102 13 0 03 May 2023
DreamPaint: Few-Shot Inpainting of E-Commerce Items for Virtual Try-On without 3D Modeling M. S. Seyfioglu Karim Bouyarmane Suren Kumar A. Tavanaei Ismail B. Tutar DiffM 81 4 0 02 May 2023
Let the Chart Spark: Embedding Semantic Context into Chart with Text-to-Image Generative Model Shishi Xiao Suizi Huang Yue Lin Yilin Ye Weizhen Zeng 89 34 0 28 Apr 2023
IconShop: Text-Guided Vector Icon Synthesis with Autoregressive Transformers Rong Wu Wanchao Su Kede Ma Jing Liao 114 41 0 27 Apr 2023
Energy-based Models are Zero-Shot Planners for Compositional Scene Rearrangement N. Gkanatsios Ayush Jain Zhou Xian Yunchu Zhang C. Atkeson Katerina Fragkiadaki LM&Ro 156 33 0 27 Apr 2023
TR0N: Translator Networks for 0-Shot Plug-and-Play Conditional Generation Zhaoyan Liu Noël Vouitsis S. Gorti Jimmy Ba Gabriel Loaiza-Ganem ViT 73 1 0 26 Apr 2023
Seeing is not always believing: Benchmarking Human and Model Perception of AI-Generated Images Zeyu Lu Di Huang Lei Bai Jingjing Qu Chengzhi Wu Xihui Liu Wanli Ouyang 92 58 0 25 Apr 2023
TextMesh: Generation of Realistic 3D Meshes From Text Prompts Christina Tsalicoglou Fabian Manhardt A. Tonioni Michael Niemeyer F. Tombari DiffM 76 135 0 24 Apr 2023
A Cookbook of Self-Supervised Learning Randall Balestriero Mark Ibrahim Vlad Sobal Ari S. Morcos Shashank Shekhar ... Pierre Fernandez Amir Bar Hamed Pirsiavash Yann LeCun Micah Goldblum SyDa FedML SSL 161 284 0 24 Apr 2023
Evolving Three Dimension (3D) Abstract Art: Fitting Concepts by Language Yingtao Tian 42 1 0 24 Apr 2023
Align your Latents: High-Resolution Video Synthesis with Latent Diffusion Models A. Blattmann Robin Rombach Huan Ling Tim Dockhorn Seung Wook Kim Sanja Fidler Karsten Kreis 3DGS VGen 244 1,106 0 18 Apr 2023
Visual Instruction Tuning Haotian Liu Chunyuan Li Qingyang Wu Yong Jae Lee SyDa VLM MLLM 582 4,946 0 17 Apr 2023
Latent-Shift: Latent Diffusion with Temporal Shift for Efficient Text-to-Video Generation Jie An Songyang Zhang Harry Yang Sonal Gupta Jia-Bin Huang Jiebo Luo Xiaoyue Yin DiffM VGen 114 114 0 17 Apr 2023
MasaCtrl: Tuning-Free Mutual Self-Attention Control for Consistent Image Synthesis and Editing Ming Cao Xintao Wang Zhongang Qi Ying Shan Xiaohu Qie Yinqiang Zheng DiffM 109 471 0 17 Apr 2023
AutoSplice: A Text-prompt Manipulated Image Dataset for Media Forensics Shan Jia Mingzhen Huang Zhou Zhou Yan Ju Jialing Cai Siwei Lyu DiffM 100 32 0 14 Apr 2023
Expressive Text-to-Image Generation with Rich Text Songwei Ge Taesung Park Jun-Yan Zhu Jia-Bin Huang DiffM 162 82 0 13 Apr 2023
Diagnostic Benchmark and Iterative Inpainting for Layout-Guided Image Generation Jaemin Cho Linjie Li Zhengyuan Yang Zhe Gan Lijuan Wang Joey Tianyi Zhou EGVM 72 6 0 13 Apr 2023
ImageReward: Learning and Evaluating Human Preferences for Text-to-Image Generation Jiazheng Xu Xiao Liu Yuchen Wu Yuxuan Tong Qinkai Li Ming Ding Jie Tang Yuxiao Dong 161 413 0 12 Apr 2023
Gradient-Free Textual Inversion Zhengcong Fei Mingyuan Fan Junshi Huang DiffM 114 33 0 12 Apr 2023
Re-imagine the Negative Prompt Algorithm: Transform 2D Diffusion into 3D, alleviate Janus problem and Beyond Mohammadreza Armandpour A. Sadeghian Huangjie Zheng Amir Sadeghian Mingyuan Zhou DiffM 86 128 0 11 Apr 2023
InstantBooth: Personalized Text-to-Image Generation without Test-Time Finetuning Jing Shi Wei Xiong Zhe Lin H. J. Jung DiffM 187 294 0 06 Apr 2023
Training-Free Layout Control with Cross-Attention Guidance Minghao Chen Iro Laina Andrea Vedaldi DiffM 225 237 0 06 Apr 2023
Inst-Inpaint: Instructing to Remove Objects with Diffusion Models Ahmet Burak Yildirim Vedat Baday Erkut Erdem Aykut Erdem Aysegül Dündar DiffM 109 64 0 06 Apr 2023
Taming Encoder for Zero Fine-tuning Image Customization with Text-to-Image Diffusion Models Xuhui Jia Yang Zhao Kelvin C. K. Chan Yandong Li Han-Ying Zhang Boqing Gong Tingbo Hou Haoran Wang Yu-Chuan Su DiffM 73 100 0 05 Apr 2023
GINA-3D: Learning to Generate Implicit Neural Assets in the Wild Bokui Shen Xinchen Yan C. Qi Mahyar Najibi Boyang Deng Leonidas Guibas Yin Zhou Drago Anguelov 3DV 96 21 0 04 Apr 2023
Toward Verifiable and Reproducible Human Evaluation for Text-to-Image Generation Mayu Otani Riku Togashi Yu Sawai Ryosuke Ishigami Yuta Nakashima Esa Rahtu J. Heikkilä Shiníchi Satoh 105 65 0 04 Apr 2023
Text-Conditioned Sampling Framework for Text-to-Image Generation with Masked Generative Models Jaewoong Lee Sang-Sub Jang Jaehyeong Jo Jaehong Yoon Yunji Kim Jin-Hwa Kim Jung-Woo Ha Sung Ju Hwang DiffM 77 4 0 04 Apr 2023
Scientists' Perspectives on the Potential for Generative AI in their Fields Meredith Ringel Morris AI4CE 71 43 0 04 Apr 2023
Subject-driven Text-to-Image Generation via Apprenticeship Learning Wenhu Chen Hexiang Hu Yandong Li Nataniel Rui Xuhui Jia Ming-Wei Chang William W. Cohen DiffM 156 194 0 01 Apr 2023
Forget-Me-Not: Learning to Forget in Text-to-Image Diffusion Models Eric Zhang Kai Wang Xingqian Xu Zhangyang Wang Humphrey Shi DiffM 132 193 0 30 Mar 2023
Discriminative Class Tokens for Text-to-Image Diffusion Models Idan Schwartz Vésteinn Snaebjarnarson Hila Chefer Ryan Cotterell Serge Belongie Lior Wolf Sagie Benaim 105 10 0 30 Mar 2023
Qualitative Failures of Image Generation Models and Their Application in Detecting Deepfakes Ali Borji 163 32 0 29 Mar 2023
Planning with Sequence Models through Iterative Energy Minimization Hongyi Chen Yilun Du Yiye Chen J. Tenenbaum Patricio A. Vela 65 6 0 28 Mar 2023