TDRI: Two-Phase Dialogue Refinement and Co-Adaptation for Interactive Image Generation

v1v2 (latest)

TDRI: Two-Phase Dialogue Refinement and Co-Adaptation for Interactive Image Generation

22 March 2025

ArXiv (abs)PDF HTML

Papers citing "TDRI: Two-Phase Dialogue Refinement and Co-Adaptation for Interactive Image Generation"

16 / 66 papers shown

Title
GPT-4 Technical Report OpenAI OpenAI OpenAI Josh Achiam Steven Adler Sandhini Agarwal Lama Ahmad ... Shengjia Zhao Tianhao Zheng Juntang Zhuang William Zhuk Barret Zoph LLMAG MLLM 1.6K 14,828 0 15 Mar 2023
Aligning Text-to-Image Models using Human Feedback Kimin Lee Hao Liu Moonkyung Ryu Olivia Watkins Yuqing Du Craig Boutilier Pieter Abbeel Mohammad Ghavamzadeh S. Gu EGVM 130 285 0 23 Feb 2023
ChatGPT is not all you need. A State of the Art Review of large Generative AI models Roberto Gozalo-Brizuela E.C. Garrido-Merchán 91 267 0 11 Jan 2023
SPTS v2: Single-Point Scene Text Spotting Yuliang Liu Jiaxin Zhang Dezhi Peng Mingxin Huang Xinyu Wang ... Can Huang Dahua Lin Chunhua Shen Xiang Bai Lianwen Jin VLM 125 52 0 04 Jan 2023
Muse: Text-To-Image Generation via Masked Generative Transformers Huiwen Chang Han Zhang Jarred Barber AJ Maschinot José Lezama ... Kevin Patrick Murphy William T. Freeman Michael Rubinstein Yuanzhen Li Dilip Krishnan DiffM 278 560 0 02 Jan 2023
Large Language Models are Better Reasoners with Self-Verification Yixuan Weng Minjun Zhu Fei Xia Bin Li Shizhu He Shengping Liu Bin Sun Kang Liu Jun Zhao ReLM LRM 80 227 0 19 Dec 2022
Prompt-to-Prompt Image Editing with Cross Attention Control Amir Hertz Ron Mokady J. Tenenbaum Kfir Aberman Yael Pritch Daniel Cohen-Or DiffM 241 1,796 0 02 Aug 2022
Optimal Boxes: Boosting End-to-End Scene Text Recognition by Adjusting Annotated Bounding Boxes via Reinforcement Learning Jingqun Tang Wenming Qian Luchuan Song Xie Dong Lang Li Xiang Bai 68 15 0 25 Jul 2022
Scaling Autoregressive Models for Content-Rich Text-to-Image Generation Jiahui Yu Yuanzhong Xu Jing Yu Koh Thang Luong Gunjan Baid ... Zarana Parekh Xin Li Han Zhang Jason Baldridge Yonghui Wu EGVM 214 1,134 0 22 Jun 2022
Photorealistic Text-to-Image Diffusion Models with Deep Language Understanding Chitwan Saharia William Chan Saurabh Saxena Lala Li Jay Whang ... Raphael Gontijo-Lopes Tim Salimans Jonathan Ho David J Fleet Mohammad Norouzi VLM 494 6,102 0 23 May 2022
Few Could Be Better Than All: Feature Sampling and Grouping for Scene Text Detection Jixin Tang Wenqing Zhang Hong-yi Liu Mingkun Yang Ziwei He Guan-Nan Hu Xiang Bai ViT 81 67 0 29 Mar 2022
Towards Visual-Prompt Temporal Answering Grounding in Medical Instructional Video Bin Li Yixuan Weng Bin Sun Shutao Li 135 33 0 13 Mar 2022
Bilateral Personalized Dialogue Generation with Contrastive Learning Bin Li Hanjun Deng 88 9 0 15 Jun 2021
Learning Transferable Visual Models From Natural Language Supervision Alec Radford Jong Wook Kim Chris Hallacy Aditya A. Ramesh Gabriel Goh ... Amanda Askell Pamela Mishkin Jack Clark Gretchen Krueger Ilya Sutskever CLIP VLM 1.1K 30,032 0 26 Feb 2021
Zero-Shot Text-to-Image Generation Aditya A. Ramesh Mikhail Pavlov Gabriel Goh Scott Gray Chelsea Voss Alec Radford Mark Chen Ilya Sutskever VLM 428 5,015 0 24 Feb 2021
Adversarial Text-to-Image Synthesis: A Review Stanislav Frolov Tobias Hinz Federico Raue Jörn Hees Andreas Dengel EGVM 80 178 0 25 Jan 2021