v1v2 (latest)

Self-critical Sequence Training for Image Captioning

2 December 2016

Papers citing "Self-critical Sequence Training for Image Captioning"

50 / 862 papers shown

Title
Dual Reinforcement-Based Specification Generation for Image De-Rendering Ramakanth Pasunuru David B. Rosenberg Gideon Mann Joey Tianyi Zhou 112 0 0 02 Mar 2021
Enhanced Modality Transition for Image Captioning Ziwei Wang Yadan Luo Zi Huang 30 0 0 23 Feb 2021
VisualGPT: Data-efficient Adaptation of Pretrained Language Models for Image Captioning Jun Chen Han Guo Kai Yi Boyang Albert Li Mohamed Elhoseiny VLM 166 228 0 20 Feb 2021
Progressive Transformer-Based Generation of Radiology Reports Farhad Nooralahzadeh Nicolas Andres Perez Gonzalez T. Frauenfelder Koji Fujimoto Michael Krauthammer ViT MedIm 117 89 0 19 Feb 2021
I Want This Product but Different : Multimodal Retrieval with Synthetic Query Expansion Ivona Tautkute Tomasz Trzciñski 77 4 0 17 Feb 2021
Image Captioning using Multiple Transformers for Self-Attention Mechanism Farrukh Olimov Shikha Dubey Labina Shrestha Tran Trung Tin M. Jeon ViT 48 2 0 14 Feb 2021
The MSR-Video to Text Dataset with Clean Annotations Haoran Chen Jianmin Li Simone Frintrop Xiaolin Hu 85 18 0 12 Feb 2021
In Defense of Scene Graphs for Image Captioning Kien Nguyen Subarna Tripathi Bang Du T. Guha Truong Thao Nguyen 90 46 0 09 Feb 2021
DRAG: Director-Generator Language Modelling Framework for Non-Parallel Author Stylized Rewriting Hrituraj Singh Gaurav Verma Aparna Garimella Balaji Vasan Srinivasan DiffM 50 6 0 28 Jan 2021
Scheduled Sampling in Vision-Language Pretraining with Decoupled Encoder-Decoder Network Yehao Li Yingwei Pan Ting Yao Jingwen Chen Tao Mei VLM 97 53 0 27 Jan 2021
CPTR: Full Transformer Network for Image Captioning Wei Liu Sihan Chen Longteng Guo Xinxin Zhu Jing Liu ViT 77 143 0 26 Jan 2021
ECOL-R: Encouraging Copying in Novel Object Captioning with Reinforcement Learning Yufei Wang Ian D. Wood Stephen Wan Mark Johnson 55 8 0 25 Jan 2021
Fast Sequence Generation with Multi-Agent Reinforcement Learning Longteng Guo Jing Liu Xinxin Zhu Hanqing Lu LRM 98 6 0 24 Jan 2021
Visual Question Answering based on Local-Scene-Aware Referring Expression Generation Jungjun Kim Dong-Gyu Lee Jialin Wu Hong G Jung Seong-Whan Lee ObjD 96 22 0 22 Jan 2021
Macroscopic Control of Text Generation for Image Captioning Zhangzi Zhu Tianlei Wang Hong Qu 84 4 0 20 Jan 2021
Diagnostic Captioning: A Survey John Pavlopoulos Vasiliki Kougia Ion Androutsopoulos D. Papamichail 3DV MedIm 163 30 0 18 Jan 2021
Dual-Level Collaborative Transformer for Image Captioning Yunpeng Luo Jiayi Ji Xiaoshuai Sun Liujuan Cao Yongjian Wu Feiyue Huang Chia-Wen Lin Rongrong Ji ViT 102 283 0 16 Jan 2021
Persistent Anti-Muslim Bias in Large Language Models Abubakar Abid Maheen Farooqi James Zou AILaw 177 562 0 14 Jan 2021
Exploration of Visual Features and their weighted-additive fusion for Video Captioning V. PraveenS. Akhilesh Bharadwaj Harsh Raj Janhavi Dadhania Ganesh Samarth C.A Nikhil Pareek S. M. I. S. R. Mahadeva Prasanna 58 1 0 14 Jan 2021
Unifying Relational Sentence Generation and Retrieval for Medical Image Report Composition Fuyu Wang Xiaodan Liang Lin Xu Liang Lin MedIm 79 27 0 09 Jan 2021
VinVL: Revisiting Visual Representations in Vision-Language Models Pengchuan Zhang Xiujun Li Xiaowei Hu Jianwei Yang Lei Zhang Lijuan Wang Yejin Choi Jianfeng Gao ObjD VLM 353 158 0 02 Jan 2021
SDA: Improving Text Generation with Self Data Augmentation Ping Yu Ruiyi Zhang Yang Zhao Yizhe Zhang Chunyuan Li Changyou Chen 47 2 0 02 Jan 2021
Text-Free Image-to-Speech Synthesis Using Learned Segmental Units Wei-Ning Hsu David Harwath Christopher Song James R. Glass CLIP 92 67 0 31 Dec 2020
Neural Text Generation with Artificial Negative Examples Keisuke Shirai Kazuma Hashimoto Akiko Eriguchi Takashi Ninomiya Shinsuke Mori 74 8 0 28 Dec 2020
SubICap: Towards Subword-informed Image Captioning Naeha Sharif Bennamoun Wei Liu Syed Afaq Ali Shah 56 2 0 24 Dec 2020
Pattern-aware Data Augmentation for Query Rewriting in Voice Assistant Systems Yunmo Chen Sixing Lu Fan Yang Xiaojiang Huang Xing Fan Chenlei Guo 72 3 0 21 Dec 2020
Exploring Fluent Query Reformulations with Text-to-Text Transformers and Reinforcement Learning Jerry Zikun Chen S. Yu Haoran Wang 451 5 0 18 Dec 2020
AutoCaption: Image Captioning with Neural Architecture Search Xinxin Zhu Weining Wang Longteng Guo Jing Liu 111 9 0 16 Dec 2020
Intrinsic Image Captioning Evaluation Chao Zeng Sam Kwong 59 1 0 14 Dec 2020
Improving Image Captioning by Leveraging Intra- and Inter-layer Global Representation in Transformer Network Jiayi Ji Yunpeng Luo Xiaoshuai Sun Fuhai Chen Gen Luo Yongjian Wu Yue Gao Rongrong Ji ViT 115 178 0 13 Dec 2020
Image Captioning with Context-Aware Auxiliary Guidance Zeliang Song Xiaofei Zhou Zhendong Mao Jianlong Tan 93 31 0 10 Dec 2020
Understanding Guided Image Captioning Performance across Domains Edwin G. Ng Bo Pang P. Sharma Radu Soricut 133 25 0 04 Dec 2020
Scan2Cap: Context-aware Dense Captioning in RGB-D Scans Dave Zhenyu Chen A. Gholami Matthias Nießner Angel X. Chang 3DPC 195 176 0 03 Dec 2020
A Comprehensive Review on Recent Methods and Challenges of Video Description Ashutosh Kumar Singh Thoudam Doren Singh Sivaji Bandyopadhyay 3DV VLM 55 5 0 30 Nov 2020
Multimodal Learning for Hateful Memes Detection Yi Zhou Zhenhao Chen 106 61 0 25 Nov 2020
SuperOCR: A Conversion from Optical Character Recognition to Image Captioning Baohua Sun Michael Lin Hao Sha Lin Yang 55 5 0 21 Nov 2020
Structural and Functional Decomposition for Personality Image Captioning in a Communication Game Minh-Thu Nguyen Duy Phung Minh Hoai Thien Huu Nguyen 73 4 0 17 Nov 2020
Reinforced Medical Report Generation with X-Linear Attention and Repetition Penalty Wenting Xu Chang Qi Zhenghua Xu Thomas Lukasiewicz MedIm 35 4 0 16 Nov 2020
DORB: Dynamically Optimizing Multiple Rewards with Bandits Ramakanth Pasunuru Han Guo Joey Tianyi Zhou OffRL 72 7 0 15 Nov 2020
CapWAP: Captioning with a Purpose Adam Fisch Kenton Lee Ming-Wei Chang J. Clark Regina Barzilay 53 11 0 09 Nov 2020
Dual Attention on Pyramid Feature Maps for Image Captioning Litao Yu Jian Zhang Qiang Wu 115 50 0 02 Nov 2020
Exploring Question-Specific Rewards for Generating Deep Questions Yuxi Xie Liangming Pan Dongzhe Wang Min-Yen Kan Yansong Feng 115 27 0 02 Nov 2020
Boost Image Captioning with Knowledge Reasoning Feicheng Huang Zhixin Li Haiyang Wei Canlong Zhang Huifang Ma 51 25 0 02 Nov 2020
Generating Radiology Reports via Memory-driven Transformer Zhihong Chen Yan Song Tsung-Hui Chang Xiang Wan MedIm 84 486 0 30 Oct 2020
POMO: Policy Optimization with Multiple Optima for Reinforcement Learning Yeong-Dae Kwon Jinho Choo Byoungjip Kim Iljoo Yoon Youngjune Gwon Seungjai Min 154 351 0 30 Oct 2020
Less is More: Data-Efficient Complex Question Answering over Knowledge Bases Yuncheng Hua Yuan-Fang Li Guilin Qi Wei Wu Jingyao Zhang Daiqing Qi 79 28 0 29 Oct 2020
Quantifying Learnability and Describability of Visual Concepts Emerging in Representation Learning Iro Laina Ruth C. Fong Andrea Vedaldi OCL 82 13 0 27 Oct 2020
Beyond VQA: Generating Multi-word Answer and Rationale to Visual Questions Radhika Dua Sai Srinivas Kancheti V. Balasubramanian LRM 88 22 0 24 Oct 2020
Show and Speak: Directly Synthesize Spoken Description of Images Xinsheng Wang Siyuan Feng Jihua Zhu M. Hasegawa-Johnson O. Scharenborg 172 4 0 23 Oct 2020
Learning to Optimise General TSP Instances N. Sultana Jeffrey Chan •. A. K. Qin Tabinda Sarwar 111 13 0 23 Oct 2020