A Survey on Data Augmentation in Large Model Era

27 January 2024

Papers citing "A Survey on Data Augmentation in Large Model Era"

48 / 48 papers shown

Title
Audio-Language Datasets of Scenes and Events: A Survey Gijs Wijngaard Elia Formisano Michele Esposito M. Dumontier 107 2 0 10 Jan 2025
Seamless Optical Cloud Computing across Edge-Metro Network for Generative AI Sizhe Xing Aolong Sun Chengxi Wang Yizhi Wang Boyu Dong ... Xi Xiao R. Penty Qixiang Cheng Nan Chi Junwen Zhang 131 0 0 04 Dec 2024
Cross Domain Generative Augmentation: Domain Generalization with Latent Diffusion Models S. Hemati Mahdi Beitollahi A. Estiri Bassel Al Omari Xi Chen Guojun Zhang 34 6 0 08 Dec 2023
Improving Audio Captioning Models with Fine-grained Audio Features, Text Embedding Supervision, and LLM Mix-up Augmentation Shih-Lun Wu Xuankai Chang Gordon Wichern Jee-weon Jung Franccois G. Germain Jonathan Le Roux Shinji Watanabe 31 19 0 29 Sep 2023
ICLEF: In-Context Learning with Expert Feedback for Explainable Style Transfer Arkadiy Saakyan Smaranda Muresan 39 4 0 15 Sep 2023
Generative Data Augmentation using LLMs improves Distributional Robustness in Question Answering Arijit Ghosh Chowdhury Aman Chadha OOD 36 3 0 03 Sep 2023
Subject-driven Text-to-Image Generation via Apprenticeship Learning Wenhu Chen Hexiang Hu Yandong Li Nataniel Rui Xuhui Jia Ming-Wei Chang William W. Cohen DiffM 58 189 0 01 Apr 2023
SINE: SINgle Image Editing with Text-to-Image Diffusion Models Zhixing Zhang Ligong Han Arna Ghosh Dimitris N. Metaxas Jian Ren DiffM 83 156 0 08 Dec 2022
DiffEdit: Diffusion-based semantic image editing with mask guidance Guillaume Couairon Jakob Verbeek Holger Schwenk Matthieu Cord DiffM 103 490 0 20 Oct 2022
DiffuSeq: Sequence to Sequence Text Generation with Diffusion Models Shansan Gong Mukai Li Jiangtao Feng Zhiyong Wu Lingpeng Kong 63 325 0 17 Oct 2022
Is synthetic data from generative models ready for image recognition? Ruifei He Shuyang Sun Xin Yu Chuhui Xue Wenqing Zhang Philip Torr Song Bai Xiaojuan Qi 66 294 0 14 Oct 2022
An Image is Worth One Word: Personalizing Text-to-Image Generation using Textual Inversion Rinon Gal Yuval Alaluf Yuval Atzmon Or Patashnik Amit H. Bermano Gal Chechik Daniel Cohen-Or 56 1,837 0 02 Aug 2022
DAGAM: Data Augmentation with Generation And Modification Byeong-Cheol Jo Tak-Sung Heo Yeongjoon Park Yongmin Yoo Won-Ik Cho Kyungsun Kim VLM 36 2 0 06 Apr 2022
Text2LIVE: Text-Driven Layered Image and Video Editing Omer Bar-Tal Dolev Ofri-Amar Rafail Fridman Yoni Kasten Tali Dekel VGen DiffM 37 309 0 05 Apr 2022
Generative Adversarial Networks Gilad Cohen Raja Giryes GAN 87 30,021 0 01 Mar 2022
Text and Code Embeddings by Contrastive Pre-Training Arvind Neelakantan Tao Xu Raul Puri Alec Radford Jesse Michael Han ... Tabarak Khan Toki Sherbakov Joanne Jang Peter Welinder Lilian Weng SSL AI4TS 286 432 0 24 Jan 2022
GLIDE: Towards Photorealistic Image Generation and Editing with Text-Guided Diffusion Models Alex Nichol Prafulla Dhariwal Aditya A. Ramesh Pranav Shyam Pamela Mishkin Bob McGrew Ilya Sutskever Mark Chen 189 3,531 0 20 Dec 2021
Unsupervised Dense Information Retrieval with Contrastive Learning Gautier Izacard Mathilde Caron Lucas Hosseini Sebastian Riedel Piotr Bojanowski Armand Joulin Edouard Grave RALM 92 864 0 16 Dec 2021
More Control for Free! Image Synthesis with Semantic Diffusion Guidance Xihui Liu Dong Huk Park S. Azadi Gong Zhang Arman Chopikyan Yuxiao Hu Humphrey Shi Anna Rohrbach Trevor Darrell DiffM 60 253 0 10 Dec 2021
STraTA: Self-Training with Task Augmentation for Better Few-shot Learning Tu Vu Minh-Thang Luong Quoc V. Le Grady Simon Mohit Iyyer 140 61 0 13 Sep 2021
Learning to Prompt for Vision-Language Models Kaiyang Zhou Jingkang Yang Chen Change Loy Ziwei Liu VPVLM CLIP VLM 420 2,340 0 02 Sep 2021
GPT Understands, Too Xiao Liu Yanan Zheng Zhengxiao Du Ming Ding Yujie Qian Zhilin Yang Jie Tang VLM 122 1,161 0 18 Mar 2021
Score-Based Generative Modeling through Stochastic Differential Equations Yang Song Jascha Narain Sohl-Dickstein Diederik P. Kingma Abhishek Kumar Stefano Ermon Ben Poole DiffM SyDa 234 6,293 0 26 Nov 2020
Multilingual Translation with Extensible Multilingual Pretraining and Finetuning Y. Tang C. Tran Xian Li Peng-Jen Chen Naman Goyal Vishrav Chaudhary Jiatao Gu Angela Fan CLL 94 453 0 02 Aug 2020
NWPU-Crowd: A Large-Scale Benchmark for Crowd Counting and Localization Qi. Wang Junyu Gao Wei Lin Xuelong Li 68 382 0 10 Jan 2020
Distributionally Robust Neural Networks for Group Shifts: On the Importance of Regularization for Worst-Case Generalization Shiori Sagawa Pang Wei Koh Tatsunori B. Hashimoto Percy Liang OOD 36 1,217 0 20 Nov 2019
Adversarial NLI: A New Benchmark for Natural Language Understanding Yixin Nie Adina Williams Emily Dinan Joey Tianyi Zhou Jason Weston Douwe Kiela 84 991 0 31 Oct 2019
Clotho: An Audio Captioning Dataset Konstantinos Drossos Samuel Lipping Tuomas Virtanen 58 381 0 21 Oct 2019
DistilBERT, a distilled version of BERT: smaller, faster, cheaper and lighter Victor Sanh Lysandre Debut Julien Chaumond Thomas Wolf 80 7,386 0 02 Oct 2019
Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks Nils Reimers Iryna Gurevych 463 11,979 0 27 Aug 2019
RoBERTa: A Robustly Optimized BERT Pretraining Approach Yinhan Liu Myle Ott Naman Goyal Jingfei Du Mandar Joshi Danqi Chen Omer Levy M. Lewis Luke Zettlemoyer Veselin Stoyanov AIMat 336 24,160 0 26 Jul 2019
SpanBERT: Improving Pre-training by Representing and Predicting Spans Mandar Joshi Danqi Chen Yinhan Liu Daniel S. Weld Luke Zettlemoyer Omer Levy 96 1,953 0 24 Jul 2019
Generative Modeling by Estimating Gradients of the Data Distribution Yang Song Stefano Ermon SyDa DiffM 129 3,803 0 12 Jul 2019
CutMix: Regularization Strategy to Train Strong Classifiers with Localizable Features Sangdoo Yun Dongyoon Han Seong Joon Oh Sanghyuk Chun Junsuk Choe Y. Yoo OOD 553 4,735 0 13 May 2019
nuScenes: A multimodal dataset for autonomous driving Holger Caesar Varun Bankiti Alex H. Lang Sourabh Vora Venice Erin Liong Qiang Xu Anush Krishnan Yuxin Pan G. Baldan Oscar Beijbom 3DPC 216 5,653 0 26 Mar 2019
Benchmarking Natural Language Understanding Services for building Conversational Agents Xingkun Liu Arash Eshghi P. Swietojanski Verena Rieser ELM 34 257 0 13 Mar 2019
EDA: Easy Data Augmentation Techniques for Boosting Performance on Text Classification Tasks Jason W. Wei Kai Zou 66 1,931 0 31 Jan 2019
A Style-Based Generator Architecture for Generative Adversarial Networks Tero Karras S. Laine Timo Aila 477 10,466 0 12 Dec 2018
Composition Loss for Counting, Density Map Estimation and Localization in Dense Crowds Haroon Idrees Muhmmad Tayyab Kishan Athrey Dong Zhang S. Al-Maadeed Nasir M. Rajpoot M. Shah 44 675 0 02 Aug 2018
Neural Network Acceptability Judgments Alex Warstadt Amanpreet Singh Samuel R. Bowman 135 1,390 0 31 May 2018
Snips Voice Platform: an embedded Spoken Language Understanding system for private-by-design voice interfaces A. Coucke Alaa Saade Adrien Ball Théodore Bluche A. Caulier ... Thibault Gisselbrecht F. Caltagirone Thibaut Lavril Maël Primet Joseph Dureau SyDa 87 818 0 25 May 2018
Generating Natural Language Adversarial Examples M. Alzantot Yash Sharma Ahmed Elgohary Bo-Jhang Ho Mani B. Srivastava Kai-Wei Chang AAML 327 921 0 21 Apr 2018
Data Augmentation Generative Adversarial Networks Antreas Antoniou Amos Storkey Harrison Edwards MedIm GAN 103 1,069 0 12 Nov 2017
TriviaQA: A Large Scale Distantly Supervised Challenge Dataset for Reading Comprehension Mandar Joshi Eunsol Choi Daniel S. Weld Luke Zettlemoyer RALM 144 2,576 0 09 May 2017
A Broad-Coverage Challenge Corpus for Sentence Understanding through Inference Adina Williams Nikita Nangia Samuel R. Bowman 330 4,444 0 18 Apr 2017
NewsQA: A Machine Comprehension Dataset Adam Trischler Tong Wang Xingdi Yuan Justin Harris Alessandro Sordoni Philip Bachman Kaheer Suleman 61 891 0 29 Nov 2016
SQuAD: 100,000+ Questions for Machine Comprehension of Text Pranav Rajpurkar Jian Zhang Konstantin Lopyrev Percy Liang RALM 107 8,067 0 16 Jun 2016
Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks Shaoqing Ren Kaiming He Ross B. Girshick Jian Sun AIMat ObjD 348 61,900 0 04 Jun 2015