v1v2v3v4 (latest)

Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer

23 October 2019

Sharan Narang

Papers citing "Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer"

50 / 9,921 papers shown

Title
Legal Prompting: Teaching a Language Model to Think Like a Lawyer Fang Yu Lee Quartey Frank Schilder ELM LRM 54 70 0 02 Dec 2022
Towards Cross Domain Generalization of Hamiltonian Representation via Meta Learning Yeongwoo Song Hawoong Jeong OOD AI4CE 84 1 0 02 Dec 2022
Systematic Analysis for Pretrained Language Model Priming for Parameter-Efficient Fine-tuning Shih-Cheng Huang Shi Wang Min-Han Shih Saurav Sahay Hung-yi Lee 101 0 0 02 Dec 2022
UniKGQA: Unified Retrieval and Reasoning for Solving Multi-hop Question Answering Over Knowledge Graph Jinhao Jiang Kun Zhou Wayne Xin Zhao Ji-Rong Wen RALM 130 84 0 02 Dec 2022
What do you MEME? Generating Explanations for Visual Semantic Role Labelling in Memes Shivam Sharma Siddhant Agarwal Tharun Suresh Preslav Nakov Md. Shad Akhtar Tanmoy Charkraborty VLM 104 22 0 01 Dec 2022
Finetune like you pretrain: Improved finetuning of zero-shot vision models Sachin Goyal Ananya Kumar Sankalp Garg Zico Kolter Aditi Raghunathan CLIP VLM 129 157 0 01 Dec 2022
Embedding generation for text classification of Brazilian Portuguese user reviews: from bag-of-words to transformers F. Souza J. B. O. S. Filho 53 7 0 01 Dec 2022
Language Model Pre-training on True Negatives Zhuosheng Zhang Hai Zhao Masao Utiyama Eiichiro Sumita 73 2 0 01 Dec 2022
Data-Efficient Finetuning Using Cross-Task Nearest Neighbors Hamish Ivison Noah A. Smith Hannaneh Hajishirzi Pradeep Dasigi 122 23 0 01 Dec 2022
Normalized Contrastive Learning for Text-Video Retrieval Yookoon Park Mahmoud Azab Bo Xiong Seungwhan Moon Florian Metze Gourab Kundu Kirmani Ahmed 77 12 0 30 Nov 2022
CREPE: Open-Domain Question Answering with False Presuppositions Xinyan Velocity Yu Sewon Min Luke Zettlemoyer Hannaneh Hajishirzi 105 54 0 30 Nov 2022
Fast Inference from Transformers via Speculative Decoding Yaniv Leviathan Matan Kalman Yossi Matias LRM 159 738 0 30 Nov 2022
ConvLab-3: A Flexible Dialogue System Toolkit Based on a Unified Data Format Qi Zhu Christian Geishauser Hsien-Chin Lin Carel van Niekerk Baolin Peng ... Dazhen Wan Xiaochen Zhu Jianfeng Gao Milica Gavsić Minlie Huang 108 23 0 30 Nov 2022
Learning Label Modular Prompts for Text Classification in the Wild Hailin Chen Amrita Saha Shafiq Joty Steven C. H. Hoi OOD VLM 78 5 0 30 Nov 2022
Revisiting text decomposition methods for NLI-based factuality scoring of summaries John Glover Federico Fancellu V. Jagannathan Matthew R. Gormley Thomas Schaaf HILM 89 17 0 30 Nov 2022
KRLS: Improving End-to-End Response Generation in Task Oriented Dialog with Reinforced Keywords Learning Xiao Yu Qingyang Wu Kun Qian Zhou Yu OffRL 70 12 0 30 Nov 2022
Protein Language Models and Structure Prediction: Connection and Progression Bozhen Hu Jun Xia Jiangbin Zheng Cheng Tan Yufei Huang Yongjie Xu Stan Z. Li 74 41 0 30 Nov 2022
AutoCAD: Automatically Generating Counterfactuals for Mitigating Shortcut Learning Jiaxin Wen Yeshuang Zhu Jinchao Zhang Jie Zhou Minlie Huang CML AAML 115 9 0 29 Nov 2022
Lightweight Structure-Aware Attention for Visual Understanding Heeseung Kwon F. M. Castro M. Marín-Jiménez N. Guil Alahari Karteek 86 2 0 29 Nov 2022
On the Effectiveness of Parameter-Efficient Fine-Tuning Z. Fu Haoran Yang Anthony Man-Cho So Wai Lam Lidong Bing Nigel Collier 78 162 0 28 Nov 2022
Large Pre-Trained Models with Extra-Large Vocabularies: A Contrastive Analysis of Hebrew BERT Models and a New One to Outperform Them All Eylon Guetta Avi Shmidman Shaltiel Shmidman C. Shmidman Joshua Guedalia Moshe Koppel Dan Bareket Amit Seker Reut Tsarfaty VLM 48 15 0 28 Nov 2022
Continuous diffusion for categorical data Sander Dieleman Laurent Sartran Arman Roshannai Nikolay Savinov Yaroslav Ganin ... Conor Durkan Curtis Hawthorne Rémi Leblond Will Grathwohl J. Adler DiffM 121 106 0 28 Nov 2022
DiffusionBERT: Improving Generative Masked Language Models with Diffusion Models Zhengfu He Tianxiang Sun Kuan-Chieh Wang Xuanjing Huang Xipeng Qiu DiffM VLM 103 132 0 28 Nov 2022
STAGE: Span Tagging and Greedy Inference Scheme for Aspect Sentiment Triplet Extraction Shuo Liang Wei Wei Xian-Ling Mao Yuanyuan Fu Rui Fang Dangyang Chen 100 42 0 28 Nov 2022
A Comprehensive Survey on Enterprise Financial Risk Analysis from Big Data Perspective Yu Zhao Huaming Du Qing Li Fuzhen Zhuang Ji Liu Gang Kou Gang Kou 157 1 0 28 Nov 2022
MGDoc: Pre-training with Multi-granular Hierarchy for Document Image Understanding Zilong Wang Jiuxiang Gu Chris Tensmeyer Nikolaos Barmpalios A. Nenkova Tong Sun Jingbo Shang Vlad I. Morariu VLM 74 12 0 27 Nov 2022
Understanding BLOOM: An empirical study on diverse NLP tasks Parag Dakle Sai Krishna Rallabandi Preethi Raghavan AI4CE 91 4 0 27 Nov 2022
Unified Discrete Diffusion for Simultaneous Vision-Language Generation Minghui Hu Chuanxia Zheng Heliang Zheng Tat-Jen Cham Chaoyue Wang Zuopeng Yang Dacheng Tao Ponnuthurai Nagaratnam Suganthan DiffM 131 26 0 27 Nov 2022
Target-Free Text-guided Image Manipulation Wanshu Fan Cheng Yang Chiao-An Yang Yu-Chiang Frank Wang DiffM 53 2 0 26 Nov 2022
A System for Morphology-Task Generalization via Unified Representation and Behavior Distillation Hiroki Furuta Yusuke Iwasawa Yutaka Matsuo S. Gu 83 17 0 25 Nov 2022
GPT-3-driven pedagogical agents for training children's curious question-asking skills Rania Abdelghani Yen-Hsiang Wang Xingdi Yuan Tong Wang Pauline Lucas Hélene Sauzéon Pierre-Yves Oudeyer 120 108 0 25 Nov 2022
Galvatron: Efficient Transformer Training over Multiple GPUs Using Automatic Parallelism Xupeng Miao Yujie Wang Youhe Jiang Chunan Shi Xiaonan Nie Hailin Zhang Tengjiao Wang GNN MoE 110 64 0 25 Nov 2022
TESSP: Text-Enhanced Self-Supervised Speech Pre-training Zhuoyuan Yao Shuo Ren Sanyuan Chen Ziyang Ma Pengcheng Guo Linfu Xie 90 5 0 24 Nov 2022
Shifted Diffusion for Text-to-image Generation Yufan Zhou Bingchen Liu Yizhe Zhu Xiao Yang Changyou Chen Jinhui Xu DiffM 137 45 0 24 Nov 2022
Using Focal Loss to Fight Shallow Heuristics: An Empirical Analysis of Modulated Cross-Entropy in Natural Language Inference Frano Rajic Ivan Stresec Axel Marmet Tim Postuvan 49 3 0 23 Nov 2022
Automatic Generation of Socratic Subquestions for Teaching Math Word Problems Kumar Shridhar Jakub Macina Mennatallah El-Assady Tanmay Sinha Manu Kapur Mrinmaya Sachan AIMat 104 49 0 23 Nov 2022
Can Open-Domain QA Reader Utilize External Knowledge Efficiently like Humans? Neeraj Varshney Man Luo Chitta Baral RALM 65 12 0 23 Nov 2022
Leveraging Data Recasting to Enhance Tabular Reasoning Aashna Jena Vivek Gupta Manish Shrivastava Julian Martin Eisenschlos LMTD 49 6 0 23 Nov 2022
HyperTuning: Toward Adapting Large Language Models without Back-propagation Jason Phang Yi Mao Pengcheng He Weizhu Chen 96 34 0 22 Nov 2022
Coreference Resolution through a seq2seq Transition-Based System Bernd Bohnet Chris Alberti Michael Collins 80 40 0 22 Nov 2022
Linear Interpolation In Parameter Space is Good Enough for Fine-Tuned Language Models Mark Rofin Nikita Balagansky Daniil Gavrilov MoMe KELM 94 7 0 22 Nov 2022
BotSIM: An End-to-End Bot Simulation Framework for Commercial Task-Oriented Dialog Systems Guangsen Wang Samson Tan Shafiq Joty Ganglu Wu Jimmy Au Steven C. H. Hoi 91 3 0 22 Nov 2022
Evaluating the Knowledge Dependency of Questions Hyeongdon Moon Yoonseok Yang Jamin Shin Hangyeol Yu Seunghyun Lee Myeongho Jeong Juneyoung Park Minsam Kim Seungtaek Choi AI4Ed 63 11 0 21 Nov 2022
Enhancing Self-Consistency and Performance of Pre-Trained Language Models through Natural Language Inference E. Mitchell Joseph J. Noh Siyan Li William S. Armstrong Ananth Agarwal Patrick Liu Chelsea Finn Christopher D. Manning 88 35 0 21 Nov 2022
Can You Label Less by Using Out-of-Domain Data? Active & Transfer Learning with Few-shot Instructions Rafal Kocielnik Sara Kangaslahti Shrimai Prabhumoye M. Hari R. Alvarez Anima Anandkumar 59 8 0 21 Nov 2022
Multitask Vision-Language Prompt Tuning Sheng Shen Shijia Yang Tianjun Zhang Bohan Zhai Joseph E. Gonzalez Kurt Keutzer Trevor Darrell VLM VPVLM 115 53 0 21 Nov 2022
Perceiver-VL: Efficient Vision-and-Language Modeling with Iterative Latent Attention Zineng Tang Jaemin Cho Jie Lei Joey Tianyi Zhou VLM 84 9 0 21 Nov 2022
Deanthropomorphising NLP: Can a Language Model Be Conscious? Matthew Shardlow Piotr Przybyła 64 7 0 21 Nov 2022
AF Adapter: Continual Pretraining for Building Chinese Biomedical Language Model Yongyu Yan Kui Xue Xiaoming Shi Qi Ye Jingping Liu Tong Ruan CLL 71 2 0 21 Nov 2022
TCBERT: A Technical Report for Chinese Topic Classification BERT Ting Han Kunhao Pan Xinyu Chen Dingjie Song Yuchen Fan Xinyu Gao Ruyi Gan Jiaxing Zhang VLM 65 1 0 21 Nov 2022