v1v2v3v4 (latest)

Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer

23 October 2019

Sharan Narang

Papers citing "Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer"

50 / 9,870 papers shown

Title
Efficient Model Editing with Task-Localized Sparse Fine-tuning Leonardo Iurada Marco Ciccone Tatiana Tommasi KELM MoMe 148 3 0 03 Apr 2025
GPTAQ: Efficient Finetuning-Free Quantization for Asymmetric Calibration Yuhang Li Ruokai Yin Donghyun Lee Shiting Xiao Priyadarshini Panda MQ 124 0 0 03 Apr 2025
Morpheus: Benchmarking Physical Reasoning of Video Generative Models with Real Physical Experiments Chenyu Zhang Daniil Cherniavskii Andrii Zadaianchuk Antonios Tragoudaras Antonios Vozikis Thijmen Nijdam Derck W. E. Prinzhorn Mark Bodracska N. Sebe E. Gavves EGVM VGen 101 0 0 03 Apr 2025
Spline-based Transformers Prashanth Chandran Agon Serifi Markus Gross Moritz Bächer 156 0 0 03 Apr 2025
CoLa -- Learning to Interactively Collaborate with Large LMs Abhishek Sharma Dan Goldwasser LLMAG SyDa 167 0 0 03 Apr 2025
Register Always Matters: Analysis of LLM Pretraining Data Through the Lens of Language Variation A. Myntti Erik Henriksson Veronika Laippala S. Pyysalo 144 0 0 02 Apr 2025
Real-time Ad retrieval via LLM-generative Commercial Intention for Sponsored Search Advertising Tongtong Liu Zhaohui Wang Meiyue Qin Zenghui Lu Xudong Chen Yuekui Yang Peng Shu 94 0 0 02 Apr 2025
Training-free Dense-Aligned Diffusion Guidance for Modular Conditional Image Synthesis Zixuan Wang Duo Peng Feng Chen Yue Yang Yinjie Lei DiffM 138 0 0 02 Apr 2025
COST: Contrastive One-Stage Transformer for Vision-Language Small Object Tracking Chunhui Zhang Li Liu Jialin Gao Xin Sun Hao Wen Xi Zhou Shiming Ge Yucheng Wang 110 1 0 02 Apr 2025
Catch Me if You Search: When Contextual Web Search Results Affect the Detection of Hallucinations Mahjabin Nahar Eun-Ju Lee Jin Won Park Dongwon Lee HILM 152 0 0 01 Apr 2025
Are you really listening? Boosting Perceptual Awareness in Music-QA Benchmarks Yongyi Zang Sean O'Brien Taylor Berg-Kirkpatrick Julian McAuley Cheng-i Wang AuLLM 142 2 0 01 Apr 2025
Follow the Flow: On Information Flow Across Textual Tokens in Text-to-Image Models Guy Kaplan Michael Toker Yuval Reif Yonatan Belinkov Roy Schwartz DiffM 105 0 0 01 Apr 2025
Generalized Tensor-based Parameter-Efficient Fine-Tuning via Lie Group Transformations Chongjie Si Zhiyi Shi Xuehui Wang Yichen Xiao Xiaokang Yang Wei Shen AI4CE 156 0 0 01 Apr 2025
SeizureTransformer: Scaling U-Net with Transformer for Simultaneous Time-Step Level Seizure Detection from Long EEG Recordings Kerui Wu Ziyue Zhao Bülent Yener ViT 91 0 0 01 Apr 2025
Accelerating Causal Network Discovery of Alzheimer Disease Biomarkers via Scientific Literature-based Retrieval Augmented Generation Xiaofan Zhou Liangjie Huang Pinyang Cheng Wenpen Yin Rui Zhang Wenrui Hao Lu Cheng 67 0 0 01 Apr 2025
Detecting Financial Fraud with Hybrid Deep Learning: A Mix-of-Experts Approach to Sequential and Anomalous Patterns Diego Vallarino 47 1 0 01 Apr 2025
QG-VTC: Question-Guided Visual Token Compression in MLLMs for Efficient VQA Shuai Li Jian Xu Xiao-Hui Li Chao Deng Lin-Lin Huang MQ 83 1 0 01 Apr 2025
VNJPTranslate: A comprehensive pipeline for Vietnamese-Japanese translation Hoang Hai Phan Nguyen Duc Minh Vu Nam Dang Phuong 68 0 0 01 Apr 2025
On Benchmarking Code LLMs for Android Malware Analysis Yiling He Hongyu She Xingzhi Qian Xinran Zheng Zhuo Chen Zhan Qin Lorenzo Cavallaro ELM 120 1 0 01 Apr 2025
A Survey on Music Generation from Single-Modal, Cross-Modal, and Multi-Modal Perspectives Shuyu Li Shulei Ji Zihao Wang Songruoyao Wu Jiaxing Yu Kai Zhang MGen VGen 295 1 0 01 Apr 2025
AnimeGamer: Infinite Anime Life Simulation with Next Game State Prediction Junhao Cheng Yuying Ge Yixiao Ge Jing Liao Ying Shan VGen AI4CE 125 4 0 01 Apr 2025
Is analogy enough to draw novel adjective-noun inferences? Hayley Ross Kathryn Davidson Najoung Kim NAI 78 0 0 31 Mar 2025
UniSep: Universal Target Audio Separation with Language Models at Scale Yun Wang Hangting Chen Dongchao Yang Weiqin Li Dan Luo Guangzhi Li Shan Yang Zhiyong Wu Helen Meng Xixin Wu VLM 84 1 0 31 Mar 2025
Model Hemorrhage and the Robustness Limits of Large Language Models Ziyang Ma Zehan Li Lefei Zhang Gui-Song Xia Bo Du Liangpei Zhang Dacheng Tao 118 1 0 31 Mar 2025
ORAL: Prompting Your Large-Scale LoRAs via Conditional Recurrent Diffusion Rana Muhammad Shahroz Khan Dongwen Tang Pingzhi Li Kai Wang Tianlong Chen AI4CE 524 1 0 31 Mar 2025
Spectral-Adaptive Modulation Networks for Visual Perception Guhnoo Yun J. Yoo Kijung Kim Jeongho Lee Paul Hongsuck Seo Dong Hwan Kim 124 0 0 31 Mar 2025
Adaptive Layer-skipping in Pre-trained LLMs Xuan Luo Weizhi Wang Xifeng Yan 461 1 0 31 Mar 2025
Text2Tracks: Prompt-based Music Recommendation via Generative Retrieval Enrico Palumbo Gustavo Penha Andreas Damianou José Luis Redondo García Timothy Christopher Heath Alice Wang Hugues Bouchard M. Lalmas 132 0 0 31 Mar 2025
DeepDubber-V1: Towards High Quality and Dialogue, Narration, Monologue Adaptive Movie Dubbing Via Multi-Modal Chain-of-Thoughts Reasoning Guidance Junjie Zheng Zihao Chen Chaofan Ding Xinhan Di VGen 122 1 0 31 Mar 2025
Communication-Efficient and Personalized Federated Foundation Model Fine-Tuning via Tri-Matrix Adaptation Yongqian Li Bo Liu Sheng Huang Zhe Zhang Xiaotong Yuan Richang Hong 143 1 0 31 Mar 2025
Whisper-LM: Improving ASR Models with Language Models for Low-Resource Languages Xabier de Zuazo Eva Navas Ibon Saratxaga Inma Hernáez Rioja 81 3 0 30 Mar 2025
TextCrafter: Accurately Rendering Multiple Texts in Complex Visual Scenes Nikai Du Zhennan Chen Zheyu Chen Shan Gao Xi Chen Zhengkai Jiang Jian Yang Ying Tai DiffM 75 3 0 30 Mar 2025
DiT4SR: Taming Diffusion Transformer for Real-World Image Super-Resolution Zheng-Peng Duan Jiawei Zhang Xin Jin Zhe Zhang Zheng Xiong Dongqing Zou Jimmy S. Ren Chun-Le Guo Chongyi Li 105 0 0 30 Mar 2025
Large Language Models Are Better Logical Fallacy Reasoners with Counterargument, Explanation, and Goal-Aware Prompt Formulation Jiwon Jeong Hyeju Jang Hogun Park ReLM LRM 136 0 0 30 Mar 2025
MiZero: The Shadowy Defender Against Text Style Infringements Ziwei Zhang Juan Wen Wanli Peng Zhengxian Wu Yunlong Zhou Yiming Xue 81 0 0 30 Mar 2025
RaanA: A Fast, Flexible, and Data-Efficient Post-Training Quantization Algorithm Yongyi Yang Jianyang Gao Wei Hu MQ 76 1 0 29 Mar 2025
The Challenge of Achieving Attributability in Multilingual Table-to-Text Generation with Question-Answer Blueprints Aden Haussmann LMTD 155 0 0 29 Mar 2025
Z-SASLM: Zero-Shot Style-Aligned SLI Blending Latent Manipulation Alessio Borgi Luca Maiano Irene Amerini 64 0 0 29 Mar 2025
Geometrical Properties of Text Token Embeddings for Strong Semantic Binding in Text-to-Image Generation H. Seo Junseo Bang Haechang Lee Joohoon Lee Byung Hyun Lee Se Young Chun 119 0 0 29 Mar 2025
Enhancing Knowledge Graph Completion with Entity Neighborhood and Relation Context Jianfei Chen Kai Zhang Aoran Gan Shiwei Tong Shuanghong Shen Qi Liu 90 0 0 29 Mar 2025
TRA: Better Length Generalisation with Threshold Relative Attention Mattia Opper Roland Fernandez P. Smolensky Jianfeng Gao 117 0 0 29 Mar 2025
Traffic Modeling for Network Security and Privacy: Challenges Ahead Dinil Mon Divakaran AAML 112 0 0 28 Mar 2025
Beyond Vanilla Fine-Tuning: Leveraging Multistage, Multilingual, and Domain-Specific Methods for Low-Resource Machine Translation Sarubi Thillainathan Songchen Yuan E. Lee Sanath Jayasena Surangika Ranathunga 95 0 0 28 Mar 2025
STADE: Standard Deviation as a Pruning Metric Diego Coello de Portugal Mecke Haya Alyoussef Ilia Koloiarov Maximilian Stubbemann Lars Schmidt-Thieme 112 0 0 28 Mar 2025
Arch-LLM: Taming LLMs for Neural Architecture Generation via Unsupervised Discrete Representation Learning Deshani Geethika Poddenige Sachith Seneviratne Damith A. Senanayake Mahesan Niranjan PN Suganthan Saman K. Halgamuge 80 0 0 28 Mar 2025
CoGen: 3D Consistent Video Generation via Adaptive Conditioning for Autonomous Driving Yishen Ji Ziyue Zhu Zhenxin Zhu Kaixin Xiong Ming Lu Zhiqi Li Lijun Zhou Haiyang Sun Bing Wang Tong Lu VGen 108 4 0 28 Mar 2025
FRASE: Structured Representations for Generalizable SPARQL Query Generation Papa Abdou Karim Karou Diallo Payel Das 77 0 0 28 Mar 2025
Domain Specific Question to SQL Conversion with Embedded Data Balancing Technique Jyothi T. Satyanarayana Murthy 94 0 0 28 Mar 2025
SocialGen: Modeling Multi-Human Social Interaction with Language Models Heng Yu Juze Zhang Changan Chen Tiange Xiang Yusu Fang Juan Carlos Niebles Ehsan Adeli VGen 93 1 0 28 Mar 2025
Unveiling the Mist over 3D Vision-Language Understanding: Object-centric Evaluation with Chain-of-Analysis J. Huang Baoxiong Jia Yansen Wang Ziyu Zhu Xiongkun Linghu Qing Li Song-Chun Zhu Siyuan Huang 175 5 0 28 Mar 2025