v1v2v3v4 (latest)

Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer

23 October 2019

Sharan Narang

Papers citing "Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer"

50 / 9,870 papers shown

Title
Exploring the Roles of Large Language Models in Reshaping Transportation Systems: A Survey, Framework, and Roadmap Tong Nie Jian Sun Wei Ma 226 4 0 27 Mar 2025
Retrieving Time-Series Differences Using Natural Language Queries Kota Dohi Tomoya Nishida Harsh Purohit Takashi Endo Yohei Kawaguchi AI4TS 82 0 0 27 Mar 2025
Leveraging Language Models for Analyzing Longitudinal Experiential Data in Education Ahatsham Hayat Bilal Khan Mohammad Hasan AI4Ed 84 0 0 27 Mar 2025
Vision-to-Music Generation: A Survey Zhaokai Wang Chenxi Bao Le Zhuo Jingrui Han Yang Yue Yihong Tang Victor Shea-Jay Huang Yue Liao EGVM VGen 136 1 0 27 Mar 2025
DynamiCtrl: Rethinking the Basic Structure and the Role of Text for High-quality Human Image Animation Haoyu Zhao Zhongang Qi Cong Wang Qingping Zheng Guansong Lu Fei Chen Hang Xu Zuxuan Wu DiffM VGen 99 0 0 27 Mar 2025
A Unified Image-Dense Annotation Generation Model for Underwater Scenes Hongkai Lin Dingkang Liang Zhenghao Qi X. Bai DiffM 82 0 0 27 Mar 2025
MoQa: Rethinking MoE Quantization with Multi-stage Data-model Distribution Awareness Zihao Zheng Xiuping Cui Size Zheng Maoliang Li Jiayu Chen Yun Liang Xiang Chen MQ MoE 125 0 0 27 Mar 2025
Boosting Large Language Models with Mask Fine-Tuning M. Zhang Yue Bai Huan Wang Yizhou Wang Qihua Dong Y. Fu CLL 100 0 0 27 Mar 2025
ObscuraCoder: Powering Efficient Code LM Pre-Training Via Obfuscation Grounding Indraneil Paul Haoyi Yang Goran Glavaš Kristian Kersting Iryna Gurevych AAML SyDa 90 2 0 27 Mar 2025
Evaluating Text-to-Image Synthesis with a Conditional Fréchet Distance Jaywon Koo J. Hernandez Moayed Haji-Ali Ziyan Yang Vicente Ordonez EGVM 117 0 0 27 Mar 2025
Reinforced Model Merging J. N. Han Jingwen Ye Shunyu Liu Haofei Zhang Jie Song Zunlei Feng Mingli Song MoMe 88 0 0 27 Mar 2025
MSPLoRA: A Multi-Scale Pyramid Low-Rank Adaptation for Efficient Model Fine-Tuning Jiancheng Zhao Xingda Yu Zhen Yang MoE 88 3 0 27 Mar 2025
Low-resource Information Extraction with the European Clinical Case Corpus Soumitra Ghosh Begona Altuna Saeed Farzi Pietro Ferrazzi A. Lavelli Giulia Mezzanotte Manuela Speranza Bernardo Magnini 83 1 0 26 Mar 2025
MoLe-VLA: Dynamic Layer-skipping Vision Language Action Model via Mixture-of-Layers for Efficient Robot Manipulation Rongyu Zhang Menghang Dong Yuan Zhang Liang Heng Xiaowei Chi Gaole Dai Li Du Dan Wang Yuan Du MoE 163 4 0 26 Mar 2025
Cyborg Data: Merging Human with AI Generated Training Data Kai North Christopher Ormerod 68 0 0 26 Mar 2025
QUAD: Quantization and Parameter-Efficient Tuning of LLM with Activation Decomposition Yuxuan Hu Xiaodong Chen Cuiping Li Hong Chen Jing Zhang MQ 122 1 0 25 Mar 2025
EfficientMT: Efficient Temporal Adaptation for Motion Transfer in Text-to-Video Diffusion Models Yufei Cai Hu Han Yuxiang Wei Shiguang Shan Xilin Chen DiffM VGen 95 0 0 25 Mar 2025
Inference-Time Scaling for Flow Models via Stochastic Generation and Rollover Budget Forcing Jaihoon Kim Taehoon Yoon Jisung Hwang Minhyuk Sung DiffM 179 3 0 25 Mar 2025
Scaling Down Text Encoders of Text-to-Image Diffusion Models Lifu Wang Daqing Liu Xinchen Liu Xiaodong He VLM 136 0 0 25 Mar 2025
DeCAP: Context-Adaptive Prompt Generation for Debiasing Zero-shot Question Answering in Large Language Models Suyoung Bae YunSeok Choi Jee-Hyong Lee 71 0 0 25 Mar 2025
CubeRobot: Grounding Language in Rubik's Cube Manipulation via Vision-Language Model Feiyang Wang Xiaomin Yu Wangyu Wu LM&Ro 93 0 0 25 Mar 2025
Learning 3D Object Spatial Relationships from Pre-trained 2D Diffusion Models Sangwon Beak Hyeonwoo Kim Hanbyul Joo 106 0 0 25 Mar 2025
RoboFlamingo-Plus: Fusion of Depth and RGB Perception with Vision-Language Models for Enhanced Robotic Manipulation Sheng Wang VLM 128 2 0 25 Mar 2025
CEFW: A Comprehensive Evaluation Framework for Watermark in Large Language Models Shuhao Zhang B. Cheng Jiale Han Yuli Chen Zhixuan Wu Changbao Li Pingli Gu WaLM 128 0 0 24 Mar 2025
Instruction-Aligned Visual Attention for Mitigating Hallucinations in Large Vision-Language Models Bin Li Dehong Gao Yeyuan Wang Linbo Jin Shanqing Yu Xiaoyan Cai Libin Yang VLM 88 0 0 24 Mar 2025
PAD: Towards Efficient Data Generation for Transfer Learning Using Phrase Alignment Jong Myoung Kim Young-Jun_Lee Ho-Jin Choi Sangkeun Jung 102 0 0 24 Mar 2025
Diffusion-4K: Ultra-High-Resolution Image Synthesis with Latent Diffusion Models Jinjin Zhang Qiuyu Huang Junjie Liu Xiefan Guo Di Huang 127 7 0 24 Mar 2025
Maximum Redundancy Pruning: A Principle-Driven Layerwise Sparsity Allocation for LLMs Chang Gao Kang Zhao Jianfei Chen Liping Jing 83 0 0 24 Mar 2025
CoMP: Continual Multimodal Pre-training for Vision Foundation Models Yuxiao Chen L. Meng Wujian Peng Zuxuan Wu Yu-Gang Jiang VLM 211 1 0 24 Mar 2025
Exploring Training and Inference Scaling Laws in Generative Retrieval Hongru Cai Yongqi Li Ruifeng Yuan Wenjie Wang Zhen Zhang Wenjie Li Tat-Seng Chua 71 1 0 24 Mar 2025
HOIGPT: Learning Long Sequence Hand-Object Interaction with Language Models Mingzhen Huang Fu-Jen Chu Bugra Tekin Kevin J. Liang Haoyu Ma ... Hongfei Xue Siwei Lyu Kris Kitani Matt Feiszli Hao Tang VLM 118 4 0 24 Mar 2025
AfroXLMR-Social: Adapting Pre-trained Language Models for African Languages Social Media Text Tadesse Destaw Belay Israel Abebe Azime Ibrahim Said Ahmad David Ifeoluwa Adelani Idris Abdulmumin Abinew Ali Ayele Shamsuddeen Hassan Muhammad Seid Muhie Yimam 120 0 0 24 Mar 2025
Predicting the Road Ahead: A Knowledge Graph based Foundation Model for Scene Understanding in Autonomous Driving Hongkuan Zhou Stefan Schmid Yicong Li Lavdim Halilaj Xiangtong Yao Wei Cao 88 0 0 24 Mar 2025
ExpertRAG: Efficient RAG with Mixture of Experts -- Optimizing Context Retrieval for Adaptive LLM Responses Esmail Gumaan MoE 78 0 0 23 Mar 2025
Detection of Somali-written Fake News and Toxic Messages on the Social Media Using Transformer-based Language Models Muhidin A. Mohamed Shuab D. Ahmed Yahye A. Isse Hanad M. Mohamed Fuad Mire Hassan Houssein A. Assowe 84 0 0 23 Mar 2025
LakotaBERT: A Transformer-based Model for Low Resource Lakota Language Kanishka Parankusham Rodrigue Rizk KC Santosh 92 0 0 23 Mar 2025
Accurate Peak Detection in Multimodal Optimization via Approximated Landscape Learning Zeyuan Ma Hongqiao Lian Wenjie Qiu Yue-Jiao Gong 124 3 0 23 Mar 2025
Dynamic Task Vector Grouping for Efficient Multi-Task Prompt Tuning Pieyi Zhang Richong Zhang Zhijie Nie VLM 138 0 0 23 Mar 2025
Payload-Aware Intrusion Detection with CMAE and Large Language Models Yongcheol Kim Chanjae Lee Young Yoon 77 0 0 23 Mar 2025
A Survey on Mathematical Reasoning and Optimization with Large Language Models Ali Forootani OffRL LRM AI4CE 118 1 0 22 Mar 2025
Feather-SQL: A Lightweight NL2SQL Framework with Dual-Model Collaboration Paradigm for Small Language Models Wenqi Pei Hailing Xu Hengyuan Zhao Shizheng Hou Han Chen Zining Zhang Pingyi Luo Bingsheng He 133 1 0 22 Mar 2025
Towards Transformer-Based Aligned Generation with Self-Coherence Guidance Shulei Wang Wang Lin Hai Huang Hanting Wang Sihang Cai ... Tao Jin Jingyuan Chen Jiacheng Sun Jieming Zhu Zhou Zhao DiffM 128 3 0 22 Mar 2025
Progressive Prompt Detailing for Improved Alignment in Text-to-Image Generative Models Ketan Suhaas Saichandran Xavier Thomas Prakhar Kaushik Deepti Ghadiyaram DiffM 153 1 0 22 Mar 2025
CODA: Repurposing Continuous VAEs for Discrete Tokenization Zeyu Liu Zanlin Ni Yeguo Hua Xin Deng Xiao Ma Cheng Zhong Gao Huang 80 0 0 22 Mar 2025
ExCap3D: Expressive 3D Scene Understanding via Object Captioning with Varying Detail Chandan Yeshwanth Dávid Rozenberszki Angela Dai 145 0 0 21 Mar 2025
TRACE: Time SeRies PArameter EffiCient FinE-tuning Yuze Li Wei Zhu AI4TS 251 1 0 21 Mar 2025
Zero-Shot Styled Text Image Generation, but Make It Autoregressive Vittorio Pippi Fabio Quattrini S. Cascianelli Alessio Tonioni Rita Cucchiara 81 1 0 21 Mar 2025
Large Language Model Compression via the Nested Activation-Aware Decomposition Jun Lu Tianyi Xu Bill Ding David Li Yu Kang 75 1 0 21 Mar 2025
VideoRFSplat: Direct Scene-Level Text-to-3D Gaussian Splatting Generation with Flexible Pose and Multi-View Joint Modeling Hyojun Go Byeongjun Park Hyelin Nam Byung-Hoon Kim Hyungjin Chung Changick Kim 3DGS VGen 158 1 0 20 Mar 2025
InfiniteYou: Flexible Photo Recrafting While Preserving Your Identity Liming Jiang Qing Yan Yumin Jia Zichuan Liu Hao Kang Xin Lu 110 4 0 20 Mar 2025