v1v2v3v4 (latest)

Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer

23 October 2019

Sharan Narang

Papers citing "Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer"

50 / 9,866 papers shown

Title
Exact Learning Dynamics of In-Context Learning in Linear Transformers and Its Application to Non-Linear Transformers Nischal Mainali Lucas Teixeira 55 0 0 17 Apr 2025
ChartQA-X: Generating Explanations for Charts Shamanthak Hegde Pooyan Fazli H. Seifi 107 0 0 17 Apr 2025
Towards Explainable Fusion and Balanced Learning in Multimodal Sentiment Analysis Miaosen Luo Yuncheng Jiang Sijie Mai 90 0 0 16 Apr 2025
Can Pre-training Indicators Reliably Predict Fine-tuning Outcomes of LLMs? Hansi Zeng Kai Hui Honglei Zhuang Zhen Qin Zhenrui Yue Hamed Zamani Dana Alon 61 0 0 16 Apr 2025
Multilingual Contextualization of Large Language Models for Document-Level Machine Translation Miguel Moura Ramos Patrick Fernandes Sweta Agrawal André F.T. Martins 93 0 0 16 Apr 2025
Entropy-Guided Watermarking for LLMs: A Test-Time Framework for Robust and Traceable Text Generation Shizhan Cai Liang Ding Dacheng Tao WaLM 91 0 0 16 Apr 2025
A Scoping Review of Natural Language Processing in Addressing Medically Inaccurate Information: Errors, Misinformation, and Hallucination Zhaoyi Sun Wen-wai Yim Özlem Uzuner Fei Xia Meliha Yetisgen 85 0 0 16 Apr 2025
You Don't Need All Attentions: Distributed Dynamic Fine-Tuning for Foundation Models Shiwei Ding Lan Zhang Zhenlin Wang Giuseppe Ateniese Xiaoyong Yuan 68 0 0 16 Apr 2025
Rethinking LLM-Based Recommendations: A Query Generation-Based, Training-Free Approach Donghee Han Hwanjun Song Mun Yi LRM 94 0 0 16 Apr 2025
CSPLADE: Learned Sparse Retrieval with Causal Language Models Zhichao Xu Aosong Feng Yijun Tian Haibo Ding Lin Leee Cheong RALM 101 0 0 15 Apr 2025
Exploring Backdoor Attack and Defense for LLM-empowered Recommendations Liangbo Ning Wenqi Fan Qing Li AAML SILM 113 0 0 15 Apr 2025
SimpleAR: Pushing the Frontier of Autoregressive Visual Generation through Pretraining, SFT, and RL Junke Wang Zhi Tian Xinyu Wang Xinyu Zhang Weilin Huang Zuxuan Wu Yu Jiang VGen 162 17 0 15 Apr 2025
Looking beyond the next token Abitha Thankaraj Yiding Jiang J. Zico Kolter Yonatan Bisk LRM 128 1 0 15 Apr 2025
DeepMLF: Multimodal language model with learnable tokens for deep fusion in sentiment analysis Efthymios Georgiou Vassilis Katsouros Yannis Avrithis Alexandros Potamianos 98 1 0 15 Apr 2025
70% Size, 100% Accuracy: Lossless LLM Compression for Efficient GPU Inference via Dynamic-Length Float Tianyi Zhang Yang Sui Shaochen Zhong Vipin Chaudhary Helen Zhou Anshumali Shrivastava MQ 80 2 0 15 Apr 2025
E2E Parking Dataset: An Open Benchmark for End-to-End Autonomous Parking Kejia Gao Liguo Zhou Mingjun Liu Alois C. Knoll 66 0 0 15 Apr 2025
DataDecide: How to Predict Best Pretraining Data with Small Experiments Ian H. Magnusson Nguyen Tai Ben Bogin David Heineman Jena D. Hwang ... Dirk Groeneveld Oyvind Tafjord Noah A. Smith Pang Wei Koh Jesse Dodge ALM 81 3 0 15 Apr 2025
Augmented Relevance Datasets with Fine-Tuned Small LLMs Quentin Fitte-Rey Matyas Amrouche Romain Deveaud 67 0 0 14 Apr 2025
Summarization of Multimodal Presentations with Vision-Language Models: Study of the Effect of Modalities and Structure Théo Gigant Camille Guinaudeau Frédéric Dufaux 94 0 0 14 Apr 2025
CROSSAN: Towards Efficient and Effective Adaptation of Multiple Multimodal Foundation Models for Sequential Recommendation Junchen Fu Yongxin Ni J. Jose Ioannis Arapakis Kaiwen Zheng You Li Xuri Ge 74 0 0 14 Apr 2025
Anchor Token Matching: Implicit Structure Locking for Training-free AR Image Editing Taihang Hu Linxuan Li Kai Wang Yaxing Wang Jian Yang Ming-Ming Cheng DiffM VGen 95 0 0 14 Apr 2025
Mavors: Multi-granularity Video Representation for Multimodal Large Language Model Yang Shi Jiaheng Liu Yushuo Guan Zhikai Wu Yize Zhang ... Bohan Zeng Wei Zhang Fuzheng Zhang Wenjing Yang Di Zhang VGen VLM 136 2 0 14 Apr 2025
Unchecked and Overlooked: Addressing the Checkbox Blind Spot in Large Language Models with CheckboxQA M. Turski Mateusz Chiliński Łukasz Borchmann 64 0 0 14 Apr 2025
DioR: Adaptive Cognitive Detection and Contextual Retrieval Optimization for Dynamic Retrieval-Augmented Generation Hanghui Guo Jia Zhu Shimin Di Weijie Shi Zhangze Chen Jiajie Xu 113 0 0 14 Apr 2025
VDocRAG: Retrieval-Augmented Generation over Visually-Rich Documents Ryota Tanaka Taichi Iki Taku Hasegawa Kyosuke Nishida Kuniko Saito Jun Suzuki VLM 116 6 0 14 Apr 2025
Enhancing Ultra-Low-Bit Quantization of Large Language Models Through Saliency-Aware Partial Retraining Deyu Cao Samin Aref MQ 84 0 0 14 Apr 2025
CLEAR-KGQA: Clarification-Enhanced Ambiguity Resolution for Knowledge Graph Question Answering Liqiang Wen Guanming Xiong Tong Mo Bing Li Weiping Li Wen Zhao 65 1 0 13 Apr 2025
CheatAgent: Attacking LLM-Empowered Recommender Systems via LLM Agent Liang-bo Ning Shijie Wang Wenqi Fan Qing Li Xin Xu Hao Chen Feiran Huang AAML 109 21 0 13 Apr 2025
Vision-Language Model for Object Detection and Segmentation: A Review and Evaluation Yongchao Feng Yajie Liu Shuai Yang Wenrui Cai Jing Zhang ... Jiahui Lv Ziqiang Liu Tengyuan Shi Qingjie Liu Yansen Wang MLLM VLM 121 2 0 13 Apr 2025
Iterative Self-Training for Code Generation via Reinforced Re-Ranking Nikita Sorokin I. Sedykh Valentin Malykh 37 1 0 13 Apr 2025
Slow Thinking for Sequential Recommendation Junjie Zhang Beichen Zhang Wenqi Sun Hongyu Lu Wayne Xin Zhao Yu Chen Ji-Rong Wen OffRL LRM 105 1 0 13 Apr 2025
Quantization Error Propagation: Revisiting Layer-Wise Post-Training Quantization Yamato Arai Yuma Ichikawa MQ 107 0 0 13 Apr 2025
KeyVID: Keyframe-Aware Video Diffusion for Audio-Synchronized Visual Animation Xingrui Wang Jiang-Long Liu Ziyi Wang Xiaodong Yu Jialian Wu Xingwu Sun Yusheng Su Alan Yuille Zicheng Liu Emad Barsoum DiffM VGen 72 0 0 13 Apr 2025
D $^2$ iT: Dynamic Diffusion Transformer for Accurate Image Generation Weinan Jia Mengqi Huang Nan Chen Lei Zhang Zhendong Mao 88 0 0 13 Apr 2025
Span-level Emotion-Cause-Category Triplet Extraction with Instruction Tuning LLMs and Data Augmentation Xuelong Li Dong Yang Xiaogang Zhu Faliang Huang Peng Zhang Zhongying Zhao 79 0 0 13 Apr 2025
Evaluation Under Imperfect Benchmarks and Ratings: A Case Study in Text Simplification Joseph Liu Yoonsoo Nam Xinyue Cui Swabha Swayamdipta 123 0 0 13 Apr 2025
ZipIR: Latent Pyramid Diffusion Transformer for High-Resolution Image Restoration Yongsheng Yu Haitian Zheng Zhifei Zhang Jianming Zhang Yuqian Zhou Connelly Barnes Yixiao Liu Wei Xiong Zhe Lin Jiebo Luo 132 0 0 11 Apr 2025
AGENT: An Aerial Vehicle Generation and Design Tool Using Large Language Models Colin Samplawski Adam Cobb Susmit Jha LLMAG AI4CE 110 0 0 11 Apr 2025
Knowledge Graph-extended Retrieval Augmented Generation for Question Answering Jasper Linders Jakub M. Tomczak RALM 88 2 0 11 Apr 2025
DRAFT-ing Architectural Design Decisions using LLMs Rudra Dhar Adyansh Kakran Amey Karan Karthik Vaidhyanathan Vasudeva Varma 92 0 0 11 Apr 2025
VLMT: Vision-Language Multimodal Transformer for Multimodal Multi-hop Question Answering Qi Zhi Lim C. Lee K. Lim Kalaiarasi Sonai Muthu Anbananthen 75 0 0 11 Apr 2025
Position: Beyond Euclidean -- Foundation Models Should Embrace Non-Euclidean Geometries Neil He Jiahong Liu Buze Zhang N. Bui Ali Maatouk Menglin Yang Irwin King Melanie Weber Rex Ying 79 1 0 11 Apr 2025
Task-Circuit Quantization: Leveraging Knowledge Localization and Interpretability for Compression Hanqi Xiao Yi-Lin Sung Elias Stengel-Eskin Joey Tianyi Zhou MQ 104 0 0 10 Apr 2025
Between Linear and Sinusoidal: Rethinking the Time Encoder in Dynamic Graph Learning Hsing-Huan Chung Shravan Chaudhari Xing Han Yoav Wald Suchi Saria Joydeep Ghosh AI4TS 76 0 0 10 Apr 2025
The KL3M Data Project: Copyright-Clean Training Resources for Large Language Models Michael J Bommarito II Jillian Bommarito Daniel Martin Katz AILaw 126 1 0 10 Apr 2025
Deep Learning-based Intrusion Detection Systems: A Survey Zhiwei Xu Yujuan Wu Shiheng Wang Jiabao Gao Tian Qiu Ziqi Wang Hai Wan Xibin Zhao 65 3 0 10 Apr 2025
Extending Visual Dynamics for Video-to-Music Generation Xiaohao Liu Teng Tu Yunshan Ma Tat-Seng Chua VGen 111 0 0 10 Apr 2025
Efficient Tuning of Large Language Models for Knowledge-Grounded Dialogue Generation Bo Zhang Hui Ma Dailin Li Jian Ding Jian Wang Bo Xu Hongfei Lin KELM 97 0 0 10 Apr 2025
How to Detect and Defeat Molecular Mirage: A Metric-Driven Benchmark for Hallucination in LLM-based Molecular Comprehension Hao Li Liuzhenghao Lv He Cao Zijing Liu Zhiyuan Yan Yu Wang Yonghong Tian Yuezun Li Li Yuan 142 2 0 10 Apr 2025
Findings of the BabyLM Challenge: Sample-Efficient Pretraining on Developmentally Plausible Corpora Alex Warstadt Aaron Mueller Leshem Choshen E. Wilcox Chengxu Zhuang ... Rafael Mosquera Bhargavi Paranjape Adina Williams Tal Linzen Ryan Cotterell 200 121 0 10 Apr 2025