v1v2v3v4 (latest)

Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer

23 October 2019

Sharan Narang

Papers citing "Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer"

50 / 9,851 papers shown

Title
Large Language Models Meet Stance Detection: A Survey of Tasks, Methods, Applications, Challenges and Future Directions Lata Pangtey Anukriti Bhatnagar Shubhi Bansal Shahid Shafi Dar Nagendra Kumar 75 0 0 13 May 2025
Controllable Image Colorization with Instance-aware Texts and Masks Yanru An Ling Gui Qiang Hu Chunlei Cai Tianxiao Ye Xiaoyun Zhang Yanfeng Wang DiffM 54 0 0 13 May 2025
ALOHA: Empowering Multilingual Agent for University Orientation with Hierarchical Retrieval Mingxu Tao Bowen Tang Mingxuan Ma Yining Zhang Hourun Li Feifan Wen Hao Ma Jia-Qi Yang 52 0 0 13 May 2025
FLUXSynID: A Framework for Identity-Controlled Synthetic Face Generation with Document and Live Images Raul Ismayilov Dzemila Sero Luuk Spreeuwers 114 0 0 12 May 2025
Circuit Partitioning Using Large Language Models for Quantum Compilation and Simulations Pranav Sinha Sumit Kumar Jha Sunny Raj 41 0 0 12 May 2025
Ophora: A Large-Scale Data-Driven Text-Guided Ophthalmic Surgical Video Generation Model Wei Li Ming Hu Guoan Wang Lihao Liu Kaijin Zhou Junzhi Ning Xin Guo Zongyuan Ge Lixu Gu Junjun He 99 1 0 12 May 2025
Incomplete In-context Learning Wenqiang Wang Yangshijie Zhang 88 0 0 12 May 2025
No Query, No Access Wenjie Wang Siyuan Liang Yize Zhang Xiaojun Jia Hao Lin Xiaochun Cao AAML 105 1 0 12 May 2025
A Comparative Analysis of Static Word Embeddings for Hungarian Máté Gedeon 75 0 0 12 May 2025
Comet: Accelerating Private Inference for Large Language Model by Predicting Activation Sparsity Guang Yan Yuhui Zhang Zimu Guo Lutan Zhao Xiaojun Chen Chen Wang Wenhao Wang Dan Meng Rui Hou 74 0 0 12 May 2025
Overflow Prevention Enhances Long-Context Recurrent LLMs Assaf Ben-Kish Itamar Zimerman M. Jehanzeb Mirza James R. Glass Leonid Karlinsky Raja Giryes LRM 69 0 0 12 May 2025
Synthetic Code Surgery: Repairing Bugs and Vulnerabilities with LLMs and Synthetic Data David de-Fitero-Dominguez Antonio Garcia-Cabot Eva García-López SyDa 110 0 0 12 May 2025
Sandcastles in the Storm: Revisiting the (Im)possibility of Strong Watermarking Fabrice Harel-Canada Boran Erol Connor Choi J. Liu Gary Jiarui Song Nanyun Peng Amit Sahai WaLM 80 0 0 11 May 2025
Towards Artificial General or Personalized Intelligence? A Survey on Foundation Models for Personalized Federated Intelligence Yu Qiao Huy Q. Le Avi Deb Raha Phuong-Nam Tran Apurba Adhikary Mengchun Zhang Loc X. Nguyen Eui-nam Huh Dusit Niyato Choong Seon Hong AI4CE 161 1 0 11 May 2025
IM-BERT: Enhancing Robustness of BERT through the Implicit Euler Method Mihyeon Kim Juhyoung Park Youngbin Kim 212 0 0 11 May 2025
GuidedQuant: Large Language Model Quantization via Exploiting End Loss Guidance Jinuk Kim Marwa El Halabi W. Park Clemens JS Schaefer Deokjae Lee Yeonhong Park Jae W. Lee Hyun Oh Song MQ 144 1 0 11 May 2025
References Indeed Matter? Reference-Free Preference Optimization for Conversational Query Reformulation Doyoung Kim Youngjun Lee Joeun Kim Jihwan Bang Hwanjun Song Susik Yoon Jae-Gil Lee 201 0 0 10 May 2025
OMGM: Orchestrate Multiple Granularities and Modalities for Efficient Multimodal Retrieval Wei Yang Jingjing Fu Rongpin Wang Jinyu Wang Lei Song Jiang Bian 61 1 0 10 May 2025
QoS-Efficient Serving of Multiple Mixture-of-Expert LLMs Using Partial Runtime Reconfiguration HamidReza Imani Jiaxin Peng Peiman Mohseni Abdolah Amirany Tarek A. El-Ghazawi MoE 127 0 0 10 May 2025
LLMs Get Lost In Multi-Turn Conversation Philippe Laban Hiroaki Hayashi Yingbo Zhou Jennifer Neville 112 16 0 09 May 2025
Sparse Attention Remapping with Clustering for Efficient LLM Decoding on PIM Zehao Fan Garrett Gagnon Zhenyu Liu Liu Liu 56 0 0 09 May 2025
FloE: On-the-Fly MoE Inference on Memory-constrained GPU Yuxin Zhou Zheng Li Junxuan Zhang Jue Wang Yanjie Wang Zhongle Xie Ke Chen Lidan Shou MoE 151 0 0 09 May 2025
Towards Developmentally Plausible Rewards: Communicative Success as a Learning Signal for Interactive Language Models Lennart Stöpler Rufat Asadli Mitja Nikolaus Ryan Cotterell Alex Warstadt LRM 80 2 0 09 May 2025
Document Attribution: Examining Citation Relationships using Large Language Models Vipula Rawte Ryan Rossi Franck Dernoncourt Nedim Lipka HILM 73 0 0 09 May 2025
Towards a Unified Representation Evaluation Framework Beyond Downstream Tasks Christos Plachouras Julien Guinot George Fazekas Elio Quinton Emmanouil Benetos Johan Pauwels 436 1 0 09 May 2025
UniVLA: Learning to Act Anywhere with Task-centric Latent Actions Qingwen Bu Yanting Yang Jisong Cai Shenyuan Gao Guanghui Ren Maoqing Yao Ping Luo Hongyang Li 412 10 0 09 May 2025
GroverGPT-2: Simulating Grover's Algorithm via Chain-of-Thought Reasoning and Quantum-Native Tokenization Min Chen Jinglei Cheng Pingzhi Li Haoran Wang Tianlong Chen Junyu Liu LRM 114 0 0 08 May 2025
GlyphMastero: A Glyph Encoder for High-Fidelity Scene Text Editing Tong Wang Ting Liu Xiaochao Qu Chengjing Wu Luoqi Liu Xiaolin Hu DiffM 99 1 0 08 May 2025
Rethinking Invariance in In-context Learning Lizhe Fang Yifei Wang Khashayar Gatmiry Lei Fang Yun Wang 104 6 0 08 May 2025
Frame In, Frame Out: Do LLMs Generate More Biased News Headlines than Humans? Valeria Pastorino N. Moosavi 75 0 0 08 May 2025
Revealing Weaknesses in Text Watermarking Through Self-Information Rewrite Attacks Yixin Cheng Hongcheng Guo Yangming Li Leonid Sigal AAML WaLM 223 1 0 08 May 2025
ViCTr: Vital Consistency Transfer for Pathology Aware Image Synthesis Onkar Susladkar Gayatri Deshmukh Yalcin Tur Gorkhem Durak Ulas Bagci MedIm 246 0 0 08 May 2025
Ultra-FineWeb: Efficient Data Filtering and Verification for High-Quality LLM Training Data Yun Wang Z. Fu Jie Cai Peijun Tang Hongya Lyu ... Jie Zhou Guoyang Zeng Chaojun Xiao Xu Han Zhiyuan Liu 127 1 0 08 May 2025
FedTDP: A Privacy-Preserving and Unified Framework for Trajectory Data Preparation via Federated Learning Zhihao Zeng Ziquan Fang Wei Shao Lu Chen Yunjun Gao FedML 87 0 0 08 May 2025
GASCADE: Grouped Summarization of Adverse Drug Event for Enhanced Cancer Pharmacovigilance Sofia Jamil Aryan Dabad Bollampalli Areen Reddy S. Saha Rajiv Misra Adil A. Shakur 193 0 0 07 May 2025
Natural Language Generation in Healthcare: A Review of Methods and Applications Mengxian Lyu Xiaohan Li Ziyi Chen Jinqian Pan Cheng Peng Sankalp Talankar Yonghui Wu LM&MA 92 0 0 07 May 2025
Red Teaming the Mind of the Machine: A Systematic Evaluation of Prompt Injection and Jailbreak Vulnerabilities in LLMs Chetan Pathade AAML SILM 221 2 0 07 May 2025
Lay-Your-Scene: Natural Scene Layout Generation with Diffusion Transformers Divyansh Srivastava Xiang Zhang He Wen Chenru Wen Zhuowen Tu DiffM 77 0 0 07 May 2025
Text2CT: Towards 3D CT Volume Generation from Free-text Descriptions Using Diffusion Model Pengfei Guo Can Zhao Dong Yang Yufan He V. Nath ... Zongwei Zhou Benjamin D. Simon Stephanie Harmon Baris Turkbey Daguang Xu DiffM MedIm 102 0 0 07 May 2025
Towards Large-scale Generative Ranking Yanhua Huang Yuxiao Chen Xiong Cao Rui Yang Mingliang Qi ... L. Chen Weihang Chen Min Zhu Ruiwen Xu Lei Zhang 127 0 0 07 May 2025
FDA-Opt: Communication-Efficient Federated Fine-Tuning of Language Models Michail Theologitis V. Samoladas Antonios Deligiannakis 145 0 0 07 May 2025
Bringing legal knowledge to the public by constructing a legal question bank using large-scale pre-trained language model Mingruo Yuan Ben Kao Tien-Hsuan Wu Michael M. K. Cheung Henry W. H. Chan Anne S. Y. Cheung Felix W. H. Chan Yongxi Chen AILaw ELM 450 3 0 07 May 2025
In-Context Adaptation to Concept Drift for Learned Database Operations Jiaqi Zhu Shaofeng Cai Yanyan Shen Gang Chen Fang Deng Beng Chin Ooi VLM 200 0 0 07 May 2025
Pangu Ultra MoE: How to Train Your Big MoE on Ascend NPUs Yehui Tang Yichun Yin Yaoyuan Wang Hang Zhou Yu Pan ... Zhe Liu Zhicheng Liu Zhuowen Tu Zilin Ding Zongyuan Zhan MoE 113 2 0 07 May 2025
Benchmarking LLM Faithfulness in RAG with Evolving Leaderboards Manveer Singh Tamber F. S. Bao Chenyu Xu Ge Luo Suleman Kazi Minseok Bae Miaoran Li Ofer Mendelevitch Renyi Qu Jimmy J. Lin VLM 68 1 0 07 May 2025
ALFEE: Adaptive Large Foundation Model for EEG Representation Wei Xiong Junming Lin Jiangtong Li Jie Li Changjun Jiang 110 0 0 07 May 2025
Assessing and Enhancing the Robustness of LLM-based Multi-Agent Systems Through Chaos Engineering Joshua Owotogbe LLMAG 114 0 0 06 May 2025
SonicRAG : High Fidelity Sound Effects Synthesis Based on Retrival Augmented Generation Yu-Ren Guo Wen-Kai Tai 124 0 0 06 May 2025
FLUX-Text: A Simple and Advanced Diffusion Transformer Baseline for Scene Text Editing Rui Lan Y. Bai Xu Duan Mingxing Li Lei Sun Xiaowen Chu DiffM 409 0 0 06 May 2025
Radio: Rate-Distortion Optimization for Large Language Model Compression Sean I. Young MQ 63 0 0 05 May 2025