Papers citing "Language Models are Few-Shot Learners"

50 / 1,609 papers shown

Title
No Need to Talk: Asynchronous Mixture of Language Models Anastasiia Filippova Angelos Katharopoulos David Grangier Ronan Collobert MoE 77 0 0 04 Oct 2024
Geometric Representation Condition Improves Equivariant Molecule Generation Zian Li Cai Zhou Xiyuan Wang Xingang Peng Muhan Zhang 68 2 0 04 Oct 2024
Frame-Voyager: Learning to Query Frames for Video Large Language Models Sicheng Yu Chengkai Jin Huanyu Wang Zhenghao Chen Sheng Jin ... Zhenbang Sun Bingni Zhang Jiawei Wu Hao Zhang Qianru Sun 97 8 0 04 Oct 2024
Autoregressive Action Sequence Learning for Robotic Manipulation Xinyu Zhang Yuhan Liu Haonan Chang Liam Schramm Abdeslam Boularias 103 17 0 04 Oct 2024
CriSPO: Multi-Aspect Critique-Suggestion-guided Automatic Prompt Optimization for Text Generation Han He Qianchu Liu Lei Xu Chaitanya P. Shivade Yi Zhang S. Srinivasan Katrin Kirchhoff 76 1 0 03 Oct 2024
Long-Sequence Recommendation Models Need Decoupled Embeddings Ningya Feng Junwei Pan Jialong Wu Baixu Chen Ximei Wang Qian Li Xian Hu Jie Jiang Mingsheng Long AI4TS 112 3 0 03 Oct 2024
IoT-LLM: Enhancing Real-World IoT Task Reasoning with Large Language Models Tuo An Yunjiao Zhou Han Zou Jianfei Yang LRM 79 9 0 03 Oct 2024
Jailbreak Antidote: Runtime Safety-Utility Balance via Sparse Representation Adjustment in Large Language Models Guobin Shen Dongcheng Zhao Yiting Dong Xiang He Yi Zeng AAML 79 3 0 03 Oct 2024
PFGuard: A Generative Framework with Privacy and Fairness Safeguards Soyeon Kim Yuji Roh Geon Heo Steven Euijong Whang 101 0 0 03 Oct 2024
AlphaEdit: Null-Space Constrained Knowledge Editing for Language Models Sihang Li Houcheng Jiang Kun Wang Yunshan Ma Shi Jie Xiangnan He Tat-Seng Chua Tat-seng Chua KELM 128 66 0 03 Oct 2024
GraphIC: A Graph-Based In-Context Example Retrieval Model for Multi-Step Reasoning Jiale Fu Yaqing Wang Simeng Han Jiaming Fan Chen Si 117 1 0 03 Oct 2024
Loong: Generating Minute-level Long Videos with Autoregressive Language Models Yuqing Wang Tianwei Xiong Daquan Zhou Zhijie Lin Yang Zhao Bingyi Kang Jiashi Feng Xihui Liu VGen 136 34 0 03 Oct 2024
Training Nonlinear Transformers for Chain-of-Thought Inference: A Theoretical Generalization Analysis Hongkang Li Songtao Lu Pin-Yu Chen Xiaodong Cui Meng Wang LRM 55 6 0 03 Oct 2024
The Role of Deductive and Inductive Reasoning in Large Language Models Chengkun Cai Xu Zhao Haoliang Liu Zhongyu Jiang Tianfang Zhang Zongkai Wu Lei Li Lei Li Lei Li LRM 94 4 0 03 Oct 2024
Undesirable Memorization in Large Language Models: A Survey Ali Satvaty Suzan Verberne Fatih Turkmen ELM PILM 175 7 0 03 Oct 2024
Agent-Oriented Planning in Multi-Agent Systems Ao Li Yuexiang Xie Songze Li Fugee Tsung Bolin Ding Yaliang Li AIFin 367 10 0 03 Oct 2024
LMOD: A Large Multimodal Ophthalmology Dataset and Benchmark for Large Vision-Language Models Zhenyue Qin Yu Yin Dylan Campbell Xuansheng Wu Ke Zou Yih-Chung Tham Ninghao Liu Xiuzhen Zhang Qingyu Chen 91 1 0 02 Oct 2024
Transformers Handle Endogeneity in In-Context Linear Regression Haodong Liang Krishnakumar Balasubramanian Lifeng Lai 89 2 0 02 Oct 2024
Selective Aggregation for Low-Rank Adaptation in Federated Learning Pengxin Guo Shuang Zeng Y. Wang Huijie Fan Feifei Wang Liangqiong Qu FedML 103 21 0 02 Oct 2024
Inspection and Control of Self-Generated-Text Recognition Ability in Llama3-8b-Instruct Christopher M. Ackerman Nina Panickssery DeLMO 66 1 0 02 Oct 2024
On Expressive Power of Looped Transformers: Theoretical Analysis and Enhancement via Timestep Encoding Kevin Xu Issei Sato 93 4 0 02 Oct 2024
U-shaped and Inverted-U Scaling behind Emergent Abilities of Large Language Models Tung-Yu Wu Pei-Yu Lo ReLM LRM 107 2 0 02 Oct 2024
Knowledge-Driven Feature Selection and Engineering for Genotype Data with Large Language Models Joseph Lee Shu Yang Jae Young Baik Xiaoxi Liu Zhen Tan ... Zixuan Wen Bojian Hou D. Duong-Tran Tianlong Chen Li Shen 121 2 0 02 Oct 2024
Bridging Context Gaps: Leveraging Coreference Resolution for Long Contextual Understanding Yanming Liu Xinyue Peng Jiannan Cao Shi Bo Yanxin Shen Tianyu Du Sheng Cheng Xun Wang Jianwei Yin Xuhong Zhang 112 9 0 02 Oct 2024
ET-Plan-Bench: Embodied Task-level Planning Benchmark Towards Spatial-Temporal Cognition with Foundation Models Lingfeng Zhang Yuening Wang Hongjian Gu Atia Hamidizadeh Zhanguang Zhang ... Tongtong Cao Yuzheng Zhuang Yingxue Zhang Jianye Hao Jianye Hao LM&Ro 90 2 0 02 Oct 2024
Recent Advances in Speech Language Models: A Survey Wenqian Cui Dianzhi Yu Xiaoqi Jiao Ziqiao Meng Guangyan Zhang Qichao Wang Yiwen Guo Irwin King AuLLM 159 25 0 01 Oct 2024
Semantic Parsing with Candidate Expressions for Knowledge Base Question Answering Daehwan Nam Gary Geunbae Lee 76 0 0 01 Oct 2024
Scaling Offline Model-Based RL via Jointly-Optimized World-Action Model Pretraining Jie Cheng Ruixi Qiao Gang Xiong Binhua Li Yingwei Ma Binhua Li Yongbin Li Yisheng Lv OffRL OnRL LM&Ro 100 4 0 01 Oct 2024
PersonalLLM: Tailoring LLMs to Individual Preferences Thomas P. Zollo Andrew Siah Naimeng Ye Ang Li Hongseok Namkoong 85 13 0 30 Sep 2024
Scaling Optimal LR Across Token Horizons Johan Bjorck Alon Benhaim Vishrav Chaudhary Furu Wei Xia Song 107 7 0 30 Sep 2024
Beyond Single Concept Vector: Modeling Concept Subspace in LLMs with Gaussian Distribution Haiyan Zhao Heng Zhao Bo Shen Ali Payani Fan Yang Mengnan Du 101 5 0 30 Sep 2024
SSR: Alignment-Aware Modality Connector for Speech Language Models Weiting Tan Hirofumi Inaguma Ning Dong Paden Tomasello Xutai Ma 103 6 0 30 Sep 2024
ForecastBench: A Dynamic Benchmark of AI Forecasting Capabilities Ezra Karger Houtan Bastani Chen Yueh-Han Zachary Jacobs Danny Halawi Fred Zhang P. Tetlock 107 9 0 30 Sep 2024
Task-Adaptive Pretrained Language Models via Clustered-Importance Sampling David Grangier Simin Fan Skyler Seto Pierre Ablin 186 5 0 30 Sep 2024
CoTKR: Chain-of-Thought Enhanced Knowledge Rewriting for Complex Knowledge Graph Question Answering Yike Wu Yi Huang Nan Hu Yuncheng Hua Guilin Qi Jiaoyan Chen Jeff Z. Pan 74 9 0 29 Sep 2024
Can Large Language Models Analyze Graphs like Professionals? A Benchmark, Datasets and Models Xin Sky Li Weize Chen Qizhi Chu Haopeng Li Zhaojun Sun ... Yiwei Wei Zhiyuan Liu Chuan Shi Maosong Sun Cheng Yang 87 6 0 29 Sep 2024
Fast and Accurate Task Planning using Neuro-Symbolic Language Models and Multi-level Goal Decomposition Minseo Kwon Yaesol Kim Young J. Kim 80 4 0 28 Sep 2024
Can LLMs Really Learn to Translate a Low-Resource Language from One Grammar Book? Seth Aycock David Stap Di Wu Christof Monz Khalil Simaán 84 8 0 27 Sep 2024
Mitigating Selection Bias with Node Pruning and Auxiliary Options Hyeong Kyu Choi Weijie Xu Chi Xue Stephanie Eckman Chandan K. Reddy 85 2 0 27 Sep 2024
"Oh LLM, I'm Asking Thee, Please Give Me a Decision Tree": Zero-Shot Decision Tree Induction and Embedding with Large Language Models Ricardo Knauer Mario Koddenbrock Raphael Wallsberger Nicholas M. Brisson Georg N. Duda Deborah Falla David W. Evans Erik Rodner 161 0 0 27 Sep 2024
Confidential Prompting: Protecting User Prompts from Cloud LLM Providers In Gim Caihua Li Lin Zhong 93 3 0 27 Sep 2024
Compositional Hardness of Code in Large Language Models -- A Probabilistic Perspective Yotam Wolf Binyamin Rothberg Dorin Shteyman Amnon Shashua 84 0 0 26 Sep 2024
Language Models as Zero-shot Lossless Gradient Compressors: Towards General Neural Parameter Prior Models Hui-Po Wang Mario Fritz 101 4 0 26 Sep 2024
On the Implicit Relation Between Low-Rank Adaptation and Differential Privacy Saber Malekmohammadi G. Farnadi 211 2 0 26 Sep 2024
Code Generation and Algorithmic Problem Solving Using Llama 3.1 405B Aniket Deroy Subhankar Maity 144 5 0 26 Sep 2024
Gradient Boosting Decision Trees on Medical Diagnosis over Tabular Data A. Yarkın Yıldız Asli Kalayci LMTD 95 5 0 25 Sep 2024
E-SQL: Direct Schema Linking via Question Enrichment in Text-to-SQL Hasan Alp Caferoğlu Özgür Ulusoy 91 22 0 25 Sep 2024
EventHallusion: Diagnosing Event Hallucinations in Video LLMs Jiacheng Zhang Yang Jiao Shaoxiang Chen Jingjing Chen Zhiyu Tan Hao Li Jingjing Chen MLLM 93 23 0 25 Sep 2024
TCSinger: Zero-Shot Singing Voice Synthesis with Style Transfer and Multi-Level Style Control Yu Zhang Ziyue Jiang Ruiqi Li Changhao Pan Jinzheng He Rongjie Huang Chuxin Wang Zhou Zhao DiffM VLM 110 8 0 24 Sep 2024
Enhancing Text-to-SQL Capabilities of Large Language Models via Domain Database Knowledge Injection Xingyu Ma Xin Tian Lingxiang Wu Xuepeng Wang Xueming Tang Jinqiao Wang 147 1 0 24 Sep 2024