Papers citing "Language Models are Few-Shot Learners"

50 / 1,609 papers shown

Title
3DMolFormer: A Dual-channel Framework for Structure-based Drug Discovery Xiuyuan Hu Guoqing Liu Can Chen Yang Zhao Jun Wang Xue Liu 99 2 0 07 Feb 2025
Fine-Tuned LLMs are "Time Capsules" for Tracking Societal Bias Through Books Sangmitra Madhusudan Robert D Morabito Skye Reid Nikta Gohari Sadr Ali Emami 126 1 0 07 Feb 2025
Importance Sampling via Score-based Generative Models Heasung Kim Taekyun Lee Hyeji Kim Gustavo de Veciana MedIm DiffM 178 2 0 07 Feb 2025
Interpretable Failure Detection with Human-Level Concepts Kien X. Nguyen Tang Li Xi Peng 113 1 0 07 Feb 2025
Aligning Black-box Language Models with Human Judgments Gerrit J. J. van den Burg Gen Suzuki Wei Liu Murat Sensoy ALM 113 0 0 07 Feb 2025
Can Large Language Models Understand Intermediate Representations in Compilers? Hailong Jiang Jianfeng Zhu Yao Wan B. Fang Hongyu Zhang Ruoming Jin Qiang Guan 103 1 0 07 Feb 2025
VTutor: An Open-Source SDK for Generative AI-Powered Animated Pedagogical Agents with Multi-Media Output Eason Chen Chengyu Lin Xinyi Tang Aprille J. Xi Canwen Wang Jionghao Lin Kenneth R. Koedinger 142 1 0 06 Feb 2025
Decoder-Only LLMs are Better Controllers for Diffusion Models Ziyi Dong Yao Xiao Pengxu Wei Liang Lin DiffM 202 0 0 06 Feb 2025
Beyond Prompt Content: Enhancing LLM Performance via Content-Format Integrated Prompt Optimization Yuanye Liu Jiahang Xu Li Zhang Qi Chen Xuan Feng Yang Chen Zhongxin Guo Yuqing Yang Peng Cheng 140 2 0 06 Feb 2025
LoCA: Location-Aware Cosine Adaptation for Parameter-Efficient Fine-Tuning Zhekai Du Yinjie Min Jingjing Li Ke Lu Changliang Zou Liuhua Peng Tingjin Chu Mingming Gong 409 1 0 05 Feb 2025
IAO Prompting: Making Knowledge Flow Explicit in LLMs through Structured Reasoning Templates Aissatou Diallo Antonis Bikakis Luke Dickens Anthony Hunter Rob Miller LRM 85 0 0 05 Feb 2025
Anticipate & Act : Integrating LLMs and Classical Planning for Efficient Task Execution in Household Environments Raghav Arora Shivam Singh Karthik Swaminathan Ahana Datta Snehasis Banerjee Brojeshwar Bhowmick Krishna Murthy Jatavallabhula Mohan Sridharan M. Krishna LLMAG 99 11 0 04 Feb 2025
Can LLMs Maintain Fundamental Abilities under KV Cache Compression? Xiang Liu Zhenheng Tang Hong Chen Peijie Dong Zeyu Li Xiuze Zhou Bo Li Xuming Hu Xiaowen Chu 435 6 0 04 Feb 2025
Conversation AI Dialog for Medicare powered by Finetuning and Retrieval Augmented Generation Atharva Mangeshkumar Agrawal Rutika Pandurang Shinde Vasanth Kumar Bhukya Ashmita Chakraborty Sagar Bharat Shah Tanmay Shukla Sree Pradeep Kumar Relangi Nilesh Mutyam LM&MA AI4MH 114 0 0 04 Feb 2025
OverThink: Slowdown Attacks on Reasoning LLMs A. Kumar Jaechul Roh A. Naseh Marzena Karpinska Mohit Iyyer Amir Houmansadr Eugene Bagdasarian LRM 126 20 0 04 Feb 2025
Generalization Error Analysis for Selective State-Space Models Through the Lens of Attention Arya Honarpisheh Mustafa Bozdag Octavia Camps Mario Sznaier Mamba 137 1 0 03 Feb 2025
MergeME: Model Merging Techniques for Homogeneous and Heterogeneous MoEs Yuhang Zhou Giannis Karamanolakis Victor Soto Anna Rumshisky Mayank Kulkarni Furong Huang Wei Ai Jianhua Lu MoMe 167 2 0 03 Feb 2025
The Jumping Reasoning Curve? Tracking the Evolution of Reasoning Performance in GPT-[n] and o-[n] Models on Multimodal Puzzles Vernon Y.H. Toh Yew Ken Chia Deepanway Ghosal Soujanya Poria LRM ReLM ELM 111 1 0 03 Feb 2025
SecPE: Secure Prompt Ensembling for Private and Robust Large Language Models Jiawen Zhang Kejia Chen Zunlei Feng Jian Lou Mingli Song Qingbin Liu Xiaoyu Yang AAML SILM FedML 118 1 0 02 Feb 2025
LoR-VP: Low-Rank Visual Prompting for Efficient Vision Model Adaptation Can Jin Ying Li Mingyu Zhao Shiyu Zhao Zhenting Wang Xiaoxiao He Ligong Han Tong Che Dimitris N. Metaxas VPVLM VLM 283 2 0 02 Feb 2025
Vision-centric Token Compression in Large Language Model Ling Xing Alex Jinpeng Wang Rui Yan Xiangbo Shu Jinhui Tang VLM 117 0 0 02 Feb 2025
Evaluating Small Language Models for News Summarization: Implications and Factors Influencing Performance Borui Xu Yao Chen Zeyi Wen Weiguo Liu Bingsheng He 153 2 0 02 Feb 2025
RankFlow: A Multi-Role Collaborative Reranking Workflow Utilizing Large Language Models Can Jin Hongwu Peng Anxiang Zhang Nuo Chen Jiahui Zhao ... Keqin Li Shuya Feng Kai Zhong Caiwen Ding Dimitris N. Metaxas 194 2 0 02 Feb 2025
Beyond the Permutation Symmetry of Transformers: The Role of Rotation for Model Fusion Binchi Zhang Zaiyi Zheng Zhengzhang Chen Wenlin Yao 189 1 0 01 Feb 2025
Learning from Suboptimal Data in Continuous Control via Auto-Regressive Soft Q-Network Jijia Liu Feng Gao Q. Liao Chao Yu Yu Wang OffRL 132 0 0 01 Feb 2025
LLM Program Optimization via Retrieval Augmented Search Sagnik Anupam Alexander Shypula Osbert Bastani 195 1 0 31 Jan 2025
Memory-Efficient Fine-Tuning of Transformers via Token Selection Antoine Simoulin Namyong Park Xiaoyi Liu Grey Yang 188 0 0 31 Jan 2025
PixelWorld: Towards Perceiving Everything as Pixels Zhiheng Lyu Xueguang Ma Wenhu Chen 198 1 0 31 Jan 2025
Adversarial Attacks on AI-Generated Text Detection Models: A Token Probability-Based Approach Using Embeddings Ahmed K. Kadhim Lei Jiao Rishad Shafik Ole-Christoffer Granmo DeLMO 154 1 0 31 Jan 2025
Inkspire: Supporting Design Exploration with Generative AI through Analogical Sketching David Chuan-En Lin Hyeonsu B Kang Nikolas Martelaro A. Kittur Yan-Ying Chen Matthew K. Hong 152 3 0 30 Jan 2025
Learning Priors of Human Motion With Vision Transformers Placido Falqueto Alberto Sanfeliu Luigi Palopoli Daniele Fontanelli ViT 230 0 0 30 Jan 2025
Hashtag Re-Appropriation for Audience Control on Recommendation-Driven Social Media Xiaohongshu (rednote) Ruyuan Wan Lingbo Tong Tiffany Knearem Toby Jia-Jun Li Ting-Hao 'Kenneth' Huang Qunfang Wu 43 0 0 30 Jan 2025
Diverse Preference Optimization Jack Lanchantin Angelica Chen Shehzaad Dhuliawala Ping Yu Jason Weston Sainbayar Sukhbaatar Ilia Kulikov 196 4 0 30 Jan 2025
Can Generative LLMs Create Query Variants for Test Collections? An Exploratory Study Marwah Alaofi Luke Gallagher Mark Sanderson Falk Scholer Paul Thomas 79 36 0 29 Jan 2025
Fake News Detection After LLM Laundering: Measurement and Explanation Rupak Kumar Das Jonathan Dodge 160 1 0 29 Jan 2025
A linguistically-motivated evaluation methodology for unraveling model's abilities in reading comprehension tasks Elie Antoine Frédéric Béchet Géraldine Damnati Philippe Langlais 132 1 0 29 Jan 2025
Towards Making Flowchart Images Machine Interpretable Shivalika Singh Prajwal Gatti Yogesh Kumar Vikash Yadav Anand Mishra 75 6 0 29 Jan 2025
Mamba-Shedder: Post-Transformer Compression for Efficient Selective Structured State Space Models J. P. Muñoz Jinjie Yuan Nilesh Jain Mamba 123 1 0 28 Jan 2025
Benchmarking and Defending Against Indirect Prompt Injection Attacks on Large Language Models Jingwei Yi Yueqi Xie Bin Zhu Emre Kiciman Guangzhong Sun Xing Xie Fangzhao Wu AAML 124 79 0 28 Jan 2025
MedPromptX: Grounded Multimodal Prompting for Chest X-ray Diagnosis Mai A. Shaaban Adnan Khan Mohammad Yaqub LM&MA 115 2 0 28 Jan 2025
GUIDE: A Global Unified Inference Engine for Deploying Large Language Models in Heterogeneous Environments Yanyu Chen Ganhong Huang 135 0 0 28 Jan 2025
Embedding-Driven Diversity Sampling to Improve Few-Shot Synthetic Data Generation Ivan Lopez Fateme Nateghi Haredasht Kaitlin Caoili Jonathan H. Chen Akshay S. Chaudhari MedIm SyDa 180 0 0 28 Jan 2025
mHumanEval -- A Multilingual Benchmark to Evaluate Large Language Models for Code Generation Nishat Raihan Antonios Anastasopoulos Marcos Zampieri ELM 91 8 0 28 Jan 2025
MADation: Face Morphing Attack Detection with Foundation Models Eduarda Caldeira Guray Ozgur Tahar Chettaoui Marija Ivanovska Peter Peer Fadi Boutros Vitomir Štruc Naser Damer CVBM 81 2 1 28 Jan 2025
SyntheT2C: Generating Synthetic Data for Fine-Tuning Large Language Models on the Text2Cypher Task Ziije Zhong Linqing Zhong Zhaoze Sun Qingyun Jin Zengchang Qin Xiaofan Zhang 98 10 0 28 Jan 2025
BLoB: Bayesian Low-Rank Adaptation by Backpropagation for Large Language Models Yibin Wang Haizhou Shi Ligong Han Dimitris N. Metaxas Hao Wang BDL UQLM 212 10 0 28 Jan 2025
NiSNN-A: Non-iterative Spiking Neural Networks with Attention with Application to Motor Imagery EEG Classification Chuhan Zhang Wei Pan Cosimo Della Santina 73 1 0 28 Jan 2025
On The Truthfulness of 'Surprisingly Likely' Responses of Large Language Models Naman Goel HILM 111 0 0 28 Jan 2025
State-space models are accurate and efficient neural operators for dynamical systems Zheyuan Hu Nazanin Ahmadi Daryakenari Qianli Shen Kenji Kawaguchi George Karniadakis Mamba AI4CE 192 17 0 28 Jan 2025
Mix-of-Granularity: Optimize the Chunking Granularity for Retrieval-Augmented Generation Zijie Zhong Hanwen Liu Xiaoya Cui Xiaofan Zhang Zengchang Qin 133 8 0 28 Jan 2025