Papers citing "Language Models are Few-Shot Learners"

50 / 1,609 papers shown

Title
State-space models are accurate and efficient neural operators for dynamical systems Zheyuan Hu Nazanin Ahmadi Daryakenari Qianli Shen Kenji Kawaguchi George Karniadakis Mamba AI4CE 194 17 0 28 Jan 2025
Mix-of-Granularity: Optimize the Chunking Granularity for Retrieval-Augmented Generation Zijie Zhong Hanwen Liu Xiaoya Cui Xiaofan Zhang Zengchang Qin 133 8 0 28 Jan 2025
Zero-Shot Decision Tree Construction via Large Language Models Lucas Carrasco Felipe Urrutia Andrés Abeliuk 170 0 0 28 Jan 2025
NiSNN-A: Non-iterative Spiking Neural Networks with Attention with Application to Motor Imagery EEG Classification Chuhan Zhang Wei Pan Cosimo Della Santina 73 1 0 28 Jan 2025
Uncovering Latent Arguments in Social Media Messaging by Employing LLMs-in-the-Loop Strategy Tunazzina Islam Dan Goldwasser 171 3 0 28 Jan 2025
Benchmarking and Defending Against Indirect Prompt Injection Attacks on Large Language Models Jingwei Yi Yueqi Xie Bin Zhu Emre Kiciman Guangzhong Sun Xing Xie Fangzhao Wu AAML 124 79 0 28 Jan 2025
BIOSCAN-5M: A Multimodal Dataset for Insect Biodiversity Zahra Gharaee Scott C. Lowe ZeMing Gong Pablo Millán Arias Nicholas Pellegrino ... Lila Kari Dirk Steinke Graham W. Taylor Paul Fieguth Angel X. Chang 101 10 0 28 Jan 2025
Knowledge-Infused Prompting: Assessing and Advancing Clinical Text Data Generation with Large Language Models Ran Xu Hejie Cui Yue Yu Xuan Kan Wenqi Shi Yuchen Zhuang Wei Jin Joyce C. Ho Carl Yang 147 16 0 28 Jan 2025
Hardware-Aware DNN Compression for Homogeneous Edge Devices Kunlong Zhang Guiying Li Ning Lu Peng Yang K. Tang 112 0 0 28 Jan 2025
Irony Detection, Reasoning and Understanding in Zero-shot Learning Peiling Yi Yuhan Xia Yunfei Long 105 0 0 28 Jan 2025
SFT Memorizes, RL Generalizes: A Comparative Study of Foundation Model Post-training Tianzhe Chu Yuexiang Zhai Jihan Yang Shengbang Tong Saining Xie Dale Schuurmans Quoc V. Le Sergey Levine Yi-An Ma OffRL 222 106 0 28 Jan 2025
From Critique to Clarity: A Pathway to Faithful and Personalized Code Explanations with Large Language Models Zexing Xu Zhuang Luo Yichuan Li Kyumin Lee S. Rasoul Etesami 92 1 0 28 Jan 2025
GUIDE: A Global Unified Inference Engine for Deploying Large Language Models in Heterogeneous Environments Yanyu Chen Ganhong Huang 135 0 0 28 Jan 2025
A Survey of Large Language Models for Healthcare: from Data, Technology, and Applications to Accountability and Ethics Kai He Rui Mao Qika Lin Yucheng Ruan Xiang Lan Mengling Feng Min Zhang LM&MA AILaw 209 173 0 28 Jan 2025
Weight-based Analysis of Detokenization in Language Models: Understanding the First Stage of Inference Without Inference Go Kamoda Benjamin Heinzerling Tatsuro Inaba Keito Kudo Keisuke Sakaguchi Kentaro Inui MILM 91 3 0 27 Jan 2025
Improving Network Threat Detection by Knowledge Graph, Large Language Model, and Imbalanced Learning Lili Zhang Quanyan Zhu Herman Ray Ying Xie 69 0 0 26 Jan 2025
Recognize Any Surgical Object: Unleashing the Power of Weakly-Supervised Data Jiajie Li Brian R Quaranto Chenhui Xu Ishan Mishra Ruiyang Qin Dancheng Liu Peter C W Kim Jinjun Xiong 145 0 0 25 Jan 2025
Option-ID Based Elimination For Multiple Choice Questions Zhenhao Zhu Bulou Liu Qingyao Ai Yang Liu 93 0 0 25 Jan 2025
Understanding and Mitigating Gender Bias in LLMs via Interpretable Neuron Editing Zeping Yu Sophia Ananiadou KELM 95 3 0 24 Jan 2025
ZETA: Leveraging Z-order Curves for Efficient Top-k Attention Qiuhao Zeng Jerry Huang Peng Lu Gezheng Xu Boxing Chen Charles Ling Boyu Wang 152 3 0 24 Jan 2025
LLM-guided Instance-level Image Manipulation with Diffusion U-Net Cross-Attention Maps Andrey Palaev Adil Mehmood Khan S. M. Ahsan Kazmi DiffM 110 0 0 23 Jan 2025
Parameter-Efficient Fine-Tuning for Foundation Models Dan Zhang Tao Feng Lilong Xue Yuandong Wang Yuxiao Dong J. Tang 195 11 0 23 Jan 2025
Comprehensive Modeling and Question Answering of Cancer Clinical Practice Guidelines using LLMs Bhumika Gupta Pralaypati Ta Keerthi Ram M. Sivaprakasam AI4MH 82 0 0 23 Jan 2025
AgentRec: Agent Recommendation Using Sentence Embeddings Aligned to Human Feedback Joshua Park Yongfeng Zhang LLMAG LM&Ro 147 2 0 23 Jan 2025
FlanEC: Exploring Flan-T5 for Post-ASR Error Correction Moreno La Quatra Valerio Mario Salerno Yu Tsao Sabato Marco Siniscalchi 157 2 0 22 Jan 2025
TabularARGN: A Flexible and Efficient Auto-Regressive Framework for Generating High-Fidelity Synthetic Data P. Tiwald Ivona Krchova Andrey Sidorenko Mariana Vargas-Vieyra Mario Scriminaci Michael Platzer 111 3 0 21 Jan 2025
Human-like conceptual representations emerge from language prediction Ningyu Xu Qi Zhang Chao Du Qiang Luo Xipeng Qiu Xuanjing Huang Menghan Zhang 131 0 0 21 Jan 2025
TAD-Bench: A Comprehensive Benchmark for Embedding-Based Text Anomaly Detection Yang Cao Sikun Yang Chen Li Haolong Xiang Lianyong Qi Bo Liu Rongsheng Li Ming Liu 106 0 0 21 Jan 2025
A generalizable 3D framework and model for self-supervised learning in medical imaging Tony Xu Sepehr Hosseini Chris Anderson Anthony Rinaldi Rahul G. Krishnan Anne L. Martel Maged Goubran MedIm 120 3 0 20 Jan 2025
Episodic memory in AI agents poses risks that should be studied and mitigated Chad DeChant 120 3 0 20 Jan 2025
RELIEF: Reinforcement Learning Empowered Graph Feature Prompt Tuning Jiapeng Zhu Zichen Ding Jianxiang Yu Jiaqi Tan Xiang Li Weining Qian OffRL 202 4 0 20 Jan 2025
Can AI-Generated Text be Reliably Detected? Vinu Sankar Sadasivan Aounon Kumar S. Balasubramanian Wenxiao Wang Soheil Feizi DeLMO 220 389 0 20 Jan 2025
Aligning with Human Judgement: The Role of Pairwise Preference in Large Language Model Evaluators Yinhong Liu Han Zhou Zhijiang Guo Ehsan Shareghi Ivan Vulić Anna Korhonen Nigel Collier ALM 171 79 0 20 Jan 2025
NL2KQL: From Natural Language to Kusto Query Amir H. Abdi Xinye Tang Jeremias Eichelbaum Mahan Das Alex Klein ... William Blum Daniel L Mace Tanvi Raja Namrata Padmanabhan Ye Xing 132 2 0 20 Jan 2025
TutorLLM: Customizing Learning Recommendations with Knowledge Tracing and Retrieval-Augmented Generation Zhaoxing Li V. Yazdanpanah Jindi Wang Wen Gu Lei Shi Alexandra I. Cristea Sarah Kiden Sebastian Stein AI4Ed RALM 86 1 0 20 Jan 2025
Explain-Query-Test: Self-Evaluating LLMs Via Explanation and Comprehension Discrepancy Saeid Asgari Taghanaki Joao Monteiro ELM LRM 95 2 0 20 Jan 2025
Assessing and Enhancing the Robustness of Large Language Models with Task Structure Variations for Logical Reasoning Qiming Bao Gaël Gendron A. Peng Wanjun Zhong N. Tan Yang Chen Michael Witbrock Qingbin Liu LRM ELM 109 4 0 20 Jan 2025
Consistent estimation of generative model representations in the data kernel perspective space Aranyak Acharyya M. Trosset Carey E. Priebe Hayden Helm DiffM 154 3 0 20 Jan 2025
Exploring Iterative Enhancement for Improving Learnersourced Multiple-Choice Question Explanations with Large Language Models Qiming Bao Juho Leinonen A. Peng Wanjun Zhong Gaël Gendron Tim Pistotti Alice Huang Paul Denny Michael Witbrock Jing Liu AI4Ed LRM 231 1 0 20 Jan 2025
Joint Automatic Speech Recognition And Structure Learning For Better Speech Understanding Jiaxi Hu Zuchao Li Mengjia Shen Haojun Ai Sheng Li Jun Zhang 78 0 0 20 Jan 2025
Elucidating the Design Space of Dataset Condensation Shitong Shao Zikai Zhou Huanran Chen Zhiqiang Shen DD 122 9 0 20 Jan 2025
Geometric Median (GM) Matching for Robust Data Pruning Anish Acharya Inderjit S Dhillon Sujay Sanghavi AAML 115 0 0 20 Jan 2025
A Collection of Question Answering Datasets for Norwegian Vladislav Mikhailov Petter Mæhlum Victoria Ovedie Chruickshank Langø Erik Velldal Lilja Øvrelid RALM 65 4 0 19 Jan 2025
Enhancing Semantic Consistency of Large Language Models through Model Editing: An Interpretability-Oriented Approach J. Yang Dapeng Chen Yajing Sun Rongjun Li Zhiyong Feng Wei Peng 100 7 0 19 Jan 2025
From Arabic Text to Puzzles: LLM-Driven Development of Arabic Educational Crosswords Kamyar Zeinalipour M. Saad Marco Maggini Marco Gori 73 2 0 19 Jan 2025
Advancing General Multimodal Capability of Vision-language Models with Pyramid-descent Visual Position Encoding Ziyang Chen Mingxiao Li Zhongfu Chen Nan Du Xiaolong Li Yuexian Zou 108 1 0 19 Jan 2025
ML-SceGen: A Multi-level Scenario Generation Framework Yicheng Xiao Yangyang Sun Yicheng Lin LLMAG 76 0 0 18 Jan 2025
Harnessing the Potential of Large Language Models in Modern Marketing Management: Applications, Future Directions, and Strategic Recommendations Raha Aghaei Ali A. Kiaei Mahnaz Boush Javad Vahidi Mohammad Zavvar Zeynab Barzegar Mahan Rofoosheh OffRL 90 1 0 18 Jan 2025
CrisisSense-LLM: Instruction Fine-Tuned Large Language Model for Multi-label Social Media Text Classification in Disaster Informatics Kai Yin Chengkai Liu Ali Mostafavi Xia Hu 100 12 0 17 Jan 2025
A Comprehensive Survey of Foundation Models in Medicine Wasif Khan Seowung Leem Kyle B. See Joshua K. Wong Shaoting Zhang R. Fang AI4CE LM&MA VLM 274 26 0 17 Jan 2025