Title
ClaimVer: Explainable Claim-Level Verification and Evidence Attribution of Text Through Knowledge Graphs Preetam Prabhu Srikar Dammu Himanshu Naidu Mouly Dewan YoungMin Kim Tanya Roosta Aman Chadha Chirag Shah 72 8 0 12 Mar 2024
Characterization of Large Language Model Development in the Datacenter Qi Hu Zhisheng Ye Zerui Wang Guoteng Wang Mengdie Zhang ... Dahua Lin Xiaolin Wang Yingwei Luo Yonggang Wen Tianwei Zhang 96 51 0 12 Mar 2024
MoAI: Mixture of All Intelligence for Large Language and Vision Models Byung-Kwan Lee Beomchan Park Chae Won Kim Yonghyun Ro MLLM VLM 141 23 0 12 Mar 2024
SmallToLarge (S2L): Scalable Data Selection for Fine-tuning Large Language Models by Summarizing Training Trajectories of Small Models Yu Yang Siddhartha Mishra Jeffrey N Chiang Baharan Mirzasoleiman 111 24 0 12 Mar 2024
SPA: Towards A Computational Friendly Cloud-Base and On-Devices Collaboration Seq2seq Personalized Generation Yanming Liu Xinyue Peng Jiannan Cao Le Dai Xingzu Liu Mingbang Wang Weihao Liu SyDa 107 2 0 11 Mar 2024
Improving deep learning with prior knowledge and cognitive models: A survey on enhancing explainability, adversarial robustness and zero-shot learning F. Mumuni A. Mumuni AAML 105 7 0 11 Mar 2024
ERA-CoT: Improving Chain-of-Thought through Entity Relationship Analysis Yanming Liu Xinyue Peng Tianyu Du Jianwei Yin Weihao Liu Xuhong Zhang LRM 87 17 0 11 Mar 2024
FocusCLIP: Multimodal Subject-Level Guidance for Zero-Shot Transfer in Human-Centric Tasks Muhammad Gul Zain Ali Khan Muhammad Ferjad Naeem F. Tombari Luc Van Gool Didier Stricker Muhammad Zeshan Afzal VLM CLIP 106 2 0 11 Mar 2024
RA-ISF: Learning to Answer and Understand from Retrieval Augmentation via Iterative Self-Feedback Yanming Liu Xinyue Peng Xuhong Zhang Weihao Liu Jianwei Yin Jiannan Cao Tianyu Du RALM 71 45 0 11 Mar 2024
ACT-MNMT Auto-Constriction Turning for Multilingual Neural Machine Translation Shaojie Dai Xin Liu Ping Luo Yue Yu LRM 66 1 0 11 Mar 2024
Smart-Infinity: Fast Large Language Model Training using Near-Storage Processing on a Real System Hongsun Jang Jaeyong Song Jaewon Jung Jaeyoung Park Youngsok Kim Jinho Lee 54 16 0 11 Mar 2024
Unsupervised Real-Time Hallucination Detection based on the Internal States of Large Language Models Weihang Su Changyue Wang Qingyao Ai Hu Yiran Zhijing Wu Yujia Zhou Yiqun Liu HILM 139 32 0 11 Mar 2024
Amharic LLaMA and LLaVA: Multimodal LLMs for Low Resource Languages Michael Andersland 33 0 0 11 Mar 2024
PEPSI: Pathology-Enhanced Pulse-Sequence-Invariant Representations for Brain MRI Peirong Liu Oula Puonti Annabel Sorby-Adams W. T. Kimberly Juan Eugenio Iglesias 78 5 0 10 Mar 2024
Mipha: A Comprehensive Overhaul of Multimodal Assistant with Small Language Models Minjie Zhu Yichen Zhu Xin Liu Ning Liu Zhiyuan Xu Yaxin Peng Chaomin Shen Zhicai Ou Feifei Feng Jian Tang VLM 104 22 0 10 Mar 2024
RepoHyper: Better Context Retrieval Is All You Need for Repository-Level Code Completion Huy N. Phan Hoang N. Phan Tien N. Nguyen Nghi D. Q. Bui 87 4 0 10 Mar 2024
Algorithmic progress in language models Anson Ho T. Besiroglu Ege Erdil David Owen Robi Rahman Zifan Carl Guo David Atkinson Neil Thompson J. Sevilla 74 18 0 09 Mar 2024
tsGT: Stochastic Time Series Modeling With Transformer Lukasz Kuciñski Witold Drzewakowski Mateusz Olko Piotr Kozakowski Lukasz Maziarka Marta Emilia Nowakowska Lukasz Kaiser Piotr Milo's 80 1 0 08 Mar 2024
SeeGULL Multilingual: a Dataset of Geo-Culturally Situated Stereotypes Mukul Bhutani Kevin Robinson Vinodkumar Prabhakaran Shachi Dave Sunipa Dev 140 12 0 08 Mar 2024
Concept-aware Data Construction Improves In-context Learning of Language Models Michal Štefánik Marek Kadlcík Petr Sojka 97 1 0 08 Mar 2024
Cost-Performance Optimization for Processing Low-Resource Language Tasks Using Commercial LLMs Arijit Nag Animesh Mukherjee Niloy Ganguly Soumen Chakrabarti 101 4 0 08 Mar 2024
RAT: Retrieval Augmented Thoughts Elicit Context-Aware Reasoning in Long-Horizon Generation Zihao Wang Hoang Trung-Dung Haowei Lin Jiaqi Li Xiaojian Ma Yitao Liang ReLM RALM LRM 171 49 0 08 Mar 2024
Leveraging Continuous Time to Understand Momentum When Training Diagonal Linear Networks Hristo Papazov Scott Pesme Nicolas Flammarion 81 7 0 08 Mar 2024
Debiasing Multimodal Large Language Models Yi-Fan Zhang Weichen Yu Qingsong Wen Xue Wang Zhang Zhang Liang Wang Rong Jin Tien-Ping Tan 102 6 0 08 Mar 2024
Harnessing Multi-Role Capabilities of Large Language Models for Open-Domain Question Answering Hongda Sun Yuxuan Liu Chengwei Wu Haiyu Yan Cheng Tai Xin Gao Shuo Shang Rui Yan 92 11 0 08 Mar 2024
Rule-driven News Captioning Ning Xu Tingting Zhang Hongshuo Tian An-An Liu 117 0 0 08 Mar 2024
SnapNTell: Enhancing Entity-Centric Visual Question Answering with Retrieval Augmented Multimodal LLM Jielin Qiu Andrea Madotto Zhaojiang Lin Paul A. Crook Yongjun Xu Xin Luna Dong Christos Faloutsos Lei Li Babak Damavandi Seungwhan Moon 94 10 0 07 Mar 2024
Teaching Large Language Models to Reason with Reinforcement Learning Alex Havrilla Yuqing Du Sharath Chandra Raparthy Christoforos Nalmpantis Jane Dwivedi-Yu Maksym Zhuravinskyi Eric Hambro Sainbayar Sukhbaatar Roberta Raileanu ReLM LRM 115 94 0 07 Mar 2024
Exploring Continual Learning of Compositional Generalization in NLI Xiyan Fu Anette Frank CLL LRM 71 3 0 07 Mar 2024
HaluEval-Wild: Evaluating Hallucinations of Language Models in the Wild Zhiying Zhu Yiming Yang Zhiqing Sun HILM VLM 104 14 0 07 Mar 2024
Large Language Models are In-Context Molecule Learners Jiatong Li Wei Liu Zhihao Ding Wenqi Fan Yuqiang Li Qing Li 140 6 0 07 Mar 2024
Quantifying Contamination in Evaluating Code Generation Capabilities of Language Models Martin Riddell Ansong Ni Arman Cohan ELM 90 32 0 06 Mar 2024
ShortGPT: Layers in Large Language Models are More Redundant Than You Expect Xin Men Mingyu Xu Qingyu Zhang Bingning Wang Hongyu Lin Yaojie Lu Xianpei Han Weipeng Chen 124 142 0 06 Mar 2024
Model Parallelism on Distributed Infrastructure: A Literature Review from Theory to LLM Case-Studies Felix Brakel Uraz Odyurt A. Varbanescu GNN 85 11 0 06 Mar 2024
GaLore: Memory-Efficient LLM Training by Gradient Low-Rank Projection Jiawei Zhao Zhenyu Zhang Beidi Chen Zhangyang Wang A. Anandkumar Yuandong Tian 130 230 0 06 Mar 2024
Negating Negatives: Alignment without Human Positive Samples via Distributional Dispreference Optimization Shitong Duan Xiaoyuan Yi Peng Zhang Tun Lu Xing Xie Ning Gu 82 7 0 06 Mar 2024
Learning to Maximize Mutual Information for Chain-of-Thought Distillation Xin Chen Hanxian Huang Yanjun Gao Yi Wang Jishen Zhao Ke Ding 103 15 0 05 Mar 2024
Guardrail Baselines for Unlearning in LLMs Pratiksha Thaker Yash Maurya Shengyuan Hu Zhiwei Steven Wu Virginia Smith MU 107 53 0 05 Mar 2024
Reliable, Adaptable, and Attributable Language Models with Retrieval Akari Asai Zexuan Zhong Danqi Chen Pang Wei Koh Luke Zettlemoyer Hanna Hajishirzi Wen-tau Yih KELM RALM 121 63 0 05 Mar 2024
"In Dialogues We Learn": Towards Personalized Dialogue Without Pre-defined Profiles through In-Dialogue Learning Chuanqi Cheng Quan Tu Wei Wu Shuo Shang Cunli Mao Zhengtao Yu Rui Yan 100 5 0 05 Mar 2024
In Search of Truth: An Interrogation Approach to Hallucination Detection Yakir Yehuda Itzik Malkiel Oren Barkan Jonathan Weill Royi Ronen Noam Koenigstein HILM 69 13 0 05 Mar 2024
EasyQuant: An Efficient Data-free Quantization Algorithm for LLMs Hanlin Tang Yifu Sun Decheng Wu Kai Liu Jianchen Zhu Zhanhui Kang MQ 53 11 0 05 Mar 2024
Towards Training A Chinese Large Language Model for Anesthesiology Zhonghai Wang Jie Jiang Yibing Zhan Bohao Zhou Yanhong Li ... Liang Ding Hua Jin Jun Peng Xu Lin Weifeng Liu LM&MA 71 4 0 05 Mar 2024
Modeling Collaborator: Enabling Subjective Vision Classification With Minimal Human Effort via LLM Tool-Use Imad Eddine Toubal Aditya Avinash N. Alldrin Jan Dlabal Wenlei Zhou ... Chun-Ta Lu Howard Zhou Ranjay Krishna Ariel Fuxman Tom Duerig VLM 147 7 0 05 Mar 2024
Exploring the Limitations of Large Language Models in Compositional Relation Reasoning Jinman Zhao Xueyan Zhang BDL LRM 75 4 0 05 Mar 2024
Alpaca against Vicuna: Using LLMs to Uncover Memorization of LLMs Aly M. Kassem Omar Mahmoud Niloofar Mireshghallah Hyunwoo J. Kim Yulia Tsvetkov Yejin Choi Sherif Saad Santu Rana 146 22 0 05 Mar 2024
HeAR -- Health Acoustic Representations Sebastien Baur Zaid Nabulsi Wei-Hung Weng Jake Garrison Louis Blankemeier ... Shwetak N. Patel S. Shetty Shruthi Prabhakara Monde Muyoyeta Diego Ardila LM&MA 70 14 0 04 Mar 2024
SPUQ: Perturbation-Based Uncertainty Quantification for Large Language Models Xiang Gao Jiaxin Zhang Lalla Mouatadid Kamalika Das 83 14 0 04 Mar 2024
Vision-Language Models for Medical Report Generation and Visual Question Answering: A Review Iryna Hartsock Ghulam Rasool 102 82 0 04 Mar 2024
RegionGPT: Towards Region Understanding Vision Language Model Qiushan Guo Shalini De Mello Hongxu Yin Wonmin Byeon Ka Chun Cheung Yizhou Yu Ping Luo Sifei Liu VLM 100 37 0 04 Mar 2024