Title
Understanding Emergent Abilities of Language Models from the Loss Perspective Zhengxiao Du Aohan Zeng Yuxiao Dong Jie Tang UQCV LRM 73 47 0 23 Mar 2024
Cost-Efficient Large Language Model Serving for Multi-turn Conversations with CachedAttention Bin Gao Zhuomin He Puru Sharma Qingxuan Kang Djordje Jevdjic Junbo Deng Xingkun Yang Zhou Yu Pengfei Zuo 71 45 0 23 Mar 2024
SensoryT5: Infusing Sensorimotor Norms into T5 for Enhanced Fine-grained Emotion Classification Yuhan Xia Qingqing Zhao Yunfei Long Ge Xu Jia Wang 25 0 0 22 Mar 2024
LLaVA-PruMerge: Adaptive Token Reduction for Efficient Large Multimodal Models Yuzhang Shang Mu Cai Bingxin Xu Yong Jae Lee Yan Yan VLM 55 107 0 22 Mar 2024
Neural Plasticity-Inspired Multimodal Foundation Model for Earth Observation Zhitong Xiong Yi Wang Fahong Zhang Adam J. Stewart Joelle Hanna Damian Borth Ioannis Papoutsis B. L. Saux Gustau Camps-Valls Xiao Xiang Zhu AI4CE 81 14 0 22 Mar 2024
Comprehensive Reassessment of Large-Scale Evaluation Outcomes in LLMs: A Multifaceted Statistical Approach Kun Sun Rong Wang Anders Sogaard 37 3 0 22 Mar 2024
FollowIR: Evaluating and Teaching Information Retrieval Models to Follow Instructions Orion Weller Benjamin Chang Sean MacAvaney Kyle Lo Arman Cohan Benjamin Van Durme Dawn J Lawrie Luca Soldaini 63 30 0 22 Mar 2024
Not All Attention is Needed: Parameter and Computation Efficient Transfer Learning for Multi-modal Large Language Models Qiong Wu Weihao Ye Yiyi Zhou Xiaoshuai Sun Rongrong Ji MoE 52 1 0 22 Mar 2024
MSCoTDet: Language-driven Multi-modal Fusion for Improved Multispectral Pedestrian Detection Taeheon Kim Sangyun Chung Damin Yeom Youngjoon Yu Hak Gu Kim Y. Ro 38 2 0 22 Mar 2024
On the Convergence of Adam under Non-uniform Smoothness: Separability from SGDM and Beyond Bohan Wang Huishuai Zhang Qi Meng Ruoyu Sun Zhi-Ming Ma Wei Chen 37 7 0 22 Mar 2024
Construction of a Japanese Financial Benchmark for Large Language Models Masanori Hirano 37 10 0 22 Mar 2024
LLM2LLM: Boosting LLMs with Novel Iterative Data Enhancement Nicholas Lee Thanakul Wattanawong Sehoon Kim K. Mangalam Sheng Shen Gopala Anumanchipalli Michael W. Mahoney Kurt Keutzer A. Gholami 69 46 0 22 Mar 2024
Generative Active Learning for Image Synthesis Personalization Xu-Lu Zhang Wengyu Zhang Xiao Wei Jinlin Wu Zhaoxiang Zhang Zhen Lei Qing Li 113 2 0 22 Mar 2024
Comprehensive Evaluation and Insights into the Use of Large Language Models in the Automation of Behavior-Driven Development Acceptance Test Formulation Shanthi Karpurapu Sravanthy Myneni Unnati Nettur Likhit Sagar Gajja Dave Burke Tom Stiehm Jeffery Payne LM&MA 37 5 0 22 Mar 2024
KnowLA: Enhancing Parameter-efficient Finetuning with Knowledgeable Adaptation Xindi Luo Zequn Sun Jing-xin Zhao Zhe Zhao Wei Hu KELM 24 4 0 22 Mar 2024
Stance Reasoner: Zero-Shot Stance Detection on Social Media with Explicit Reasoning Maksym Taranukhin Vered Shwartz E. Milios LRM 44 6 0 22 Mar 2024
Surgical-LVLM: Learning to Adapt Large Vision-Language Model for Grounded Visual Question Answering in Robotic Surgery Guan-Feng Wang Long Bai Wan Jun Nah Jie Wang Zhaoxi Zhang Zhen Chen Jinlin Wu Mobarakol Islam Hongbin Liu Hongliang Ren 46 14 0 22 Mar 2024
MathVerse: Does Your Multi-modal LLM Truly See the Diagrams in Visual Math Problems? Renrui Zhang Dongzhi Jiang Yichi Zhang Haokun Lin Ziyu Guo ... Aojun Zhou Pan Lu Kai-Wei Chang Peng Gao Hongsheng Li 34 173 0 21 Mar 2024
MyVLM: Personalizing VLMs for User-Specific Queries Yuval Alaluf Elad Richardson Sergey Tulyakov Kfir Aberman Daniel Cohen-Or MLLM VLM 43 18 0 21 Mar 2024
Cobra: Extending Mamba to Multi-Modal Large Language Model for Efficient Inference Han Zhao Min Zhang Wei Zhao Pengxiang Ding Siteng Huang Donglin Wang Mamba 52 69 0 21 Mar 2024
Detoxifying Large Language Models via Knowledge Editing Meng Wang Ningyu Zhang Ziwen Xu Zekun Xi Shumin Deng Yunzhi Yao Qishen Zhang Linyi Yang Jindong Wang Huajun Chen KELM 46 56 0 21 Mar 2024
gTBLS: Generating Tables from Text by Conditional Question Answering Anirudh S. Sundar Christopher Richardson Larry Heck LMTD 32 6 0 21 Mar 2024
A Multimodal Approach to Device-Directed Speech Detection with Large Language Models Dominik Wagner Alexander W. Churchill Siddharth Sigtia Panayiotis Georgiou Matt Mirsamadi Aarshee Mishra Erik Marchi 49 6 0 21 Mar 2024
Locating and Mitigating Gender Bias in Large Language Models Yuchen Cai Ding Cao Rongxi Guo Yaqin Wen Guiquan Liu Enhong Chen 32 5 0 21 Mar 2024
Building Accurate Translation-Tailored LLMs with Language Aware Instruction Tuning Changtong Zan Liang Ding Li Shen Yibing Zhen Weifeng Liu Dacheng Tao 54 9 0 21 Mar 2024
FIT-RAG: Black-Box RAG with Factual Information and Token Reduction Yuren Mao Xuemei Dong Wenyi Xu Yunjun Gao Bin Wei Ying Zhang 43 9 0 21 Mar 2024
Beyond Surface Similarity: Detecting Subtle Semantic Shifts in Financial Narratives Jiaxin Liu Yi Yang Kar Yan Tam AIFin AI4TS 46 5 0 21 Mar 2024
ChainLM: Empowering Large Language Models with Improved Chain-of-Thought Prompting Xiaoxue Cheng Junyi Li Wayne Xin Zhao Ji-Rong Wen LRM AI4CE ReLM 57 7 0 21 Mar 2024
LayoutLLM: Large Language Model Instruction Tuning for Visually Rich Document Understanding Masato Fujitake MLLM 27 15 0 21 Mar 2024
Empowering Segmentation Ability to Multi-modal Large Language Models Yuqi Yang Peng-Tao Jiang Jing Wang Hao Zhang Kai Zhao Jinwei Chen Bo-wen Li LRM VLM 35 3 0 21 Mar 2024
From Handcrafted Features to LLMs: A Brief Survey for Machine Translation Quality Estimation Haofei Zhao Yilun Liu Shimin Tao Weibin Meng Yimeng Chen Xiang Geng Chang Su Min Zhang Hao Yang 39 9 0 21 Mar 2024
A Design Space for Intelligent and Interactive Writing Assistants Mina Lee Katy Ilonka Gero John Joon Young Chung S. Buckingham Shum Vipul Raheja ... Joonsuk Park Roy Pea Eugenia H Rho Shannon Zejiang Shen Pao Siangliulue 44 83 0 21 Mar 2024
Benchmarking Chinese Commonsense Reasoning of LLMs: From Chinese-Specifics to Reasoning-Memorization Correlations Jiaxing Sun Weiquan Huang Jiang Wu Chenya Gu Wei Li Songyang Zhang Hang Yan Conghui He LRM 52 6 0 21 Mar 2024
Multi-Modal Hallucination Control by Visual Information Grounding Alessandro Favero L. Zancato Matthew Trager Siddharth Choudhary Pramuditha Perera Alessandro Achille Ashwin Swaminathan Stefano Soatto MLLM 90 63 0 20 Mar 2024
Natural Language as Policies: Reasoning for Coordinate-Level Embodied Control with LLMs Yusuke Mikami Andrew Melnik Jun Miura Ville Hautamaki LM&Ro LRM 66 4 0 20 Mar 2024
Reverse Training to Nurse the Reversal Curse O. Yu. Golovneva Zeyuan Allen-Zhu Jason Weston Sainbayar Sukhbaatar 45 33 0 20 Mar 2024
VL-Mamba: Exploring State Space Models for Multimodal Learning Yanyuan Qiao Zheng Yu Longteng Guo Sihan Chen Zijia Zhao Mingzhen Sun Qi Wu Jing Liu Mamba 43 66 0 20 Mar 2024
Have You Poisoned My Data? Defending Neural Networks against Data Poisoning Fabio De Gaspari Dorjan Hitaj Luigi V. Mancini AAML TDI 27 4 0 20 Mar 2024
What if...?: Thinking Counterfactual Keywords Helps to Mitigate Hallucination in Large Multi-modal Models Junho Kim Yeonju Kim Yonghyun Ro LRM MLLM 35 4 0 20 Mar 2024
FMM-Attack: A Flow-based Multi-modal Adversarial Attack on Video-based LLMs Jinmin Li Kuofeng Gao Yang Bai Jingyun Zhang Shu-Tao Xia Yisen Wang AAML 38 8 0 20 Mar 2024
Improved Baselines for Data-efficient Perceptual Augmentation of LLMs Théophane Vallaeys Mustafa Shukor Matthieu Cord Jakob Verbeek 59 12 0 20 Mar 2024
LlamaFactory: Unified Efficient Fine-Tuning of 100+ Language Models Yaowei Zheng Richong Zhang Junhao Zhang Yanhan Ye Zheyan Luo Zhangchi Feng Yongqiang Ma 55 401 0 20 Mar 2024
Computational Models to Study Language Processing in the Human Brain: A Survey Shaonan Wang Jingyuan Sun Yunhao Zhang Nan Lin Marie-Francine Moens Chengqing Zong 34 5 0 20 Mar 2024
BadEdit: Backdooring large language models by model editing Yanzhou Li Tianlin Li Kangjie Chen Jian Zhang Shangqing Liu Wenhan Wang Tianwei Zhang Yang Liu SyDa AAML KELM 59 53 0 20 Mar 2024
Hyacinth6B: A large language model for Traditional Chinese Chih-Wei Song Yin-Te Tsai 32 0 0 20 Mar 2024
AMP: Autoregressive Motion Prediction Revisited with Next Token Prediction for Autonomous Driving Xiaosong Jia Shaoshuai Shi Zijun Chen Li Jiang Wenlong Liao Tao He Junchi Yan 46 5 0 20 Mar 2024
SC-Tune: Unleashing Self-Consistent Referential Comprehension in Large Vision Language Models Tongtian Yue Jie Cheng Longteng Guo Xingyuan Dai Zijia Zhao Xingjian He Gang Xiong Yisheng Lv Jing Liu 45 9 0 20 Mar 2024
Mora: Enabling Generalist Video Generation via A Multi-Agent Framework Zhengqing Yuan Ruoxi Chen Zhaoxu Li Haolong Jia Lifang He Chi Wang Lichao Sun VGen 68 27 0 20 Mar 2024
Instruction Multi-Constraint Molecular Generation Using a Teacher-Student Large Language Model Peng Zhou Jianmin Wang Chunyan Li Zixu Wang Yiping Liu ... Xibao Cai Houtim Lai Wei Liu Longyue Wang Xiangxiang Zeng 21 0 0 20 Mar 2024
VSTAR: Generative Temporal Nursing for Longer Dynamic Video Synthesis Yumeng Li William H. Beluch M. Keuper Dan Zhang Anna Khoreva DiffM VGen 86 5 0 20 Mar 2024