Title
RNR: Teaching Large Language Models to Follow Roles and Rules Kuan-Chieh Wang Alexander Bukharin Haoming Jiang Qingyu Yin Zhengyang Wang ... Chao Zhang Bing Yin Xian Li Jianshu Chen Shiyang Li ALM 84 2 0 10 Sep 2024
MathGLM-Vision: Solving Mathematical Problems with Multi-Modal Large Language Model Zhen Yang Jinhao Chen Zhengxiao Du Wenmeng Yu Weihan Wang Wenyi Hong Zhihuan Jiang Bin Xu Yuxiao Dong Jie Tang VLM LRM 90 11 0 10 Sep 2024
What is the Role of Small Models in the LLM Era: A Survey Lihu Chen Gaël Varoquaux ALM 266 32 0 10 Sep 2024
Can OOD Object Detectors Learn from Foundation Models? Jiahui Liu Xin Wen Shizhen Zhao Yukang Chen Xiaojuan Qi OODD 94 2 0 08 Sep 2024
Expanding Expressivity in Transformer Models with MöbiusAttention Anna-Maria Halacheva M. Nayyeri Steffen Staab 88 1 0 08 Sep 2024
POINTS: Improving Your Vision-language Model with Affordable Strategies Yuan Liu Zhongyin Zhao Ziyuan Zhuang Le Tian Xiao Zhou Jie Zhou VLM 99 9 0 07 Sep 2024
Open-MAGVIT2: An Open-Source Project Toward Democratizing Auto-regressive Visual Generation Zhuoyan Luo Fengyuan Shi Yixiao Ge Yujiu Yang Limin Wang Ying Shan VLM 181 59 0 06 Sep 2024
How Do Your Code LLMs Perform? Empowering Code Instruction Tuning with High-Quality Data Yejie Wang Keqing He Dayuan Fu Zhuoma Gongque Heyang Xu ... Muxi Diao Jingang Wang Hao Fei Xunliang Cai Weiran Xu ALM SyDa 77 4 0 05 Sep 2024
Hallucination Detection in LLMs: Fast and Memory-Efficient Finetuned Models Gabriel Y. Arteaga Thomas B. Schon Nicolas Pielawski 115 9 0 04 Sep 2024
Diversify-verify-adapt: Efficient and Robust Retrieval-Augmented Ambiguous Question Answering Yeonjun In Sungchul Kim Ryan Rossi Md Mehrab Tanjim Tong Yu Ritwik Sinha Chanyoung Park 106 3 0 04 Sep 2024
Leveraging Large Language Models for Solving Rare MIP Challenges Teng Wang Wing-Yin Yu Ruifeng She Wenhan Yang Taijie Chen Jianping Zhang AI4CE 90 5 0 03 Sep 2024
Think Twice Before Recognizing: Large Multimodal Models for General Fine-grained Traffic Sign Recognition Yaozong Gan Guang Li Ren Togo Keisuke Maeda Takahiro Ogawa Miki Haseyama 89 1 0 03 Sep 2024
Towards General Industrial Intelligence: A Survey on IIoT-Enhanced Continual Large Models Jiao Chen Jiayi He Fangfang Chen Zuohong Lv Jianhua Tang Weihua Li Zuozhu Liu Howard H. Yang Guangjie Han AI4CE 82 1 0 02 Sep 2024
LuWu: An End-to-End In-Network Out-of-Core Optimizer for 100B-Scale Model-in-Network Data-Parallel Training on Distributed GPUs Mo Sun Zihan Yang Changyue Liao Yingtao Li Leilei Gan Zeke Wang 117 1 0 02 Sep 2024
SAM4MLLM: Enhance Multi-Modal Large Language Model for Referring Expression Segmentation Yi-Chia Chen Wei-Hua Li Cheng Sun Yu-Chiang Frank Wang Chu-Song Chen VLM 112 21 0 01 Sep 2024
AdaNAT: Exploring Adaptive Policy for Token-Based Image Generation Zanlin Ni Yulin Wang Renping Zhou Rui Lu Jiayi Guo Jinyi Hu Zhiyuan Liu Yuan Yao Gao Huang 107 8 0 31 Aug 2024
UrBench: A Comprehensive Benchmark for Evaluating Large Multimodal Models in Multi-View Urban Scenarios Baichuan Zhou Haote Yang Dairong Chen Junyan Ye Tianyi Bai Jinhua Yu Songyang Zhang Dahua Lin Conghui He Weijia Li VLM 182 7 0 30 Aug 2024
A Survey for Large Language Models in Biomedicine Chong Wang Mengyao Li Junjun He Zhongruo Wang Erfan Darzi ... Yi Yu Pietro Liò Tianyun Wang Yu Guang Wang Yiqing Shen LM&MA 136 13 0 29 Aug 2024
LoraMap: Harnessing the Power of LoRA Connections Hyeryun Park Jeongwon Kwak Dongsuk Jang Sumin Park Jinwook Choi MoMe 80 0 0 29 Aug 2024
Hand1000: Generating Realistic Hands from Text with Only 1,000 Images Haozhuo Zhang B. Zhu Yu Cao Y. Hao VLM 137 3 0 28 Aug 2024
A Statistical Framework for Data-dependent Retrieval-Augmented Models Soumya Basu A. S. Rawat Manzil Zaheer RALM 90 0 0 27 Aug 2024
Parameter-Efficient Quantized Mixture-of-Experts Meets Vision-Language Instruction Tuning for Semiconductor Electron Micrograph Analysis Sakhinana Sagar Srinivas Chidaksh Ravuru Geethan Sannidhi Venkataramana Runkana 84 0 0 27 Aug 2024
Zero-Shot Visual Reasoning by Vision-Language Models: Benchmarking and Analysis Aishik Nagar Shantanu Jaiswal Cheston Tan ReLM LRM 65 12 0 27 Aug 2024
BaichuanSEED: Sharing the Potential of ExtensivE Data Collection and Deduplication by Introducing a Competitive Large Language Model Baseline Bin Cui Zheng Liang Yiding Sun Da Pan Zhuoran Zhang ... Bingning Wang Wentao Zhang Jiaxin Mao Guosheng Dong Weipeng Chen ALM 71 3 0 27 Aug 2024
A Survey of Large Language Models for European Languages Wazir Ali S. Pyysalo 159 3 0 27 Aug 2024
Evidence-Enhanced Triplet Generation Framework for Hallucination Alleviation in Generative Question Answering Haowei Du Huishuai Zhang Dongyan Zhao HILM 63 0 0 27 Aug 2024
Cross-Modal Learning for Chemistry Property Prediction: Large Language Models Meet Graph Machine Learning Sakhinana Sagar Srinivas Venkataramana Runkana AI4CE 85 2 0 27 Aug 2024
HPT++: Hierarchically Prompting Vision-Language Models with Multi-Granularity Knowledge Generation and Improved Structure Modeling Yubin Wang Xinyang Jiang De Cheng Wenli Sun Dongsheng Li Cairong Zhao VLM 108 0 0 27 Aug 2024
Measuring Human Contribution in AI-Assisted Content Generation Yueqi Xie Tao Qi Jingwei Yi Ryan Whalen Junming Huang Qian Ding Yu Xie Xing Xie Fangzhao Wu Fangzhao Wu 123 2 0 27 Aug 2024
Fire-Flyer AI-HPC: A Cost-Effective Software-Hardware Co-Design for Deep Learning Wei An Xiao Bi Guanting Chen Shanhuang Chen Chengqi Deng ... Chenggang Zhao Yao Zhao Shangyan Zhou Shunfeng Zhou Yuheng Zou 71 7 0 26 Aug 2024
Watermarking Techniques for Large Language Models: A Survey Yuqing Liang Jiancheng Xiao Wensheng Gan Philip S. Yu OffRL 115 9 0 26 Aug 2024
Hierarchical Network Fusion for Multi-Modal Electron Micrograph Representation Learning with Foundational Large Language Models Sakhinana Sagar Srinivas Geethan Sannidhi Venkataramana Runkana 108 0 0 24 Aug 2024
Utilizing Large Language Models for Named Entity Recognition in Traditional Chinese Medicine against COVID-19 Literature: Comparative Study Xu Tong N. Smirnova Sharmila Upadhyaya Ran Yu Jack H. Culbert Chao Sun Wolfgang Otto Philipp Mayr AI4MH 62 1 0 24 Aug 2024
LlamaDuo: LLMOps Pipeline for Seamless Migration from Service LLMs to Small-Scale Local LLMs Chansung Park Juyong Jiang Fan Wang Sayak Paul Jing Tang 123 2 0 24 Aug 2024
Understanding Defects in Generated Codes by Language Models Ali Mohammadi Esfahani N. Kahani S. Ajila 96 1 0 23 Aug 2024
Foundational Model for Electron Micrograph Analysis: Instruction-Tuning Small-Scale Language-and-Vision Assistant for Enterprise Adoption Sakhinana Sagar Srinivas Chidaksh Ravuru Geethan Sannidhi Venkataramana Runkana 75 0 0 23 Aug 2024
In-Context Learning with Reinforcement Learning for Incomplete Utterance Rewriting Haowei Du Dongyan Zhao RALM 67 0 0 23 Aug 2024
Internal and External Knowledge Interactive Refinement Framework for Knowledge-Intensive Question Answering Haowei Du Dongyan Zhao KELM 53 0 0 23 Aug 2024
Investigating LLM Applications in E-Commerce Chester Palen-Michel Ruixiang Wang Yipeng Zhang David Yu Canran Xu Zhe Wu 78 5 0 23 Aug 2024
MME-RealWorld: Could Your Multimodal LLM Challenge High-Resolution Real-World Scenarios that are Difficult for Humans? Yi-Fan Zhang Huanyu Zhang Haochen Tian Chaoyou Fu Shuangqing Zhang ... Qingsong Wen Zhang Zhang Liwen Wang Rong Jin Tieniu Tan OffRL 193 52 0 23 Aug 2024
Show-o: One Single Transformer to Unify Multimodal Understanding and Generation Jinheng Xie Weijia Mao Zechen Bai David Junhao Zhang Weihao Wang Kevin Qinghong Lin Yuchao Gu Zhijie Chen Zhenheng Yang Mike Zheng Shou 142 228 0 22 Aug 2024
Fine-tuning Smaller Language Models for Question Answering over Financial Documents Karmvir Singh Phogat Sai Akhil Puranam Sridhar Dasaratha Chetan Harsha Shashishekar Ramakrishna LRM 54 4 0 22 Aug 2024
D-RMGPT: Robot-assisted collaborative tasks driven by large multimodal models Matteo Forlini Mihail Babcinschi Giacomo Palmieri Pedro Neto 89 1 0 21 Aug 2024
LARR: Large Language Model Aided Real-time Scene Recommendation with Semantic Understanding Zhizhong Wan Bin Yin Junjie Xie Fei Jiang Xiang Li Wei Lin 3DV 74 5 0 21 Aug 2024
EmbodiedSAM: Online Segment Any 3D Thing in Real Time Xiuwei Xu Huangxing Chen Linqing Zhao Ziwei Wang Jie Zhou Jiwen Lu 130 16 0 21 Aug 2024
Benchmarking Large Language Models for Math Reasoning Tasks Kathrin Seßler Yao Rong Emek Gözlüklü Enkelejda Kasneci LRM 61 4 0 20 Aug 2024
CodeJudge-Eval: Can Large Language Models be Good Judges in Code Understanding? Yuwei Zhao Ziyang Luo Yuchen Tian Hongzhan Lin Weixiang Yan Annan Li Jing Ma ELM ALM LRM 74 10 0 20 Aug 2024
Analysis of Plan-based Retrieval for Grounded Text Generation Ameya Godbole Nicholas Monath Seungyeon Kim A. S. Rawat Andrew McCallum Manzil Zaheer RALM 111 3 0 20 Aug 2024
Demystifying the Communication Characteristics for Distributed Transformer Models Quentin G. Anthony Benjamin Michalowicz Jacob Hatef Lang Xu Mustafa Abduljabbar Hari Subramoni Hari Subramoni D. Panda AI4CE 52 2 0 19 Aug 2024
Geometry Informed Tokenization of Molecules for Language Model Generation Xiner Li Limei Wang Youzhi Luo Carl Edwards Shurui Gui Yuchao Lin Heng Ji Shuiwang Ji 108 7 0 19 Aug 2024