Title
Zero-Indexing Internet Search Augmented Generation for Large Language Models Guangxin He Zonghong Dai Jiangcheng Zhu Binqiang Zhao Qicheng Hu Chenyue Li You Peng Chen Wang Binhang Yuan 69 0 0 31 Dec 2024
Is ChatGPT Good at Search? Investigating Large Language Models as Re-Ranking Agents Weiwei Sun Lingyong Yan Xinyu Ma Shuaiqiang Wang Pengjie Ren Zhumin Chen Dawei Yin Z. Ren RALM ALM ELM LRM LM&MA 76 285 0 31 Dec 2024
Diverse and Effective Red Teaming with Auto-generated Rewards and Multi-step Reinforcement Learning Alex Beutel Kai Y. Xiao Johannes Heidecke Lilian Weng AAML 43 3 0 24 Dec 2024
Lies, Damned Lies, and Distributional Language Statistics: Persuasion and Deception with Large Language Models Cameron R. Jones Benjamin Bergen 67 5 0 22 Dec 2024
Disentangling Reasoning Tokens and Boilerplate Tokens For Language Model Fine-tuning Ziang Ye Z. Zhang Yang Zhang Jianxin Ma Junyang Lin Fuli Feng LRM 85 0 0 19 Dec 2024
Learning to Generate Research Idea with Dynamic Control Ruochen Li Liqiang Jing Chi Han Jiawei Zhou Xinya Du LRM 87 3 0 19 Dec 2024
Relational Programming with Foundation Models Ziyang Li Jiani Huang Jason Liu Felix Zhu Eric Zhao William Dodds Neelay Velingker Rajeev Alur Mayur Naik 110 3 0 19 Dec 2024
RAG-RewardBench: Benchmarking Reward Models in Retrieval Augmented Generation for Preference Alignment Zhuoran Jin Hongbang Yuan Tianyi Men Pengfei Cao Yubo Chen Kang-Jun Liu Jun Zhao ALM 82 7 0 18 Dec 2024
EscapeBench: Pushing Language Models to Think Outside the Box Cheng Qian Peixuan Han Qinyu Luo Bingxiang He Xiusi Chen ... Jiarui Yao Xiaocheng Yang Denghui Zhang Yunzhu Li Heng Ji LLMAG LRM 88 3 0 18 Dec 2024
Context-DPO: Aligning Language Models for Context-Faithfulness Baolong Bi Shaohan Huang Yixuan Wang Tianchi Yang Zihan Zhang ... Furu Wei Weiwei Deng Feng Sun Qi Zhang Shenghua Liu 113 9 0 18 Dec 2024
CAD-Assistant: Tool-Augmented VLLMs as Generic CAD Task Solvers Dimitrios Mallis Ahmet Serdar Karadeniz Sebastian Cavada Danila Rukhovich Niki Maria Foteinopoulou K. Cherenkova Anis Kacem Djamila Aouada 79 2 0 18 Dec 2024
RL-LLM-DT: An Automatic Decision Tree Generation Method Based on RL Evaluation and LLM Enhancement Junjie Lin Jian Zhao Lin Liu Yue Deng Youpeng Zhao Lanxiao Huang Xia Lin Wengang Zhou Hao Li 74 0 0 16 Dec 2024
Attention with Dependency Parsing Augmentation for Fine-Grained Attribution Qiang Ding Lvzhou Luo Yixuan Cao Ping Luo 82 0 0 16 Dec 2024
Advanced System Integration: Analyzing OpenAPI Chunking for Retrieval-Augmented Generation Robin D. Pesl Jerin G. Mathew Massimo Mecella Marco Aiello 73 1 0 29 Nov 2024
Know Your RAG: Dataset Taxonomy and Generation Strategies for Evaluating RAG Systems Rafael Teixeira de Lima Shubham Gupta Cesar Berrospi Lokesh Mishra Michele Dolfi Peter W. J. Staar Panagiotis Vagenas 82 1 0 29 Nov 2024
SRSA: A Cost-Efficient Strategy-Router Search Agent for Real-world Human-Machine Interactions Yaqi Wang Haipei Xu LLMAG 72 0 0 21 Nov 2024
Drowning in Documents: Consequences of Scaling Reranker Inference Mathew Jacob Erik Lindgren Matei A. Zaharia Michael Carbin Omar Khattab Andrew Drozdov OffRL 74 4 0 18 Nov 2024
Search, Verify and Feedback: Towards Next Generation Post-training Paradigm of Foundation Models via Verifier Engineering Xinyan Guan Yanjiang Liu Xinyu Lu Boxi Cao Xianpei Han ... Le Sun Jie Lou Bowen Yu Yaojie Lu Hongyu Lin ALM 83 2 0 18 Nov 2024
The Dawn of GUI Agent: A Preliminary Case Study with Claude 3.5 Computer Use Siyuan Hu Mingyu Ouyang Difei Gao Mike Zheng Shou LM&Ro LLMAG 37 16 0 15 Nov 2024
Approximated Variational Bayesian Inverse Reinforcement Learning for Large Language Model Alignment Yuang Cai Yuyu Yuan Jinsheng Shi Qinhong Lin 41 0 0 14 Nov 2024
AssistRAG: Boosting the Potential of Large Language Models with an Intelligent Information Assistant Yujia Zhou Zheng Liu Zhicheng Dou AIFin LRM RALM 33 2 0 11 Nov 2024
Magentic-One: A Generalist Multi-Agent System for Solving Complex Tasks Adam Fourney Gagan Bansal Hussein Mozannar Cheng Tan Eduardo Salinas ... Victor C. Dibia Ahmed Hassan Awadallah Ece Kamar Rafah Hosn Saleema Amershi AI4CE LRM LLMAG 38 36 0 07 Nov 2024
Sharp Analysis for KL-Regularized Contextual Bandits and RLHF Heyang Zhao Chenlu Ye Quanquan Gu Tong Zhang OffRL 57 3 0 07 Nov 2024
Long Context RAG Performance of Large Language Models Quinn Leng Jacob P. Portes Sam Havens Matei A. Zaharia Michael Carbin AIFin RALM 3DV 41 8 0 05 Nov 2024
Foundations and Recent Trends in Multimodal Mobile Agents: A Survey Biao Wu Yanda Li Meng Fang Zirui Song Zhiwei Zhang Yunchao Wei L. Chen LM&Ro LLMAG OffRL AI4TS 44 4 0 04 Nov 2024
Enhancing Multiple Dimensions of Trustworthiness in LLMs via Sparse Activation Control Yuxin Xiao Chaoqun Wan Yonggang Zhang Wenxiao Wang Binbin Lin Xiaofei He Xu Shen Jieping Ye 29 0 0 04 Nov 2024
Sample-Efficient Alignment for LLMs Zichen Liu Changyu Chen Chao Du Wee Sun Lee Min-Bin Lin 36 3 0 03 Nov 2024
CORAG: A Cost-Constrained Retrieval Optimization System for Retrieval-Augmented Generation Zhilin Wang Haitao Yuan Wei Dong Gao Cong Feifei Li 3DV 47 1 0 01 Nov 2024
Attention Tracker: Detecting Prompt Injection Attacks in LLMs Kuo-Han Hung Ching-Yun Ko Ambrish Rawat I-Hsin Chung Winston H. Hsu Pin-Yu Chen 49 7 0 01 Nov 2024
GPT for Games: An Updated Scoping Review (2020-2024) Daijin Yang Erica Kleinman Casper Harteveld LLMAG AI4TS AI4CE 48 3 0 01 Nov 2024
Building Multi-Agent Copilot towards Autonomous Agricultural Data Management and Analysis Yu Pan Jianxin Sun Hongfeng Yu Joe Luck Geng Bai Nipuna Chamara Yufeng Ge Tala Awada 43 0 0 31 Oct 2024
AndroidLab: Training and Systematic Benchmarking of Android Autonomous Agents Yifan Xu Xiao Liu Xingchen Sun Siyi Cheng Hao Yu Hanyu Lai Shudan Zhang Dan Zhang Jie Tang Yuxiao Dong LLMAG 44 7 0 31 Oct 2024
Dynamic Strategy Planning for Efficient Question Answering with Large Language Models Tanmay Parekh Pradyot Prakash Alexander Radovic Akshay Shekher Denis Savenkov LRM 62 1 0 30 Oct 2024
AutoGLM: Autonomous Foundation Agents for GUIs Xiao Liu Bo Qin Dongzhu Liang Guang Dong Hanyu Lai ... Yujia Wang Yongjun Xu Zehan Qi Yuxiao Dong Jie Tang LLMAG 59 12 0 28 Oct 2024
Vision Search Assistant: Empower Vision-Language Models as Multimodal Search Engines Zhixin Zhang Yiyuan Zhang Xiaohan Ding Xiangyu Yue 24 3 0 28 Oct 2024
Fast Best-of-N Decoding via Speculative Rejection Hanshi Sun Momin Haider Ruiqi Zhang Huitao Yang Jiahao Qiu Ming Yin Mengdi Wang Peter L. Bartlett Andrea Zanette BDL 45 28 0 26 Oct 2024
FISHNET: Financial Intelligence from Sub-querying, Harmonizing, Neural-Conditioning, Expert Swarms, and Task Planning Nicole Cho Nishan Srishankar Lucas Cecchi William Watson AIFin 34 1 0 25 Oct 2024
OpenWebVoyager: Building Multimodal Web Agents via Iterative Real-World Exploration, Feedback and Optimization Hongliang He Wenlin Yao Kaixin Ma W. Yu H. Zhang Tianqing Fang Zhenzhong Lan Dong Yu LM&Ro LLMAG 43 9 0 25 Oct 2024
Infogent: An Agent-Based Framework for Web Information Aggregation R. Reddy Sagnik Mukherjee Jeonghwan Kim Zhenhailong Wang Dilek Z. Hakkani-Tür Heng Ji 38 7 0 24 Oct 2024
Parameter-Efficient Fine-Tuning in Large Models: A Survey of Methodologies L. Wang Sheng Chen Linnan Jiang Shu Pan Runze Cai Sen Yang Fei Yang 49 3 0 24 Oct 2024
AdvWeb: Controllable Black-box Attacks on VLM-powered Web Agents Chejian Xu Mintong Kang Jiawei Zhang Zeyi Liao Lingbo Mo Mengqi Yuan Huan Sun Bo Li AAML 35 13 0 22 Oct 2024
IPL: Leveraging Multimodal Large Language Models for Intelligent Product Listing Kang Chen Qingheng Zhang Chengbao Lian Yixin Ji Xuwei Liu Shuguang Han Guoqiang Wu Fei Huang Jufeng Chen 31 1 0 22 Oct 2024
Beyond Retrieval: Generating Narratives in Conversational Recommender Systems Krishna Sayana Raghavendra Vasudeva Yuri Vasilevski Kun Su Liam Hebert H. Pham Ambarish Jash Sukhdeep S. Sodhi 3DV 35 4 0 22 Oct 2024
RM-Bench: Benchmarking Reward Models of Language Models with Subtlety and Style Yantao Liu Zijun Yao Rui Min Yixin Cao Lei Hou Juanzi Li OffRL ALM 20 29 0 21 Oct 2024
ComPO: Community Preferences for Language Model Personalization Sachin Kumar Chan Young Park Yulia Tsvetkov Noah A. Smith Hannaneh Hajishirzi 29 5 0 21 Oct 2024
A Survey of Conversational Search Fengran Mo Kelong Mao Ziliang Zhao Hongjin Qian Haonan Chen Yiruo Cheng X. Li Bo Li Zhicheng Dou Jian-Yun Nie KELM 34 3 0 21 Oct 2024
Do RAG Systems Cover What Matters? Evaluating and Optimizing Responses with Sub-Question Coverage Kaige Xie Philippe Laban Prafulla Kumar Choubey Caiming Xiong C. Wu 37 1 0 20 Oct 2024
Personalized Adaptation via In-Context Preference Learning Allison Lau Younwoo Choi Vahid Balazadeh Keertana Chidambaram Vasilis Syrgkanis Rahul G. Krishnan VLM OffRL 15 2 0 17 Oct 2024
ControlAgent: Automating Control System Design via Novel Integration of LLM Agents and Domain Expertise Xingang Guo Darioush Keivan U. Syed Lianhui Qin Huan Zhang Geir Dullerud Peter M. Seiler Bin Hu 34 5 0 17 Oct 2024
RescueADI: Adaptive Disaster Interpretation in Remote Sensing Images with Autonomous Agents Zhuoran Liu Danpei Zhao Bo Yuan 30 1 0 17 Oct 2024