Title
A Survey of Reasoning with Foundation Models Jiankai Sun Chuanyang Zheng Enze Xie Zhengying Liu Ruihang Chu ... Xipeng Qiu Yi-Chen Guo Hui Xiong Qun Liu Zhenguo Li ReLM LRM AI4CE 35 79 0 17 Dec 2023
LLaMAntino: LLaMA 2 Models for Effective Text Generation in Italian Language Pierpaolo Basile Elio Musacchio Marco Polignano Lucia Siciliani G. Fiameni Giovanni Semeraro 57 37 0 15 Dec 2023
Towards Verifiable Text Generation with Evolving Memory and Self-Reflection Hao Sun Hengyi Cai Bo Wang Yingyan Hou Xiaochi Wei Shuaiqiang Wang Yan Zhang Dawei Yin 54 9 0 14 Dec 2023
ZeroQuant(4+2): Redefining LLMs Quantization with a New FP6-Centric Strategy for Diverse Generative Tasks Xiaoxia Wu Haojun Xia Stephen Youn Zhen Zheng Shiyang Chen ... Reza Yazdani Aminabadi Yuxiong He Olatunji Ruwase Leon Song Zhewei Yao 78 9 0 14 Dec 2023
Distributed Inference and Fine-tuning of Large Language Models Over The Internet Alexander Borzunov Max Ryabinin Artem Chumachenko Dmitry Baranchuk Tim Dettmers Younes Belkada Pavel Samygin Colin Raffel MoE ALM 26 39 0 13 Dec 2023
Modality Plug-and-Play: Elastic Modality Adaptation in Multimodal LLMs for Embodied AI Kai Huang Boyuan Yang Wei Gao 43 1 0 13 Dec 2023
Vista-LLaMA: Reducing Hallucination in Video Language Models via Equal Distance to Visual Tokens Fan Ma Xiaojie Jin Heng Wang Yuchen Xian Jiashi Feng Yi Yang 29 47 0 12 Dec 2023
LLM360: Towards Fully Transparent Open-Source LLMs Zhengzhong Liu Aurick Qiao Willie Neiswanger Hongyi Wang Bowen Tan ... Zhiting Hu Mark Schulze Preslav Nakov Timothy Baldwin Eric Xing 54 70 0 11 Dec 2023
GPTBIAS: A Comprehensive Framework for Evaluating Bias in Large Language Models Jiaxu Zhao Meng Fang Shirui Pan Wenpeng Yin Mykola Pechenizkiy ELM 37 11 0 11 Dec 2023
User Modeling in the Era of Large Language Models: Current Research and Future Directions Zhaoxuan Tan Meng Jiang 37 8 0 11 Dec 2023
Two Directions for Clinical Data Generation with Large Language Models: Data-to-Label and Label-to-Data Rumeng Li Xun Wang Hong Yu LM&MA 75 23 0 09 Dec 2023
Enhancing Robustness of Foundation Model Representations under Provenance-related Distribution Shifts Xiruo Ding Zhecheng Sheng Brian Hur Feng Chen Serguei V. S. Pakhomov Trevor Cohen OOD 25 0 0 09 Dec 2023
Lyrics: Boosting Fine-grained Language-Vision Alignment and Comprehension via Semantic-aware Visual Objects Junyu Lu Ruyi Gan Di Zhang Xiaojun Wu Ziwei Wu Renliang Sun Jiaxing Zhang Pingjian Zhang Yan Song MLLM VLM 36 15 0 08 Dec 2023
Train ñ Trade: Foundations of Parameter Markets Tzu-Heng Huang Harit Vishwakarma Frederic Sala AIFin 37 2 0 07 Dec 2023
From Big to Small Without Losing It All: Text Augmentation with ChatGPT for Efficient Sentiment Analysis Stanislaw Wo'zniak Jan Kocoñ 50 9 0 07 Dec 2023
Testing LLM performance on the Physics GRE: some observations Pranav Gupta ELM 12 2 0 07 Dec 2023
Is Bigger and Deeper Always Better? Probing LLaMA Across Scales and Layers Nuo Chen Ning Wu Shining Liang Ming Gong Linjun Shou Dongmei Zhang Jia Li LRM 27 11 0 07 Dec 2023
GPT-4V with Emotion: A Zero-shot Benchmark for Generalized Emotion Recognition Zheng Lian Guoying Zhao Haiyang Sun Kang Chen Zhuofan Wen Hao Gu Bin Liu Jianhua Tao 35 30 0 07 Dec 2023
Generative agent-based modeling with actions grounded in physical, social, or digital space using Concordia A. Vezhnevets J. Agapiou Avia Aharon Ron Ziv Jayd Matyas Edgar A. Duénez-Guzmán William A. Cunningham Simon Osindero Danny Karmon Joel Z Leibo LLMAG LM&Ro AI4CE 43 43 0 06 Dec 2023
Think from Words(TFW): Initiating Human-Like Cognition in Large Language Models Through Think from Words for Japanese Text-level Classification Chengguang Gan Qinghao Zhang Tatsunori Mori 37 1 0 06 Dec 2023
Towards Measuring Representational Similarity of Large Language Models Max Klabunde Mehdi Ben Amor Michael Granitzer Florian Lemmerich 44 2 0 05 Dec 2023
DRAFT: Dense Retrieval Augmented Few-shot Topic classifier Framework Keonwoo Kim Younggun Lee VLM 36 0 0 05 Dec 2023
Lenna: Language Enhanced Reasoning Detection Assistant Fei Wei Xinyu Zhang Ailing Zhang Bo Zhang Xiangxiang Chu MLLM LRM 34 23 0 05 Dec 2023
A Survey on Large Language Model (LLM) Security and Privacy: The Good, the Bad, and the Ugly Yifan Yao Jinhao Duan Kaidi Xu Yuanfang Cai Eric Sun Yue Zhang PILM ELM 57 478 0 04 Dec 2023
APoLLo: Unified Adapter and Prompt Learning for Vision Language Models Sanjoy Chowdhury Sayan Nag Dinesh Manocha VLM 35 17 0 04 Dec 2023
SeaLLMs -- Large Language Models for Southeast Asia Xuan-Phi Nguyen Wenxuan Zhang Xin Li Mahani Aljunied Zhiqiang Hu ... Yue Deng Sen Yang Chaoqun Liu Hang Zhang Li Bing LRM 45 74 0 01 Dec 2023
The Efficiency Spectrum of Large Language Models: An Algorithmic Survey Tianyu Ding Tianyi Chen Haidong Zhu Jiachen Jiang Yiqi Zhong Jinxin Zhou Guangzhi Wang Zhihui Zhu Ilya Zharkov Luming Liang 35 22 0 01 Dec 2023
CoLLiE: Collaborative Training of Large Language Models in an Efficient Way Kai Lv Shuo Zhang Tianle Gu Shuhao Xing Jiawei Hong ... Tengxiao Liu Yu Sun Penousal Machado Hang Yan Xipeng Qiu 59 7 0 01 Dec 2023
Towards Accurate Differential Diagnosis with Large Language Models Daniel J. McDuff M. Schaekermann Tao Tu Anil Palepu Amy Wang ... G. Corrado Yossi Matias Jacob Sunshine Alan Karthikesalingam Vivek Natarajan ELM LM&MA 53 76 0 30 Nov 2023
CAST: Cross-Attention in Space and Time for Video Action Recognition Dongho Lee Jongseo Lee Jinwoo Choi EgoV 40 12 0 30 Nov 2023
Splitwise: Efficient generative LLM inference using phase splitting Pratyush Patel Esha Choukse Chaojie Zhang Aashaka Shah Íñigo Goiri Saeed Maleki Ricardo Bianchini 61 206 0 30 Nov 2023
Synthesize, Diagnose, and Optimize: Towards Fine-Grained Vision-Language Understanding Wujian Peng Sicheng Xie Zuyao You Shiyi Lan Zuxuan Wu VLM CoGe MLLM 38 18 0 30 Nov 2023
Grounding Foundation Models through Federated Transfer Learning: A General Framework Yan Kang Tao Fan Hanlin Gu Xiaojin Zhang Lixin Fan Qiang Yang AI4CE 78 19 0 29 Nov 2023
Improving the Robustness of Transformer-based Large Language Models with Dynamic Attention Lujia Shen Yuwen Pu Shouling Ji Changjiang Li Xuhong Zhang Chunpeng Ge Ting Wang AAML 39 4 0 29 Nov 2023
ChatGPT's One-year Anniversary: Are Open-Source Large Language Models Catching up? Hailin Chen Fangkai Jiao Xingxuan Li Chengwei Qin Mathieu Ravaut Ruochen Zhao Caiming Xiong Chenyu You ELM CLL AI4MH LRM ALM 85 27 0 28 Nov 2023
Power Hungry Processing: Watts Driving the Cost of AI Deployment? Sasha Luccioni Yacine Jernite Emma Strubell 49 163 0 28 Nov 2023
YUAN 2.0: A Large Language Model with Localized Filtering-based Attention Shaohua Wu Xudong Zhao Shenling Wang Jiangang Luo Lingjun Li ... Wei Wang Tong Yu Rongguo Zhang Jiahua Zhang Chao Wang OSLM 61 6 0 27 Nov 2023
Increasing Coverage and Precision of Textual Information in Multilingual Knowledge Graphs Simone Conia Min Li Daniel Lee U. F. Minhas Ihab F. Ilyas Yunyao Li 88 9 0 27 Nov 2023
The effect of source disclosure on evaluation of AI-generated messages: A two-part study Sue Lim Ralf Schmälzle 8 21 0 27 Nov 2023
An Empirical Investigation into Benchmarking Model Multiplicity for Trustworthy Machine Learning: A Case Study on Image Classification Prakhar Ganesh 47 5 0 24 Nov 2023
GPT Struct Me: Probing GPT Models on Narrative Entity Extraction Hugo Sousa Nuno Guimarães A. Jorge Ricardo Campos 96 8 0 24 Nov 2023
Robot Learning in the Era of Foundation Models: A Survey Xuan Xiao Jiahang Liu Zhipeng Wang Yanmin Zhou Yong Qi Qian Cheng Bin He Shuo Jiang AI4CE LM&Ro 42 28 0 24 Nov 2023
Linear Log-Normal Attention with Unbiased Concentration Yury Nahshan Dor-Joseph Kampeas E. Haleva 22 7 0 22 Nov 2023
Towards Better Parameter-Efficient Fine-Tuning for Large Language Models: A Position Paper Chengyu Wang Junbing Yan Wei Zhang Jun Huang ALM 47 3 0 22 Nov 2023
GPT4Motion: Scripting Physical Motions in Text-to-Video Generation via Blender-Oriented GPT Planning Jiaxi Lv Yi Huang Mingfu Yan Jiancheng Huang Jianzhuang Liu Yifan Liu Yafei Wen Xiaoxin Chen Shifeng Chen VGen DiffM 32 23 0 21 Nov 2023
Advancing Transformer Architecture in Long-Context Large Language Models: A Comprehensive Survey Yunpeng Huang Jingwei Xu Junyu Lai Zixu Jiang Taolue Chen ... Xiaoxing Ma Lijuan Yang Zhou Xin Shupeng Li Penghao Zhao LLMAG KELM 49 56 0 21 Nov 2023
Enhancing Visual Grounding and Generalization: A Multi-Task Cycle Training Approach for Vision-Language Models Xiaoyu Yang Lijian Xu Hao Sun Hongsheng Li Shaoting Zhang ObjD 38 6 0 21 Nov 2023
AcademicGPT: Empowering Academic Research Shufa Wei Xiaolong Xu Xianbiao Qi Xi Yin Jun Xia ... Chihao Dai Lihua Wang Xiaohui Liu Lei Zhang Yutao Xie LM&MA 52 3 0 21 Nov 2023
LQ-LoRA: Low-rank Plus Quantized Matrix Decomposition for Efficient Language Model Finetuning Han Guo P. Greengard Eric P. Xing Yoon Kim MQ 40 44 0 20 Nov 2023
Taiyi: A Bilingual Fine-Tuned Large Language Model for Diverse Biomedical Tasks Ling Luo Jinzhong Ning Yingwen Zhao Zhijun Wang Zeyuan Ding ... Yuqi Liu Zhihao Yang Jian Wang Shengdi Yin Hongfei Lin LM&MA 99 52 0 20 Nov 2023