PIQA: Reasoning about Physical Commonsense in Natural Language

26 November 2019

Yejin Choi

Papers citing "PIQA: Reasoning about Physical Commonsense in Natural Language"

50 / 1,393 papers shown

Title
MoH: Multi-Head Attention as Mixture-of-Head Attention Peng Jin Bo Zhu Li Yuan Shuicheng Yan MoE 103 18 0 15 Oct 2024
MIND: Math Informed syNthetic Dialogues for Pretraining LLMs Syeda Nahida Akter Shrimai Prabhumoye John Kamalu S. Satheesh Eric Nyberg M. Patwary Mohammad Shoeybi Bryan Catanzaro LRM SyDa ReLM 167 2 0 15 Oct 2024
In-context KV-Cache Eviction for LLMs via Attention-Gate Zihao Zeng Bokai Lin Tianqi Hou Hao Zhang Zhijie Deng 123 2 0 15 Oct 2024
LLM Unlearning via Loss Adjustment with Only Forget Data Yaxuan Wang Jiaheng Wei Chris Yuhao Liu Jinlong Pang Qiang Liu A. Shah Yujia Bao Yang Liu Wei Wei KELM MU 163 20 0 14 Oct 2024
DrivingDojo Dataset: Advancing Interactive and Knowledge-Enriched Driving World Model Yuqi Wang Ke Cheng Jiawei He Qitai Wang Hengchen Dai Yuntao Chen Fei Xia Zhaoxiang Zhang VGen 67 1 0 14 Oct 2024
MLP-SLAM: Multilayer Perceptron-Based Simultaneous Localization and Mapping With a Dynamic and Static Object Discriminator Taozhe Li Wei Sun 61 1 0 14 Oct 2024
ATLAS: Adapter-Based Multi-Modal Continual Learning with a Two-Stage Learning Strategy Hong Li Zhiquan Tan Xingyu Li Weiran Huang CLL MoMe 60 1 0 14 Oct 2024
SGLP: A Similarity Guided Fast Layer Partition Pruning for Compressing Large Deep Models Yuqi Li Yao Lu Zhihong Zhu Chuanguang Yang Yihao Chen Jianping Gou 66 6 0 14 Oct 2024
RoCoFT: Efficient Finetuning of Large Language Models with Row-Column Updates Md. Kowsher Tara Esmaeilbeig Chun-Nam Yu Chen Chen Mojtaba Soltanalian Niloofar Yousefi 71 1 0 14 Oct 2024
TMGBench: A Systematic Game Benchmark for Evaluating Strategic Reasoning Abilities of LLMs Haoran Wang Xiachong Feng Lei Li Zhan Qin Dianbo Sui Dianbo Sui Lingpeng Kong LRM ELM 112 7 0 14 Oct 2024
MoIN: Mixture of Introvert Experts to Upcycle an LLM Ajinkya Tejankar K. Navaneet Ujjawal Panchal Kossar Pourahmadi Hamed Pirsiavash MoE 134 0 0 13 Oct 2024
LINKED: Eliciting, Filtering and Integrating Knowledge in Large Language Model for Commonsense Reasoning Jiachun Li Pengfei Cao Chenhao Wang Zhuoran Jin Yubo Chen Kang Liu Xiaojian Jiang Jiexin Xu Jun Zhao LRM KELM 56 1 0 12 Oct 2024
Zero-shot Commonsense Reasoning over Machine Imagination Hyuntae Park Yeachan Kim Jun-Hyung Park S. Lee ReLM VLM LRM 36 1 0 12 Oct 2024
FlatQuant: Flatness Matters for LLM Quantization Yuxuan Sun Ruikang Liu Haoli Bai Han Bao Kang Zhao ... Lu Hou Chun Yuan Xin Jiang Wen Liu Jun Yao MQ 176 11 0 12 Oct 2024
NoVo: Norm Voting off Hallucinations with Attention Heads in Large Language Models Zheng Yi Ho Siyuan Liang Sen Zhang Yibing Zhan Dacheng Tao 69 2 0 11 Oct 2024
MergePrint: Merge-Resistant Fingerprints for Robust Black-box Ownership Verification of Large Language Models Shojiro Yamabe Futa Waseda Tsubasa Takahashi Koki Wataoka MoMe 138 1 0 11 Oct 2024
SLIM: Let LLM Learn More and Forget Less with Soft LoRA and Identity Mixture Jiayi Han Liang Du Hongwei Du Xiangguo Zhou Yiwen Wu Weibo Zheng Donghong Han CLL MoMe MoE 86 4 0 10 Oct 2024
QuAILoRA: Quantization-Aware Initialization for LoRA Neal Lawton Aishwarya Padmakumar Judith Gaspers Jack FitzGerald Anoop Kumar Greg Ver Steeg Aram Galstyan MQ 53 0 0 09 Oct 2024
MoE++: Accelerating Mixture-of-Experts Methods with Zero-Computation Experts Peng Jin Bo Zhu Li Yuan Shuicheng Yan MoE 115 6 0 09 Oct 2024
Capturing Bias Diversity in LLMs Purva Prasad Gosavi Vaishnavi Murlidhar Kulkarni Alan F. Smeaton 33 0 0 09 Oct 2024
Weak-eval-Strong: Evaluating and Eliciting Lateral Thinking of LLMs with Situation Puzzles Qi Chen Bowen Zhang Gang Wang Qi Wu ReLM LRM 80 6 0 09 Oct 2024
Rodimus*: Breaking the Accuracy-Efficiency Trade-Off with Efficient Attentions Zhihao He Hang Yu Zi Gong Shizhan Liu Jia-Nan Li Weiyao Lin VLM 104 2 0 09 Oct 2024
Data Selection via Optimal Control for Language Models Yuxian Gu Li Dong Hongning Wang Y. Hao Qingxiu Dong Furu Wei Minlie Huang AI4CE 170 9 0 09 Oct 2024
The Mystery of Compositional Generalization in Graph-based Generative Commonsense Reasoning Xiyan Fu Anette Frank LRM 124 0 0 08 Oct 2024
Attribute Controlled Fine-tuning for Large Language Models: A Case Study on Detoxification Tao Meng Ninareh Mehrabi Palash Goyal Anil Ramakrishna Aram Galstyan Richard Zemel Kai-Wei Chang Rahul Gupta Charith Peris 27 1 0 07 Oct 2024
Superficial Safety Alignment Hypothesis Jianwei Li Jung-Eun Kim 65 3 0 07 Oct 2024
ESPACE: Dimensionality Reduction of Activations for Model Compression Charbel Sakr Brucek Khailany 73 5 0 07 Oct 2024
Cookbook: A framework for improving LLM generative abilities via programmatic data generating templates A. Narayan Mayee F. Chen Kush S. Bhatia Christopher Ré SyDa 64 3 0 07 Oct 2024
ZEBRA: Zero-Shot Example-Based Retrieval Augmentation for Commonsense Question Answering Francesco Maria Molfese Simone Conia Riccardo Orlando Roberto Navigli ReLM LRM RALM 65 3 0 07 Oct 2024
Recent Advances of Multimodal Continual Learning: A Comprehensive Survey Dianzhi Yu Xinni Zhang Yankai Chen Aiwei Liu Yifei Zhang Philip S. Yu Irwin King VLM CLL 101 13 0 07 Oct 2024
LPZero: Language Model Zero-cost Proxy Search from Zero Peijie Dong Lujun Li Xiang Liu Zhenheng Tang Xuebo Liu Qiang Wang Xiaowen Chu 413 4 0 07 Oct 2024
HyperINF: Unleashing the HyperPower of the Schulz's Method for Data Influence Estimation Xinyu Zhou Simin Fan Martin Jaggi TDI 96 1 0 07 Oct 2024
Plausibly Problematic Questions in Multiple-Choice Benchmarks for Commonsense Reasoning Shramay Palta Nishant Balepur Peter Rankel Sarah Wiegreffe Marine Carpuat Rachel Rudinger ELM 81 6 0 06 Oct 2024
Gradient Routing: Masking Gradients to Localize Computation in Neural Networks Alex Cloud Jacob Goldman-Wetzler Evžen Wybitul Joseph Miller Alexander Matt Turner 65 3 0 06 Oct 2024
EXAQ: Exponent Aware Quantization For LLMs Acceleration Moran Shkolnik Maxim Fishman Brian Chmiel Hilla Ben-Yaacov Ron Banner Kfir Y. Levy MQ 56 0 0 04 Oct 2024
ARB-LLM: Alternating Refined Binarizations for Large Language Models Zhiteng Li Xinyu Yan Tianao Zhang Haotong Qin Dong Xie Jiang Tian Zhongchao Shi Linghe Kong Yulun Zhang Xiaokang Yang MQ 97 8 0 04 Oct 2024
Scaling Parameter-Constrained Language Models with Quality Data Ernie Chang Matteo Paltenghi Yang Li Pin-Jie Lin Changsheng Zhao Patrick Huber Zechun Liu Rastislav Rabatin Yangyang Shi Vikas Chandra 102 1 0 04 Oct 2024
Scalable Frame-based Construction of Sociocultural NormBases for Socially-Aware Dialogues Shilin Qu Weiqing Wang Xin Zhou Haolan Zhan Zhuang Li Zhuang Li Linhao Luo Yuan-Fang Li Gholamreza Haffari 56 1 0 04 Oct 2024
How Much Can We Forget about Data Contamination? Sebastian Bordt Suraj Srinivas Valentyn Boreiko U. V. Luxburg 133 2 0 04 Oct 2024
Revisit Large-Scale Image-Caption Data in Pre-training Multimodal Foundation Models Zhengfeng Lai Vasileios Saveris Chen Chen Hong-You Chen Haotian Zhang ... Wenze Hu Zhe Gan Peter Grasch Meng Cao Yinfei Yang VLM 72 4 0 03 Oct 2024
EmbedLLM: Learning Compact Representations of Large Language Models Richard Zhuang Tianhao Wu Zhaojin Wen Andrew Li Jiantao Jiao Kannan Ramchandran AIFin 69 6 0 03 Oct 2024
Selective Attention Improves Transformer Yaniv Leviathan Matan Kalman Yossi Matias 119 12 0 03 Oct 2024
Determine-Then-Ensemble: Necessity of Top-k Union for Large Language Model Ensembling Yuxuan Yao Han Wu Mingyang Liu Sichun Luo Xiongwei Han Jie Liu Zhijiang Guo Linqi Song 107 7 0 03 Oct 2024
Basis Sharing: Cross-Layer Parameter Sharing for Large Language Model Compression Jingcun Wang Yu-Guang Chen Ing-Chao Lin Bing Li Grace Li Zhang 88 4 0 02 Oct 2024
Question-guided Knowledge Graph Re-scoring and Injection for Knowledge Graph Question Answering Yu Zhang Kehai Chen Xuefeng Bai zhao kang Quanjiang Guo Min Zhang 120 12 0 02 Oct 2024
Getting Free Bits Back from Rotational Symmetries in LLMs Wenlin Chen Gergely Flamich José Miguel Hernández-Lobato MQ 42 0 0 02 Oct 2024
House of Cards: Massive Weights in LLMs Jaehoon Oh Seungjun Shin Dokwan Oh 119 1 0 02 Oct 2024
Knowledge Entropy Decay during Language Model Pretraining Hinders New Knowledge Acquisition Jiyeon Kim Hyunji Lee Hyowon Cho Joel Jang Hyeonbin Hwang Seungpil Won Youbin Ahn Dohaeng Lee Minjoon Seo KELM 416 5 0 02 Oct 2024
Geometric Signatures of Compositionality Across a Language Model's Lifetime Jin Hwa Lee Thomas Jiralerspong Lei Yu Yoshua Bengio Emily Cheng CoGe 223 4 0 02 Oct 2024
Addition is All You Need for Energy-efficient Language Models Hongyin Luo Wei Sun 30 7 0 01 Oct 2024