PIQA: Reasoning about Physical Commonsense in Natural Language

26 November 2019

Yejin Choi

Papers citing "PIQA: Reasoning about Physical Commonsense in Natural Language"

50 / 1,393 papers shown

Title
NeuroTrails: Training with Dynamic Sparse Heads as the Key to Effective Ensembling Bram Grooten Farid Hasanov Chenxiang Zhang Q. Xiao Boqian Wu ... Shiwei Liu L. Yin Elena Mocanu Mykola Pechenizkiy Decebal Constantin Mocanu 60 0 0 23 May 2025
Data Mixing Can Induce Phase Transitions in Knowledge Acquisition Xinran Gu Kaifeng Lyu Jiazheng Li Jingzhao Zhang 83 0 0 23 May 2025
Fast Quiet-STaR: Thinking Without Thought Tokens Wei Huang Yizhe Xiong Xin Ye Zhijie Deng Hui Chen Zijia Lin Guiguang Ding LLMAG LRM VLM 56 0 0 23 May 2025
LCD: Advancing Extreme Low-Bit Clustering for Large Language Models via Knowledge Distillation Fangxin Liu Ning Yang Junping Zhao Tao Yang Haibing Guan Li Jiang MQ 41 0 0 23 May 2025
Two-Stage Regularization-Based Structured Pruning for LLMs Mingkuan Feng Jinyang Wu Siyuan Liu Shuai Zhang Hongjian Fang Ruihan Jin Feihu Che Pengpeng Shao Zhengqi Wen 44 0 0 23 May 2025
DataRater: Meta-Learned Dataset Curation Dan A. Calian Gregory Farquhar Iurii Kemaev Luisa M. Zintgraf Matteo Hessel ... András Gyorgy Tom Schaul Jeffrey Dean Hado van Hasselt David Silver 166 1 0 23 May 2025
Logic-of-Thought: Empowering Large Language Models with Logic Programs for Solving Puzzles in Natural Language Naiqi Li Peiyuan Liu Zheng Liu Tao Dai Yong Jiang Shu-Tao Xia ReLM LRM 26 0 0 22 May 2025
URLs Help, Topics Guide: Understanding Metadata Utility in LLM Training Dongyang Fan Vinko Sabolčec Martin Jaggi 59 0 0 22 May 2025
Locate-then-Merge: Neuron-Level Parameter Fusion for Mitigating Catastrophic Forgetting in Multimodal LLMs Zeping Yu Sophia Ananiadou MoMe KELM CLL 105 0 0 22 May 2025
HOFT: Householder Orthogonal Fine-tuning Alejandro Moreno Arcas Albert Sanchis Jorge Civera Alfons Juan 69 0 0 22 May 2025
NQKV: A KV Cache Quantization Scheme Based on Normal Distribution Characteristics Zhihang Cai Xingjun Zhang Zhendong Tan Zheng Wei MQ 197 0 0 22 May 2025
PaTH Attention: Position Encoding via Accumulating Householder Transformations Songlin Yang Yikang Shen Kaiyue Wen Shawn Tan Mayank Mishra Liliang Ren Rameswar Panda Yoon Kim 72 1 0 22 May 2025
Zebra-Llama: Towards Extremely Efficient Hybrid Models Mingyu Yang Mehdi Rezagholizadeh Guihong Li Vikram Appia Emad Barsoum 74 0 0 22 May 2025
LongMagpie: A Self-synthesis Method for Generating Large-scale Long-context Instructions Chaochen Gao Xing Wu Zijia Lin Debing Zhang Songlin Hu SyDa 214 0 0 22 May 2025
Understanding Differential Transformer Unchains Pretrained Self-Attentions Chaerin Kong Jiho Jang Nojun Kwak 88 0 0 22 May 2025
Pre-training Large Memory Language Models with Internal and External Knowledge Linxi Zhao Sofian Zalouk Christian K. Belardi Justin Lovelace Jin Peng Zhou Kilian Q. Weinberger Yoav Artzi Jennifer J. Sun KELM HILM 103 0 0 21 May 2025
On the Generalization vs Fidelity Paradox in Knowledge Distillation Suhas Kamasetty Ramesh Ayan Sengupta Tanmoy Chakraborty 48 0 0 21 May 2025
Hunyuan-TurboS: Advancing Large Language Models through Mamba-Transformer Synergy and Adaptive Chain-of-Thought Tencent Hunyuan Team Ao Liu Botong Zhou Can Xu Chayse Zhou ... Bingxin Qu Bolin Ni Boyu Wu Chen Li Cheng-peng Jiang MoE LRM AI4CE 160 0 0 21 May 2025
SPhyR: Spatial-Physical Reasoning Benchmark on Material Distribution Philipp D. Siedler 79 0 0 21 May 2025
Revealing Language Model Trajectories via Kullback-Leibler Divergence Ryo Kishino Yusuke Takase Momose Oyama Hiroaki Yamagiwa Hidetoshi Shimodaira 92 0 0 21 May 2025
Social Bias in Popular Question-Answering Benchmarks Angelie Kraft Judith Simon Sonja Schimmler 113 0 0 21 May 2025
ABBA: Highly Expressive Hadamard Product Adaptation for Large Language Models Raghav Singhal Kaustubh Ponkshe Rohit Vartak Praneeth Vepakomma 120 0 0 20 May 2025
OSoRA: Output-Dimension and Singular-Value Initialized Low-Rank Adaptation Jialong Han Si Zhang Ke Zhang 37 0 0 20 May 2025
Dual Decomposition of Weights and Singular Value Low Rank Adaptation Jialong Han Si Zhang Ke Zhang 43 0 0 20 May 2025
Automatic mixed precision for optimizing gained time with constrained loss mean-squared-error based on model partition to sequential sub-graphs Shmulik Markovich-Golan Daniel Ohayon Itay Niv Yair Hanani MQ 134 0 0 19 May 2025
Safety Alignment Can Be Not Superficial With Explicit Safety Signals Jianwei Li Jung-Eng Kim AAML 187 1 0 19 May 2025
Occult: Optimizing Collaborative Communication across Experts for Accelerated Parallel MoE Training and Inference Shuqing Luo Pingzhi Li Jie Peng Hanrui Wang Yang Zhao Yu Cheng Tianlong Chen MoE 96 0 0 19 May 2025
WikiPersonas: What Can We Learn From Personalized Alignment to Famous People? Zilu Tang Afra Feyza Akyürek Ekin Akyürek Derry Wijaya 114 0 0 19 May 2025
SGDPO: Self-Guided Direct Preference Optimization for Language Model Alignment Wenqiao Zhu Ji Liu Lulu Wang Jun Wu Yulun Zhang 106 0 0 18 May 2025
LoRASuite: Efficient LoRA Adaptation Across Large Language Model Upgrades Yanan Li Fanxu Meng Muhan Zhang Shiai Zhu Shangguang Wang Mengwei Xu MoMe 80 0 0 17 May 2025
A Systematic Analysis of Base Model Choice for Reward Modeling Kian Ahrabian Pegah Jandaghi Negar Mokhberian Sai Praneeth Karimireddy Jay Pujara 134 0 0 16 May 2025
ZeroTuning: Unlocking the Initial Token's Power to Enhance Large Language Models Without Training Feijiang Han Xiaodong Yu Jianheng Tang Lyle Ungar 102 0 0 16 May 2025
GenKnowSub: Improving Modularity and Reusability of LLMs through General Knowledge Subtraction Mohammadtaha Bagherifard Sahar Rajabi Ali Edalat Yadollah Yaghoobzadeh KELM 69 0 0 16 May 2025
Memory-Efficient Orthogonal Fine-Tuning with Principal Subspace Adaptation Fei Wu Jia Hu Geyong Min Shiqiang Wang 111 0 0 16 May 2025
Qronos: Correcting the Past by Shaping the Future... in Post-Training Quantization Shihao Zhang Haoyu Zhang Ian Colbert Rayan Saab MQ 101 0 0 16 May 2025
Addition is almost all you need: Compressing neural networks with double binary factorization Vladimír Boža Vladimír Macko MQ 142 0 0 16 May 2025
Parallel Scaling Law for Language Models Mouxiang Chen Binyuan Hui Zeyu Cui Jiaxi Yang Dayiheng Liu Jianling Sun Junyang Lin Zhongxin Liu MoE LRM 91 2 0 15 May 2025
Rethinking Prompt Optimizers: From Prompt Merits to Optimization Zixiao Zhu Hanzhang Zhou Zijian Feng Tianjiao Li Chua Jia Jim Deryl Mak Lee Onn Gee Wah Ng Kezhi Mao LRM 143 0 0 15 May 2025
MiMo: Unlocking the Reasoning Potential of Language Model -- From Pretraining to Posttraining Xiaomi LLM-Core Team Bingquan Xia Bo Shen Cici Dawei Zhu ... Yun Wang Yue Yu Zhenru Lin Zhichao Song Zihao Yue MoE ReLM LRM AI4CE 169 7 0 12 May 2025
AttentionInfluence: Adopting Attention Head Influence for Weak-to-Strong Pretraining Data Selection Kai Hua Steven Wu Ge Zhang Ke Shen LRM 83 0 0 12 May 2025
Comet: Accelerating Private Inference for Large Language Model by Predicting Activation Sparsity Guang Yan Yuhui Zhang Zimu Guo Lutan Zhao Xiaojun Chen Chen Wang Wenhao Wang Dan Meng Rui Hou 74 0 0 12 May 2025
GuidedQuant: Large Language Model Quantization via Exploiting End Loss Guidance Jinuk Kim Marwa El Halabi W. Park Clemens JS Schaefer Deokjae Lee Yeonhong Park Jae W. Lee Hyun Oh Song MQ 146 1 0 11 May 2025
Improving Block-Wise LLM Quantization by 4-bit Block-Wise Optimal Float (BOF4): Analysis and Variations Patrick Blumenberg Thomas Graave Tim Fingscheidt MQ 100 0 0 10 May 2025
Ultra-FineWeb: Efficient Data Filtering and Verification for High-Quality LLM Training Data Yun Wang Z. Fu Jie Cai Peijun Tang Hongya Lyu ... Jie Zhou Guoyang Zeng Chaojun Xiao Xu Han Zhiyuan Liu 129 1 0 08 May 2025
A Sensitivity-Driven Expert Allocation Method in LoRA-MoE for Efficient Fine-Tuning Junzhou Xu Boyu Diao MoE 69 0 0 06 May 2025
SPAP: Structured Pruning via Alternating Optimization and Penalty Methods Hanyu Hu Xiaoming Yuan 90 0 0 06 May 2025
BadLingual: A Novel Lingual-Backdoor Attack against Large Language Models Ziyi Wang Hongwei Li Rui Zhang Wenbo Jiang Kangjie Chen Tianwei Zhang Qingchuan Zhao Guowen Xu AAML 99 0 0 06 May 2025
ReplaceMe: Network Simplification via Depth Pruning and Transformer Block Linearization Dmitriy Shopkhoev Ammar Ali Magauiya Zhussip Valentin Malykh Stamatios Lefkimmiatis N. Komodakis Sergey Zagoruyko VLM 506 0 0 05 May 2025
SIMPLEMIX: Frustratingly Simple Mixing of Off- and On-policy Data in Language Model Preference Learning Tianjian Li Daniel Khashabi 135 0 0 05 May 2025
Radio: Rate-Distortion Optimization for Large Language Model Compression Sean I. Young MQ 65 0 0 05 May 2025