On Mesa-Optimization in Autoregressively Trained Transformers: Emergence
and Capability

On Mesa-Optimization in Autoregressively Trained Transformers: Emergence and Capability

27 May 2024

Jun Zhu

ArXiv (abs)PDF HTML

Papers citing "On Mesa-Optimization in Autoregressively Trained Transformers: Emergence and Capability"

Title
No papers