v1v2 (latest)

Self-Instruct: Aligning Language Models with Self-Generated Instructions

20 December 2022

Daniel Khashabi

ArXiv (abs)PDF HTML Github (4380★)

Papers citing "Self-Instruct: Aligning Language Models with Self-Generated Instructions"

50 / 475 papers shown

Title
Seeing Far and Clearly: Mitigating Hallucinations in MLLMs with Attention Causal Decoding Feilong Tang Chengzhi Liu Zhongxing Xu Ming Hu Zelin Peng ... Minquan Lin Yifan Peng Xuelian Cheng Imran Razzak Zongyuan Ge 76 1 0 22 May 2025
LongMagpie: A Self-synthesis Method for Generating Large-scale Long-context Instructions Chaochen Gao Xing Wu Zijia Lin Debing Zhang Songlin Hu SyDa 214 0 0 22 May 2025
Hunyuan-TurboS: Advancing Large Language Models through Mamba-Transformer Synergy and Adaptive Chain-of-Thought Tencent Hunyuan Team Ao Liu Botong Zhou Can Xu Chayse Zhou ... Bingxin Qu Bolin Ni Boyu Wu Chen Li Cheng-peng Jiang MoE LRM AI4CE 160 0 0 21 May 2025
DEBATE, TRAIN, EVOLVE: Self Evolution of Language Model Reasoning Gaurav Srivastava Zhenyu Bi Meng Lu Xuan Wang LLMAG LRM 56 0 0 21 May 2025
The Unreasonable Effectiveness of Entropy Minimization in LLM Reasoning Shivam Agarwal Zimin Zhang Lifan Yuan Jiawei Han Hao Peng 162 8 0 21 May 2025
DecIF: Improving Instruction-Following through Meta-Decomposition Tingfeng Hui Pengyu Zhu Bowen Ping Ling Tang Guanting Dong Yaqi Zhang Sen Su 75 0 0 20 May 2025
SHARP: Synthesizing High-quality Aligned Reasoning Problems for Large Reasoning Models Reinforcement Learning Xiong Jun Wu Zhenduo Zhang ZuJie Wen Zhiqiang Zhang Wang Ren ... Xudong Han Chengfu Tang Dingnan Jin Qing Cui Jun Zhou LRM 221 1 0 20 May 2025
Quaff: Quantized Parameter-Efficient Fine-Tuning under Outlier Spatial Stability Hypothesis Hong Huang Dapeng Wu 112 0 0 20 May 2025
YESciEval: Robust LLM-as-a-Judge for Scientific Question Answering Jennifer D'Souza Hamed Babaei Giglou Quentin Münch ELM 109 0 0 20 May 2025
PlanGPT-VL: Enhancing Urban Planning with Domain-Specific Vision-Language Models He Zhu Junyou Su Minxin Chen Wen Wang Yijie Deng Guanhua Chen Wenjia Zhang 197 0 0 20 May 2025
Safety Alignment Can Be Not Superficial With Explicit Safety Signals Jianwei Li Jung-Eng Kim AAML 189 1 0 19 May 2025
ProDS: Preference-oriented Data Selection for Instruction Tuning Wenya Guo Zhengkun Zhang Xumeng Liu Ying Zhang Ziyu Lu Haoze Zhu Xubo Liu Ruxue Yan 119 0 0 19 May 2025
Introspective Growth: Automatically Advancing LLM Expertise in Technology Judgment Siyang Wu Honglin Bao Nadav Kunievsky James A. Evans 132 0 0 18 May 2025
Data Whisperer: Efficient Data Selection for Task-Specific LLM Fine-Tuning via Few-Shot In-Context Learning Shaobo Wang Xiangqi Jin Ziming Wang Jinqiao Wang Jingyun Zhang ... Zichen Wen Zhong Li Zeang Sheng Xuming Hu Linfeng Zhang SyDa 114 3 0 18 May 2025
Improving LLM Outputs Against Jailbreak Attacks with Expert Model Integration Tatia Tsmindashvili Ana Kolkhidashvili Dachi Kurtskhalia Nino Maghlakelidze Elene Mekvabishvili Guram Dentoshvili Orkhan Shamilov Zaal Gachechiladze Steven Saporta David Dachi Choladze 183 0 0 18 May 2025
Exploring Criteria of Loss Reweighting to Enhance LLM Unlearning Puning Yang Qizhou Wang Zhuo Huang Tongliang Liu Chengqi Zhang Bo Han MU 120 0 0 17 May 2025
Do different prompting methods yield a common task representation in language models? Guy Davidson Todd M. Gureckis Brenden M. Lake Adina Williams 58 2 0 17 May 2025
Denoising Mutual Knowledge Distillation in Bi-Directional Multiple Instance Learning Chen Shu Boyu Fu Yiman Li Ting Yin Wenchuan Zhang Jie Chen Yuhao Yi Hong Bu 144 0 0 17 May 2025
When Thinking Fails: The Pitfalls of Reasoning for Instruction-Following in LLMs Xiaomin Li Zhou Yu Zhiwei Zhang Xupeng Chen Ziji Zhang Yingying Zhuang Narayanan Sadagopan Anurag Beniwal LRM 100 2 0 16 May 2025
RouteNator: A Router-Based Multi-Modal Architecture for Generating Synthetic Training Data for Function Calling LLMs Vibha Belavadi Tushar Vatsa Dewang Sultania Suhas Suresha Ishita Verma Chong Chen Tracy Holloway King Michael Friedrich SyDa 119 0 0 15 May 2025
REFINE-AF: A Task-Agnostic Framework to Align Language Models via Self-Generated Instructions using Reinforcement Learning from Automated Feedback Aniruddha Roy Pretam Ray Abhilash Nandy Somak Aditya Pawan Goyal ALM 62 0 0 10 May 2025
Camera Control at the Edge with Language Models for Scene Understanding Alexiy Buynitsky Sina Ehsani Bhanu Pallakonda Pragyana Mishra VLM 102 0 0 09 May 2025
LLAMAPIE: Proactive In-Ear Conversation Assistants Tuochao Chen Nicholas Batchelder Alisa Liu Noah A. Smith Shyamnath Gollakota 407 0 0 07 May 2025
ABKD: Pursuing a Proper Allocation of the Probability Mass in Knowledge Distillation via $α$ - $β$ -Divergence Guanghui Wang Zhiyong Yang Ziyi Wang Shi Wang Qianqian Xu Qingming Huang 291 0 0 07 May 2025
What do Language Model Probabilities Represent? From Distribution Estimation to Response Prediction Eitan Wagner Omri Abend 141 1 0 04 May 2025
Steering Large Language Models with Register Analysis for Arbitrary Style Transfer Xinchen Yang Marine Carpuat LLMSV 565 0 0 01 May 2025
TF1-EN-3M: Three Million Synthetic Moral Fables for Training Small, Open Language Models Mihai Nadas Laura Diosan Andrei Piscoran Andreea Tomescu VGen 136 0 0 29 Apr 2025
Safety in Large Reasoning Models: A Survey Cheng Wang Yang Liu Yangqiu Song Duzhen Zhang Zechao Li ... Shengju Yu Xinfeng Li Junfeng Fang Jiaheng Zhang Bryan Hooi LRM 452 14 0 24 Apr 2025
Instruction-Tuning Data Synthesis from Scratch via Web Reconstruction Yuxin Jiang Yijiao Wang Chuhan Wu Xinyi Dai Yan Xu ... Yucheng Wang Xin Jiang Lifeng Shang Ruiming Tang Wenjie Wang 140 0 0 22 Apr 2025
Roll the dice & look before you leap: Going beyond the creative limits of next-token prediction Vaishnavh Nagarajan Chen Henry Wu Charles Ding Aditi Raghunathan 121 0 0 21 Apr 2025
Think2SQL: Reinforce LLM Reasoning Capabilities for Text2SQL Simone Papicchio Simone Rossi Luca Cagliero Paolo Papotti ReLM LMTD AI4TS LRM 128 1 0 21 Apr 2025
MAIN: Mutual Alignment Is Necessary for instruction tuning Fanyi Yang Jianfeng Liu Xinsong Zhang Haoyu Liu Xixin Cao Yuefeng Zhan H. Sun Weiwei Deng Feng Sun Qi Zhang ALM 58 0 0 17 Apr 2025
UI-E2I-Synth: Advancing GUI Grounding with Large-Scale Instruction Synthesis Xinyi Liu Xiaoyi Zhang Ziyun Zhang Yan Lu 131 2 0 15 Apr 2025
Learning from Reference Answers: Versatile Language Model Alignment without Binary Human Preference Data Shuai Zhao Linchao Zhu Yi Yang 95 3 0 14 Apr 2025
VL-Rethinker: Incentivizing Self-Reflection of Vision-Language Models with Reinforcement Learning Haozhe Wang Chao Qu Zuming Huang Wei Chu Fangzhen Lin Wenhu Chen OffRL ReLM SyDa LRM VLM 155 40 0 10 Apr 2025
Cat, Rat, Meow: On the Alignment of Language Model and Human Term-Similarity Judgments Lorenz Linhardt Tom Neuhäuser Lenka Tětková Oliver Eberle ALM AI4TS 70 1 0 10 Apr 2025
Learning Long Short-Term Intention within Human Daily Behaviors Zhe Sun Rujie Wu Xiaodong Yang Hongzhao Xie Haiyan Jiang Junda Bi Zhenliang Zhang 49 0 0 10 Apr 2025
MDIT: A Model-free Data Interpolation Method for Diverse Instruction Tuning Yangning Li Zihua Lan Lv Qingsong Hai-Tao Zheng Hai-Tao Zheng 110 0 0 09 Apr 2025
A Survey of Large Language Models in Mental Health Disorder Detection on Social Media Zhuohan Ge Nicole Hu Darian Li Yubo Wang Shihao Qi Yuming Xu Han Shi Junxuan Zhang AI4MH 119 0 0 03 Apr 2025
GraphMaster: Automated Graph Synthesis via LLM Agents in Data-Limited Environments Enjun Du Miao Hu Tian Jin Zhihan Zhang Rong-Hua Li Guoren Wang 121 4 0 01 Apr 2025
Embodied-Reasoner: Synergizing Visual Search, Reasoning, and Action for Embodied Interactive Tasks Weinan Zhang Mengna Wang Gangao Liu Xu Huixin Yiwei Jiang ... Hang Zhang Xin Li Weiming Lu Peng Li Yueting Zhuang LM&Ro LRM 190 9 0 27 Mar 2025
3DGen-Bench: Comprehensive Benchmark Suite for 3D Generative Models Yize Zhang Mengchen Zhang Tong Wu Tengfei Wang Gordon Wetzstein Dahua Lin Ziwei Liu ELM 191 1 0 27 Mar 2025
A Survey on Personalized Alignment -- The Missing Piece for Large Language Models in Real-World Applications Jian Guan Jian Wu Jia-Nan Li Chuanqi Cheng Wei Wu LM&MA 171 3 0 21 Mar 2025
TreeSynth: Synthesizing Diverse Data from Scratch via Tree-Guided Subspace Partitioning Sheng Wang Pengan Chen Jingqi Zhou Qintong Li Jingwei Dong Jiahui Gao Boyang Xue Jiyue Jiang Dianbo Sui Chuan Wu SyDa 114 0 0 21 Mar 2025
Grammar and Gameplay-aligned RL for Game Description Generation with LLMs Tsunehiko Tanaka Edgar Simo-Serra 112 1 0 20 Mar 2025
ConSCompF: Consistency-focused Similarity Comparison Framework for Generative Large Language Models Alexey Karev Dong Xu 146 0 0 18 Mar 2025
D3: Diversity, Difficulty, and Dependability-Aware Data Selection for Sample-Efficient LLM Instruction Tuning Jia Zhang Chen-Xi Zhang Yang Liu Yi-Xuan Jin Xiao-Wen Yang Bo Zheng Yi Liu Lan-Zhe Guo 143 3 0 14 Mar 2025
Open3DVQA: A Benchmark for Comprehensive Spatial Reasoning with Multimodal Large Language Model in Open Space Weichen Zhang Zile Zhou Zhiheng Zheng Chen Gao Jinqiang Cui Yongqian Li Xinlei Chen Xiao-Ping Zhang LRM 135 5 0 14 Mar 2025
TigerLLM -- A Family of Bangla Large Language Models Nishat Raihan Marcos Zampieri 102 0 0 14 Mar 2025
MentalChat16K: A Benchmark Dataset for Conversational Mental Health Assistance Jia Xu Tianyi Wei Bojian Hou Patryk Orzechowski Shu Yang Ruochen Jin Rachael Paulbeck Joost B. Wagenaar George Demiris Li Shen AI4MH 81 1 0 13 Mar 2025