v1v2 (latest)

Transferable text data distillation by trajectory matching

14 April 2025

Papers citing "Transferable text data distillation by trajectory matching"

24 / 24 papers shown

Title
DiLM: Distilling Dataset into Language Model for Text-level Dataset Distillation Aru Maekawa Satoshi Kosugi Kotaro Funakoshi Manabu Okumura DD 97 11 0 30 Mar 2024
Dataset Quantization Daquan Zhou Kaixin Wang Jianyang Gu Xiang Peng Dongze Lian Yifan Zhang Yang You Jiashi Feng DD 79 41 0 21 Aug 2023
Evaluating Instruction-Tuned Large Language Models on Code Comprehension and Generation Zhiqiang Yuan Junwei Liu Qiancheng Zi Wentai Deng Xin Peng Xin Peng ALM ELM LRM 66 80 0 02 Aug 2023
Llama 2: Open Foundation and Fine-Tuned Chat Models Hugo Touvron Louis Martin Kevin R. Stone Peter Albert Amjad Almahairi ... Sharan Narang Aurelien Rodriguez Robert Stojnic Sergey Edunov Thomas Scialom AI4MH ALM 307 11,894 0 18 Jul 2023
PaLM 2 Technical Report Rohan Anil Andrew M. Dai Orhan Firat Melvin Johnson Dmitry Lepikhin ... Ce Zheng Wei Zhou Denny Zhou Slav Petrov Yonghui Wu ReLM LRM 191 1,192 0 17 May 2023
OpenAssistant Conversations -- Democratizing Large Language Model Alignment Andreas Kopf Yannic Kilcher Dimitri von Rutte Sotiris Anagnostidis Zhi Rui Tam ... Arnav Dantuluri Andrew Maguire Christoph Schuhmann Huu Nguyen A. Mattick ALM LM&MA 131 630 0 14 Apr 2023
Data Selection for Language Models via Importance Resampling Sang Michael Xie Shibani Santurkar Tengyu Ma Percy Liang 114 191 0 06 Feb 2023
The Flan Collection: Designing Data and Methods for Effective Instruction Tuning Shayne Longpre Le Hou Tu Vu Albert Webson Hyung Won Chung ... Denny Zhou Quoc V. Le Barret Zoph Jason W. Wei Adam Roberts ALM 108 670 0 31 Jan 2023
Data Distillation: A Survey Noveen Sachdeva Julian McAuley DD 86 77 0 11 Jan 2023
OPT: Open Pre-trained Transformer Language Models Susan Zhang Stephen Roller Naman Goyal Mikel Artetxe Moya Chen ... Daniel Simig Punit Singh Koura Anjali Sridhar Tianlu Wang Luke Zettlemoyer VLM OSLM AI4CE 336 3,667 0 02 May 2022
Dataset Distillation by Matching Training Trajectories George Cazenavette Tongzhou Wang Antonio Torralba Alexei A. Efros Jun-Yan Zhu FedML DD 182 388 0 22 Mar 2022
Chain-of-Thought Prompting Elicits Reasoning in Large Language Models Jason W. Wei Xuezhi Wang Dale Schuurmans Maarten Bosma Brian Ichter F. Xia Ed H. Chi Quoc Le Denny Zhou LM&Ro LRM AI4CE ReLM 817 9,576 0 28 Jan 2022
Dataset Condensation with Distribution Matching Bo Zhao Hakan Bilen DD 77 307 0 08 Oct 2021
The Trade-offs of Domain Adaptation for Neural Language Models David Grangier Dan Iter 54 21 0 21 Sep 2021
On the Complementarity of Data Selection and Fine Tuning for Domain Adaptation Dan Iter David Grangier 75 9 0 15 Sep 2021
LoRA: Low-Rank Adaptation of Large Language Models J. E. Hu Yelong Shen Phillip Wallis Zeyuan Allen-Zhu Yuanzhi Li Shean Wang Lu Wang Weizhu Chen OffRL AI4TS AI4CE ALM AIMat 477 10,367 0 17 Jun 2021
Data Distillation for Text Classification Chak Tou Leong Wenjie Li DD 145 30 0 17 Apr 2021
Dataset Condensation with Differentiable Siamese Augmentation Bo Zhao Hakan Bilen DD 260 300 0 16 Feb 2021
Measuring Massive Multitask Language Understanding Dan Hendrycks Collin Burns Steven Basart Andy Zou Mantas Mazeika Basel Alomair Jacob Steinhardt ELM RALM 182 4,526 0 07 Sep 2020
Flexible Dataset Distillation: Learn Labels Instead of Images Ondrej Bohdal Yongxin Yang Timothy M. Hospedales DD 83 110 0 15 Jun 2020
Dataset Condensation with Gradient Matching Bo Zhao Konda Reddy Mopuri Hakan Bilen DD 116 497 0 10 Jun 2020
Language Models are Few-Shot Learners Tom B. Brown Benjamin Mann Nick Ryder Melanie Subbiah Jared Kaplan ... Christopher Berner Sam McCandlish Alec Radford Ilya Sutskever Dario Amodei BDL 817 42,055 0 28 May 2020
Soft-Label Dataset Distillation and Text Dataset Distillation Ilia Sucholutsky Matthias Schonlau DD 137 135 0 06 Oct 2019
Think you have Solved Question Answering? Try ARC, the AI2 Reasoning Challenge Peter Clark Isaac Cowhey Oren Etzioni Tushar Khot Ashish Sabharwal Carissa Schoenick Oyvind Tafjord ELM RALM LRM 162 2,610 0 14 Mar 2018