WildChat: 1M ChatGPT Interaction Logs in the Wild

2 May 2024

Wenting Zhao

Xiang Ren

Yejin Choi

Papers citing "WildChat: 1M ChatGPT Interaction Logs in the Wild"

50 / 163 papers shown

Title
Modeling Future Conversation Turns to Teach LLMs to Ask Clarifying Questions Michael J.Q. Zhang W. Bradley Knox Eunsol Choi 110 7 0 17 Oct 2024
To Err is AI : A Case Study Informing LLM Flaw Reporting Practices Sean McGregor Allyson Ettinger Nick Judd Paul Albee Liwei Jiang ... Avijit Ghosh Christopher Fiorelli Michelle Hoang Sven Cattell Nouha Dziri 61 3 0 15 Oct 2024
Data Quality Control in Federated Instruction-tuning of Large Language Models Yaxin Du Guangyi Liu Fengting Yuchi W. Zhao Jingjing Qu Yanjie Wang Siheng Chen ALM FedML 129 2 0 15 Oct 2024
Thinking LLMs: General Instruction Following with Thought Generation Tianhao Wu Janice Lan Weizhe Yuan Jiantao Jiao Jason Weston Sainbayar Sukhbaatar LRM 68 22 0 14 Oct 2024
Assessing Dialect Fairness and Robustness of Large Language Models in Reasoning Tasks Fangru Lin Shaoguang Mao Emanuele La Malfa Valentin Hofmann Adrian de Wynter Jing Yao Si-Qing Chen Michael Wooldridge J. Pierrehumbert Furu Wei 161 3 0 14 Oct 2024
RMB: Comprehensively Benchmarking Reward Models in LLM Alignment Enyu Zhou Guodong Zheng Binghai Wang Zhiheng Xi Shihan Dou ... Yurong Mou Rui Zheng Tao Gui Qi Zhang Xuanjing Huang ALM 147 21 0 13 Oct 2024
Rethinking Data Selection at Scale: Random Selection is Almost All You Need Tingyu Xia Bowen Yu K. Dang An Yang Yuan Wu Yuan Tian Yi-Ju Chang Junyang Lin ALM 73 6 0 12 Oct 2024
Packing Analysis: Packing Is More Appropriate for Large Models or Datasets in Supervised Fine-tuning Shuhe Wang Guoyin Wang Yucheng Wang Jiwei Li Eduard H. Hovy Chen Guo 114 4 0 10 Oct 2024
Instructional Segment Embedding: Improving LLM Safety with Instruction Hierarchy Tong Wu Shujian Zhang Kaiqiang Song Silei Xu Sanqiang Zhao Ravi Agrawal Sathish Indurthi Chong Xiang Prateek Mittal Wenxuan Zhou 112 14 0 09 Oct 2024
KnowledgeSG: Privacy-Preserving Synthetic Text Generation with Knowledge Distillation from Server Wenhao Wang Xiaoyu Liang Rui Ye Jingyi Chai Siheng Chen Yanfeng Wang SyDa 87 6 0 08 Oct 2024
Stereotype or Personalization? User Identity Biases Chatbot Recommendations Anjali Kantharuban Jeremiah Milbauer Emma Strubell Emma Strubell Graham Neubig 100 15 0 08 Oct 2024
The Role of Governments in Increasing Interconnected Post-Deployment Monitoring of AI Merlin Stein Jamie Bernardi Connor Dunlop 81 6 0 07 Oct 2024
Need Help? Designing Proactive AI Assistants for Programming Valerie Chen Alan Zhu Sebastian Zhao Hussein Mozannar David Sontag Ameet Talwalkar 86 5 0 06 Oct 2024
CiMaTe: Citation Count Prediction Effectively Leveraging the Main Text Jun Hirako Ryohei Sasano Koichi Takeda 104 2 0 06 Oct 2024
LASeR: Learning to Adaptively Select Reward Models with Multi-Armed Bandits Duy Nguyen Archiki Prasad Elias Stengel-Eskin Joey Tianyi Zhou 46 3 0 02 Oct 2024
Exploring Empty Spaces: Human-in-the-Loop Data Augmentation Catherine Yeh Donghao Ren Yannick Assogba Dominik Moritz Fred Hohman 96 0 0 01 Oct 2024
HelloBench: Evaluating Long Text Generation Capabilities of Large Language Models Haoran Que Feiyu Duan Liqun He Yutao Mou Wangchunshu Zhou ... Ge Zhang Junran Peng Zhaoxiang Zhang Songyang Zhang Kai Chen LM&MA ELM VLM 106 16 0 24 Sep 2024
GenAI Advertising: Risks of Personalizing Ads with LLMs Brian Tang Kaiwen Sun Noah T. Curran F. Schaub Kang G. Shin SILM 65 2 0 23 Sep 2024
Explaining Datasets in Words: Statistical Models with Natural Language Parameters Ruiqi Zhong Heng Wang Dan Klein Jacob Steinhardt 74 8 0 13 Sep 2024
Real or Robotic? Assessing Whether LLMs Accurately Simulate Qualities of Human Responses in Dialogue Jonathan Ivey Shivani Kumar Jiayu Liu Hua Shen Sushrita Rakshit ... Dustin Wright Abraham Israeli Anders Giovanni Møller Lechen Zhang David Jurgens 106 3 0 12 Sep 2024
WildVis: Open Source Visualizer for Million-Scale Chat Logs in the Wild Yuntian Deng Wenting Zhao Jack Hessel Xiang Ren Claire Cardie Yejin Choi VLM 41 6 0 05 Sep 2024
Automatic Pseudo-Harmful Prompt Generation for Evaluating False Refusals in Large Language Models Bang An Sicheng Zhu Ruiyi Zhang Michael-Andrei Panaitescu-Liess Yuancheng Xu Furong Huang AAML 138 18 0 01 Sep 2024
Acceptable Use Policies for Foundation Models Kevin Klyman 69 17 0 29 Aug 2024
ConsistencyTrack: A Robust Multi-Object Tracker with a Generation Strategy of Consistency Model Lifan Jiang Zhihui Wang Siqi Yin Guangxiao Ma Peng Zhang Boxi Wu DiffM 145 0 0 28 Aug 2024
Soda-Eval: Open-Domain Dialogue Evaluation in the age of LLMs John Mendonça Isabel Trancoso A. Lavie ALM 77 3 0 20 Aug 2024
The Future of Open Human Feedback Shachar Don-Yehiya Ben Burtenshaw Ramon Fernandez Astudillo Cailean Osborne Mimansa Jaiswal ... Omri Abend Jennifer Ding Sara Hooker Hannah Rose Kirk Leshem Choshen VLM ALM 83 4 0 15 Aug 2024
The ShareLM Collection and Plugin: Contributing Human-Model Chats for the Benefit of the Community Shachar Don-Yehiya Leshem Choshen Omri Abend 59 2 0 15 Aug 2024
LongWriter: Unleashing 10,000+ Word Generation from Long Context LLMs Yushi Bai Jiajie Zhang Xin Lv Linzhi Zheng Siqi Zhu Lei Hou Yuxiao Dong Jie Tang Juanzi Li VGen LLMAG ALM 100 55 0 13 Aug 2024
Self-Taught Evaluators Tianlu Wang Ilia Kulikov O. Yu. Golovneva Ping Yu Weizhe Yuan Jane Dwivedi-Yu Richard Yuanzhe Pang Maryam Fazel-Zarandi Jason Weston Xian Li ALM LRM 76 27 0 05 Aug 2024
DynamoLLM: Designing LLM Inference Clusters for Performance and Energy Efficiency Jovan Stojkovic Chaojie Zhang Íñigo Goiri Josep Torrellas Esha Choukse 95 38 0 01 Aug 2024
WildHallucinations: Evaluating Long-form Factuality in LLMs with Real-World Entity Queries Wenting Zhao Tanya Goyal Yu Ying Chiu Liwei Jiang Benjamin Newman ... Khyathi Chandu Ronan Le Bras Claire Cardie Yuntian Deng Yejin Choi HILM 84 11 0 24 Jul 2024
SAFETY-J: Evaluating Safety with Critique Yixiu Liu Yuxiang Zheng Shijie Xia Jiajun Li Yi Tu Chaoling Song Pengfei Liu ELM 55 2 0 24 Jul 2024
Stress-Testing Long-Context Language Models with Lifelong ICL and Task Haystack Xiaoyue Xu Qinyuan Ye Xiang Ren 127 10 0 23 Jul 2024
Consent in Crisis: The Rapid Decline of the AI Data Commons Shayne Longpre Robert Mahari Ariel N. Lee Campbell Lund Hamidah Oderinwale ... Hanlin Li Daphne Ippolito Sara Hooker Jad Kabbara Sandy Pentland 123 42 0 20 Jul 2024
Rel-A.I.: An Interaction-Centered Approach To Measuring Human-LM Reliance Kaitlyn Zhou Jena D. Hwang Xiang Ren Nouha Dziri Dan Jurafsky Maarten Sap 70 6 0 10 Jul 2024
PAS: Data-Efficient Plug-and-Play Prompt Augmentation System Miao Zheng H. Liang Fan Yang Haoze Sun Tianpeng Li ... Kun Fang Weipeng Chen Bin Cui Wentao Zhang Guosheng Dong RALM 128 3 0 08 Jul 2024
Distilling System 2 into System 1 Ping Yu Jing Xu Jason Weston Ilia Kulikov OffRL LRM 142 93 0 08 Jul 2024
Exploring Human-LLM Conversations: Mental Models and the Originator of Toxicity Johannes Schneider Arianna Casanova Flores Anne-Catherine Kranz 99 4 0 08 Jul 2024
On the Benchmarking of LLMs for Open-Domain Dialogue Evaluation John Mendonça A. Lavie Isabel Trancoso ELM 47 3 0 04 Jul 2024
Why do LLaVA Vision-Language Models Reply to Images in English? Musashi Hinck Carolin Holtermann Matthew Lyle Olson Florian Schneider Sungduk Yu Anahita Bhiwandiwalla Anne Lauscher Shaoyen Tseng Vasudev Lal VLM 123 7 0 02 Jul 2024
The Art of Saying No: Contextual Noncompliance in Language Models Faeze Brahman Sachin Kumar Vidhisha Balachandran Pradeep Dasigi Valentina Pyatkin ... Jack Hessel Yulia Tsvetkov Noah A. Smith Yejin Choi Hannaneh Hajishirzi 137 32 0 02 Jul 2024
Scaling Synthetic Data Creation with 1,000,000,000 Personas Tao Ge Xin Chan Dian Yu Haitao Mi Dong Yu Dong Yu SyDa 227 150 0 28 Jun 2024
ScaleBiO: Scalable Bilevel Optimization for LLM Data Reweighting Boyao Wang Dylan Zhang Hanning Zhang Xingyuan Pan Minrui Xu Jipeng Zhang Renjie Pi Xiaoyu Wang Tong Zhang 135 10 0 28 Jun 2024
On the Transformations across Reward Model, Parameter Update, and In-Context Prompt Deng Cai Huayang Li Tingchen Fu Siheng Li Weiwen Xu ... Leyang Cui Yan Wang Lemao Liu Taro Watanabe Shuming Shi KELM 78 2 0 24 Jun 2024
M2Lingual: Enhancing Multilingual, Multi-Turn Instruction Alignment in Large Language Models Rishabh Maheshwary Vikas Yadav Hoang Nguyen Khyati Mahajan Sathwik Tejaswi Madhusudhan 123 3 0 24 Jun 2024
From Crowdsourced Data to High-Quality Benchmarks: Arena-Hard and BenchBuilder Pipeline Tianle Li Wei-Lin Chiang Evan Frick Lisa Dunlap Tianhao Wu Banghua Zhu Joseph E. Gonzalez Ion Stoica ALM 105 182 0 17 Jun 2024
Extrinsic Evaluation of Cultural Competence in Large Language Models Shaily Bhatt Fernando Diaz ELM EGVM 110 9 0 17 Jun 2024
The Right Time Matters: Data Arrangement Affects Zero-Shot Generalization in Instruction Tuning Bingxiang He Ning Ding Cheng Qian Jia Deng Ganqu Cui ... Longtao Huang Hui Xue Huimin Chen Zhiyuan Liu Maosong Sun 57 2 0 17 Jun 2024
Emerging Safety Attack and Defense in Federated Instruction Tuning of Large Language Models Rui Ye Jingyi Chai Xiangrui Liu Yaodong Yang Yanfeng Wang Siheng Chen AAML 146 10 0 15 Jun 2024
Magpie: Alignment Data Synthesis from Scratch by Prompting Aligned LLMs with Nothing Zhangchen Xu Fengqing Jiang Luyao Niu Yuntian Deng Radha Poovendran Yejin Choi Bill Yuchen Lin SyDa 117 161 0 12 Jun 2024