How to Make the Most of LLMs' Grammatical Knowledge for Acceptability Judgments

19 August 2024

Hidetaka Kamigaito

Taro Watanabe

ArXiv PDF HTML

Papers citing "How to Make the Most of LLMs' Grammatical Knowledge for Acceptability Judgments"

20 / 20 papers shown

Title
Evaluating LLMs on Chinese Topic Constructions: A Research Proposal Inspired by Tian et al. (2024) Xiaodong Yang 114 0 0 21 Apr 2025
PinLanding: Content-First Keyword Landing Page Generation via Multi-Modal AI for Web-Scale Discovery Faye Zhang Jasmine Wan Qianyu Cheng Jinfeng Rao 75 0 0 01 Mar 2025
Large Language Models Are Not Robust Multiple Choice Selectors Chujie Zheng Hao Zhou Fandong Meng Jie Zhou Minlie Huang 60 239 0 07 Sep 2023
Judging LLM-as-a-Judge with MT-Bench and Chatbot Arena Lianmin Zheng Wei-Lin Chiang Ying Sheng Siyuan Zhuang Zhanghao Wu ... Dacheng Li Eric Xing Haotong Zhang Joseph E. Gonzalez Ion Stoica ALM OSLM ELM 318 4,288 0 09 Jun 2023
Direct Preference Optimization: Your Language Model is Secretly a Reward Model Rafael Rafailov Archit Sharma E. Mitchell Stefano Ermon Christopher D. Manning Chelsea Finn ALM 322 3,935 0 29 May 2023
Towards Making the Most of ChatGPT for Machine Translation Keqin Peng Liang Ding Qihuang Zhong Li Shen Xuebo Liu Min Zhang Y. Ouyang Dacheng Tao LRM 109 228 0 24 Mar 2023
Towards a Unified Multi-Dimensional Evaluator for Text Generation Ming Zhong Yang Liu Da Yin Yuning Mao Yizhu Jiao Peng Liu Chenguang Zhu Heng Ji Jiawei Han ELM 67 272 0 13 Oct 2022
Finetuned Language Models Are Zero-Shot Learners Jason W. Wei Maarten Bosma Vincent Zhao Kelvin Guu Adams Wei Yu Brian Lester Nan Du Andrew M. Dai Quoc V. Le ALM UQCV 127 3,742 0 03 Sep 2021
Pre-train, Prompt, and Predict: A Systematic Survey of Prompting Methods in Natural Language Processing Pengfei Liu Weizhe Yuan Jinlan Fu Zhengbao Jiang Hiroaki Hayashi Graham Neubig VLM SyDa 191 3,964 0 28 Jul 2021
CLiMP: A Benchmark for Chinese Language Model Evaluation Beilei Xiang Changbing Yang Yu Li Alex Warstadt Katharina Kann ALM 34 41 0 26 Jan 2021
Measuring Massive Multitask Language Understanding Dan Hendrycks Collin Burns Steven Basart Andy Zou Mantas Mazeika D. Song Jacob Steinhardt ELM RALM 164 4,413 0 07 Sep 2020
Language Models are Few-Shot Learners Tom B. Brown Benjamin Mann Nick Ryder Melanie Subbiah Jared Kaplan ... Christopher Berner Sam McCandlish Alec Radford Ilya Sutskever Dario Amodei BDL 731 41,894 0 28 May 2020
Cross-Linguistic Syntactic Evaluation of Word Prediction Models Aaron Mueller Garrett Nicolai Panayiota Petrou-Zeniou N. Talmina Tal Linzen 63 56 0 01 May 2020
How Furiously Can Colourless Green Ideas Sleep? Sentence Acceptability in Context Jey Han Lau C. S. Armendariz Shalom Lappin Matthew Purver Chang Shu 29 41 0 02 Apr 2020
BLiMP: The Benchmark of Linguistic Minimal Pairs for English Alex Warstadt Alicia Parrish Haokun Liu Anhad Mohananey Wei Peng Sheng-Fu Wang Samuel R. Bowman 72 491 0 02 Dec 2019
Targeted Syntactic Evaluation of Language Models Rebecca Marvin Tal Linzen 72 415 0 27 Aug 2018
Neural Network Acceptability Judgments Alex Warstadt Amanpreet Singh Samuel R. Bowman 230 1,407 0 31 May 2018
GLUE: A Multi-Task Benchmark and Analysis Platform for Natural Language Understanding Alex Jinpeng Wang Amanpreet Singh Julian Michael Felix Hill Omer Levy Samuel R. Bowman ELM 1.1K 7,152 0 20 Apr 2018
Assessing the Ability of LSTMs to Learn Syntax-Sensitive Dependencies Tal Linzen Emmanuel Dupoux Yoav Goldberg 101 903 0 04 Nov 2016
Google's Neural Machine Translation System: Bridging the Gap between Human and Machine Translation Yonghui Wu M. Schuster Zhiwen Chen Quoc V. Le Mohammad Norouzi ... Alex Rudnick Oriol Vinyals G. Corrado Macduff Hughes J. Dean AIMat 891 6,787 0 26 Sep 2016