EvEval: A Comprehensive Evaluation of Event Semantics for Large Language
Models

EvEval: A Comprehensive Evaluation of Event Semantics for Large Language Models

24 May 2023

Papers citing "EvEval: A Comprehensive Evaluation of Event Semantics for Large Language Models"

9 / 9 papers shown

Title
Large Language Models for Link Stealing Attacks Against Graph Neural Networks Faqian Guan Tianqing Zhu Hui Sun Wanlei Zhou Philip S. Yu AAML 37 0 0 22 Jun 2024
ZC3: Zero-Shot Cross-Language Code Clone Detection Jia Li Chongyang Tao Zhi Jin F. Liu Jia Li Ge Li 37 7 0 26 Aug 2023
A Survey on Evaluation of Large Language Models Yu-Chu Chang Xu Wang Jindong Wang Yuanyi Wu Linyi Yang ... Yue Zhang Yi-Ju Chang Philip S. Yu Qian Yang Xingxu Xie ELM LM&MA ALM 69 1,513 0 06 Jul 2023
Generative Agents: Interactive Simulacra of Human Behavior J. Park Joseph C. O'Brien Carrie J. Cai Meredith Ringel Morris Percy Liang Michael S. Bernstein LM&Ro AI4CE 232 1,742 0 07 Apr 2023
Text and Patterns: For Effective Chain of Thought, It Takes Two to Tango Aman Madaan Amir Yazdanbakhsh LRM 151 116 0 16 Sep 2022
Chain-of-Thought Prompting Elicits Reasoning in Large Language Models Jason W. Wei Xuezhi Wang Dale Schuurmans Maarten Bosma Brian Ichter F. Xia Ed H. Chi Quoc Le Denny Zhou LM&Ro LRM AI4CE ReLM 379 8,495 0 28 Jan 2022
CodeXGLUE: A Machine Learning Benchmark Dataset for Code Understanding and Generation Shuai Lu Daya Guo Shuo Ren Junjie Huang Alexey Svyatkovskiy ... Nan Duan Neel Sundaresan Shao Kun Deng Shengyu Fu Shujie Liu ELM 201 1,105 0 09 Feb 2021
Temporal Reasoning on Implicit Events from Distant Supervision Ben Zhou Kyle Richardson Qiang Ning Tushar Khot Ashish Sabharwal Dan Roth 170 73 0 24 Oct 2020
GLUE: A Multi-Task Benchmark and Analysis Platform for Natural Language Understanding Alex Jinpeng Wang Amanpreet Singh Julian Michael Felix Hill Omer Levy Samuel R. Bowman ELM 297 6,959 0 20 Apr 2018