v1v2 (latest)

Few-Shot Anaphora Resolution in Scientific Protocols via Mixtures of In-Context Experts

7 October 2022

Papers citing "Few-Shot Anaphora Resolution in Scientific Protocols via Mixtures of In-Context Experts"

38 / 38 papers shown

Title
Scoring Coreference Chains with Split-Antecedent Anaphors Silviu Paun Juntao Yu N. Moosavi Massimo Poesio 58 9 0 24 May 2022
What GPT Knows About Who is Who Xiaohan Yang Eduardo Peynetti Vasco Meerman Christy Tanner 183 14 0 16 May 2022
Few-Shot Parameter-Efficient Fine-Tuning is Better and Cheaper than In-Context Learning Haokun Liu Derek Tam Mohammed Muqeeth Jay Mohta Tenghao Huang Joey Tianyi Zhou Colin Raffel 104 921 0 11 May 2022
OPT: Open Pre-trained Transformer Language Models Susan Zhang Stephen Roller Naman Goyal Mikel Artetxe Moya Chen ... Daniel Simig Punit Singh Koura Anjali Sridhar Tianlu Wang Luke Zettlemoyer VLM OSLM AI4CE 338 3,685 0 02 May 2022
Co-training Improves Prompt-based Learning for Large Language Models Hunter Lang Monica Agrawal Yoon Kim David Sontag VLM LRM 197 40 0 02 Feb 2022
LMTurk: Few-Shot Learners as Crowdsourcing Workers in a Language-Model-as-a-Service Framework Mengjie Zhao Fei Mi Yasheng Wang Minglei Li Xin Jiang Qun Liu Hinrich Schütze RALM 80 11 0 14 Dec 2021
GLaM: Efficient Scaling of Language Models with Mixture-of-Experts Nan Du Yanping Huang Andrew M. Dai Simon Tong Dmitry Lepikhin ... Kun Zhang Quoc V. Le Yonghui Wu Zhiwen Chen Claire Cui ALM MoE 222 819 0 13 Dec 2021
MetaICL: Learning to Learn In Context Sewon Min M. Lewis Luke Zettlemoyer Hannaneh Hajishirzi LRM 219 490 0 29 Oct 2021
Multitask Prompted Training Enables Zero-Shot Task Generalization Victor Sanh Albert Webson Colin Raffel Stephen H. Bach Lintang Sutawika ... T. Bers Stella Biderman Leo Gao Thomas Wolf Alexander M. Rush LRM 348 1,706 0 15 Oct 2021
Pre-train or Annotate? Domain Adaptation with a Constrained Budget Fan Bai Alan Ritter Wei Xu 98 32 0 10 Sep 2021
DEMix Layers: Disentangling Domains for Modular Language Modeling Suchin Gururangan Michael Lewis Ari Holtzman Noah A. Smith Luke Zettlemoyer KELM MoE 99 136 0 11 Aug 2021
Noisy Channel Language Model Prompting for Few-Shot Text Classification Sewon Min Michael Lewis Hannaneh Hajishirzi Luke Zettlemoyer VLM 81 220 0 09 Aug 2021
True Few-Shot Learning with Language Models Ethan Perez Douwe Kiela Kyunghyun Cho 135 439 0 24 May 2021
Fantastically Ordered Prompts and Where to Find Them: Overcoming Few-Shot Prompt Order Sensitivity Yao Lu Max Bartolo Alastair Moore Sebastian Riedel Pontus Stenetorp AILaw LRM 406 1,193 0 18 Apr 2021
The Power of Scale for Parameter-Efficient Prompt Tuning Brian Lester Rami Al-Rfou Noah Constant VPVLM 579 4,077 0 18 Apr 2021
Adapting Coreference Resolution Models through Active Learning Michelle Yuan Patrick Xia Chandler May Benjamin Van Durme Jordan L. Boyd-Graber 41 20 0 15 Apr 2021
Learning How to Ask: Querying LMs with Mixtures of Soft Prompts Guanghui Qin J. Eisner 63 547 0 14 Apr 2021
Process-Level Representation of Scientific Protocols with Interactive Annotation Ronen Tamari Fan Bai Alan Ritter Gabriel Stanovsky 49 19 0 25 Jan 2021
What Makes Good In-Context Examples for GPT- $3$ ? Jiachang Liu Dinghan Shen Yizhe Zhang Bill Dolan Lawrence Carin Weizhu Chen AAML RALM 388 1,387 0 17 Jan 2021
The Pile: An 800GB Dataset of Diverse Text for Language Modeling Leo Gao Stella Biderman Sid Black Laurence Golding Travis Hoppe ... Horace He Anish Thite Noa Nabeshima Shawn Presser Connor Leahy AIMat 452 2,113 0 31 Dec 2020
Making Pre-trained Language Models Better Few-shot Learners Tianyu Gao Adam Fisch Danqi Chen 402 1,971 0 31 Dec 2020
Free the Plural: Unrestricted Split-Antecedent Anaphora Resolution Juntao Yu N. Moosavi Silviu Paun Massimo Poesio 62 14 0 31 Oct 2020
It's Not Just Size That Matters: Small Language Models Are Also Few-Shot Learners Timo Schick Hinrich Schütze 130 974 0 15 Sep 2020
Language Models are Few-Shot Learners Tom B. Brown Benjamin Mann Nick Ryder Melanie Subbiah Jared Kaplan ... Christopher Berner Sam McCandlish Alec Radford Ilya Sutskever Dario Amodei BDL 835 42,332 0 28 May 2020
CORD-19: The COVID-19 Open Research Dataset Lucy Lu Wang Kyle Lo Yoganand Chandrasekhar Russell Reas Jiangjiang Yang ... Boya Xie Douglas A. Raymond Daniel S. Weld Oren Etzioni Sebastian Kohlmeier 98 811 0 22 Apr 2020
REALM: Retrieval-Augmented Language Model Pre-Training Kelvin Guu Kenton Lee Zora Tung Panupong Pasupat Ming-Wei Chang RALM 140 2,114 0 10 Feb 2020
Exploiting Cloze Questions for Few Shot Text Classification and Natural Language Inference Timo Schick Hinrich Schütze 348 1,617 0 21 Jan 2020
How Can We Know What Language Models Know? Zhengbao Jiang Frank F. Xu Jun Araki Graham Neubig KELM 138 1,409 0 28 Nov 2019
Coreference Resolution as Query-based Span Prediction Wei Wu Fei Wang Arianna Yuan Leilei Gan Jiwei Li LRM 84 180 0 05 Nov 2019
Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer Colin Raffel Noam M. Shazeer Adam Roberts Katherine Lee Sharan Narang Michael Matena Yanqi Zhou Wei Li Peter J. Liu AIMat 450 20,298 0 23 Oct 2019
DistilBERT, a distilled version of BERT: smaller, faster, cheaper and lighter Victor Sanh Lysandre Debut Julien Chaumond Thomas Wolf 234 7,547 0 02 Oct 2019
TinyBERT: Distilling BERT for Natural Language Understanding Xiaoqi Jiao Yichun Yin Lifeng Shang Xin Jiang Xiao Chen Linlin Li F. Wang Qun Liu VLM 109 1,869 0 23 Sep 2019
Mixture Content Selection for Diverse Sequence Generation Jaemin Cho Minjoon Seo Hannaneh Hajishirzi 53 61 0 04 Sep 2019
Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks Nils Reimers Iryna Gurevych 1.3K 12,295 0 27 Aug 2019
The Materials Science Procedural Text Corpus: Annotating Materials Synthesis Procedures with Shallow Semantic Structures Sheshera Mysore Z. Jensen Edward J. Kim Kevin Huang Haw-Shiuan Chang Emma Strubell Jeffrey Flanigan Andrew McCallum E. Olivetti 60 97 0 16 May 2019
The Curious Case of Neural Text Degeneration Ari Holtzman Jan Buys Li Du Maxwell Forbes Yejin Choi 190 3,201 0 22 Apr 2019
An Annotated Corpus for Machine Reading of Instructions in Wet Lab Protocols Chaitanya Kulkarni Wei Xu Alan Ritter R. Machiraju 69 62 0 01 May 2018
Outrageously Large Neural Networks: The Sparsely-Gated Mixture-of-Experts Layer Noam M. Shazeer Azalia Mirhoseini Krzysztof Maziarz Andy Davis Quoc V. Le Geoffrey E. Hinton J. Dean MoE 251 2,683 0 23 Jan 2017