Papers citing "Language Models are Few-Shot Learners"

50 / 12,394 papers shown

Title
Visual Programming: Compositional visual reasoning without training Tanmay Gupta Aniruddha Kembhavi ReLM VLM LRM 174 439 0 18 Nov 2022
Indexing AI Risks with Incidents, Issues, and Variants Sean McGregor Kevin Paeth Khoa T Lam 31 5 0 18 Nov 2022
GENIUS: Sketch-based Language Model Pre-training via Extreme and Selective Masking for Text Generation and Augmentation Biyang Guo Yeyun Gong Yelong Shen Songqiao Han Hailiang Huang Nan Duan Weizhu Chen VLM 80 19 0 18 Nov 2022
Context Variance Evaluation of Pretrained Language Models for Prompt-based Biomedical Knowledge Probing Zonghai Yao Yi Cao Zhichao Yang Hong-ye Yu 100 17 0 18 Nov 2022
3d human motion generation from the text via gesture action classification and the autoregressive model Gwantae Kim Youngsuk Ryu Junyeop Lee D. Han Jeongmin Bae Hanseok Ko 34 2 0 18 Nov 2022
CAPE: Corrective Actions from Precondition Errors using Large Language Models S. S. Raman Vanya Cohen Ifrah Idrees Eric Rosen Ray Mooney Stefanie Tellex D. Paulius LLMAG VLM 90 35 0 17 Nov 2022
Data-Centric Debugging: mitigating model failures via targeted data collection Sahil Singla Atoosa Malemir Chegini Mazda Moayeri Soheil Feiz 99 4 0 17 Nov 2022
Robust Vocal Quality Feature Embeddings for Dysphonic Voice Detection Jianwei Zhang J. Liss Suren Jayasuriya Visar Berisha 66 8 0 17 Nov 2022
InstructPix2Pix: Learning to Follow Image Editing Instructions Tim Brooks Aleksander Holynski Alexei A. Efros DiffM 277 1,842 0 17 Nov 2022
CAE v2: Context Autoencoder with CLIP Target Xinyu Zhang Jiahui Chen Junkun Yuan Qiang Chen Jian Wang ... Jimin Pi Kun Yao Junyu Han Errui Ding Jingdong Wang VLM CLIP 109 24 0 17 Nov 2022
Efficient Transformers with Dynamic Token Pooling Piotr Nawrot J. Chorowski Adrian Lañcucki Edoardo Ponti 83 46 0 17 Nov 2022
VeLO: Training Versatile Learned Optimizers by Scaling Up Luke Metz James Harrison C. Freeman Amil Merchant Lucas Beyer ... Naman Agrawal Ben Poole Igor Mordatch Adam Roberts Jascha Narain Sohl-Dickstein 138 60 0 17 Nov 2022
UPTON: Preventing Authorship Leakage from Public Text Release via Data Poisoning Ziyao Wang Thai Le Dongwon Lee 79 1 0 17 Nov 2022
Cross-Modal Adapter for Text-Video Retrieval Haojun Jiang Jianke Zhang Rui Huang Chunjiang Ge Zanlin Ni Jiwen Lu Jie Zhou S. Song Gao Huang 136 38 0 17 Nov 2022
Ignore Previous Prompt: Attack Techniques For Language Models Fábio Perez Ian Ribeiro SILM 106 452 0 17 Nov 2022
On the Effect of Pre-training for Transformer in Different Modality on Offline Reinforcement Learning S. Takagi OffRL 70 8 0 17 Nov 2022
Execution-based Evaluation for Data Science Code Generation Models Junjie Huang Chenglong Wang Jipeng Zhang Cong Yan Haotian Cui J. Inala Colin B. Clement Nan Duan Jianfeng Gao ELM 96 36 0 17 Nov 2022
CapEnrich: Enriching Caption Semantics for Web Images via Cross-modal Pre-trained Knowledge Linli Yao Wei Chen Qin Jin VLM 121 11 0 17 Nov 2022
Reflect, Not Reflex: Inference-Based Common Ground Improves Dialogue Response Quality Pei Zhou Hyundong Justin Cho Pegah Jandaghi Dong-Ho Lee Bill Yuchen Lin Jay Pujara Xiang Ren 84 31 0 16 Nov 2022
Learning unfolded networks with a cyclic group structure Emmanouil Theodosis Demba E. Ba 43 0 0 16 Nov 2022
Prompt Tuning for Parameter-efficient Medical Image Segmentation Marc Fischer Alexander Bartler Bin Yang SSeg 61 21 0 16 Nov 2022
Deep Emotion Recognition in Textual Conversations: A Survey Patrícia Pereira Helena Moniz Joao Paulo Carvalho 97 18 0 16 Nov 2022
On Measuring the Intrinsic Few-Shot Hardness of Datasets Xinran Zhao Shikhar Murty Christopher D. Manning 35 5 0 16 Nov 2022
Prompting PaLM for Translation: Assessing Strategies and Performance David Vilar Markus Freitag Colin Cherry Jiaming Luo Viresh Ratnakar George F. Foster LRM 114 167 0 16 Nov 2022
Galactica: A Large Language Model for Science Ross Taylor Marcin Kardas Guillem Cucurull Thomas Scialom Anthony Hartshorn Elvis Saravia Andrew Poulton Viktor Kerkez Robert Stojnic ELM ReLM 131 785 0 16 Nov 2022
Learning Reward Functions for Robotic Manipulation by Observing Humans Minttu Alakuijala Gabriel Dulac-Arnold Julien Mairal Jean Ponce Cordelia Schmid OffRL 77 27 0 16 Nov 2022
Towards Robust Low-Resource Fine-Tuning with Multi-View Compressed Representations Linlin Liu Xingxuan Li Megh Thakkar Xin Li Shafiq Joty Luo Si Lidong Bing 86 2 0 16 Nov 2022
GAMMT: Generative Ambiguity Modeling Using Multiple Transformers Xingcheng Xu 81 0 0 16 Nov 2022
Hybrid Transformers for Music Source Separation Simon Rouard Francisco Massa Alexandre Défossez 78 147 0 15 Nov 2022
ParticleGrid: Enabling Deep Learning using 3D Representation of Materials Shehtab Zaman E. Ferguson Cécile Pereira D. Akhiyarov Mauricio Araya-Polo Kenneth Chiu DiffM AI4CE 73 2 0 15 Nov 2022
On the Compositional Generalization Gap of In-Context Learning Arian Hosseini Ankit Vani Dzmitry Bahdanau Alessandro Sordoni Rameswar Panda 75 25 0 15 Nov 2022
ED-FAITH: Evaluating Dialogue Summarization on Faithfulness Sicong Huang Asli Celikyilmaz Haoran Li HILM 54 4 0 15 Nov 2022
PromptCap: Prompt-Guided Task-Aware Image Captioning Yushi Hu Hang Hua Zhengyuan Yang Weijia Shi Noah A. Smith Jiebo Luo 115 106 0 15 Nov 2022
kogito: A Commonsense Knowledge Inference Toolkit Mete Ismayilzada Antoine Bosselut 71 7 0 15 Nov 2022
Large Language Models Struggle to Learn Long-Tail Knowledge Nikhil Kandpal H. Deng Adam Roberts Eric Wallace Colin Raffel RALM KELM 145 419 0 15 Nov 2022
PARTNR: Pick and place Ambiguity Resolving by Trustworthy iNteractive leaRning Jelle Luijkx Zlatan Ajanović L. Ferranti Jens Kober 42 4 0 15 Nov 2022
QAmeleon: Multilingual QA with Only 5 Examples Priyanka Agrawal Chris Alberti Fantine Huot Joshua Maynez Ji Ma Sebastian Ruder Kuzman Ganchev Dipanjan Das Mirella Lapata 67 30 0 15 Nov 2022
Masked Reconstruction Contrastive Learning with Information Bottleneck Principle Ziwen Liu Bonan li Congying Han Tiande Guo Xuecheng Nie SSL 66 2 0 15 Nov 2022
Self-supervised remote sensing feature learning: Learning Paradigms, Challenges, and Future Works Chao Tao Ji Qi Mingning Guo Qing Zhu Haifeng Li SSL 104 59 0 15 Nov 2022
HeatViT: Hardware-Efficient Adaptive Token Pruning for Vision Transformers Zhaoyang Han Mengshu Sun Alec Lu Yanyue Xie Li-Yu Daisy Liu ... Xin Meng Zechao Li Xue Lin Zhenman Fang Yanzhi Wang ViT 97 71 0 15 Nov 2022
A Universal Discriminator for Zero-Shot Generalization Haike Xu Zongyu Lin Jing Zhou Yanan Zheng Zhilin Yang AI4CE 64 16 0 15 Nov 2022
GLUE-X: Evaluating Natural Language Understanding Models from an Out-of-distribution Generalization Perspective Linyi Yang Shuibai Zhang Libo Qin Yafu Li Yidong Wang Hanmeng Liu Jindong Wang Xingxu Xie Yue Zhang ELM 188 82 0 15 Nov 2022
Cheater's Bowl: Human vs. Computer Search Strategies for Open-Domain Question Answering Wanrong He Andrew Mao Jordan L. Boyd-Graber 70 0 0 15 Nov 2022
FedTune: A Deep Dive into Efficient Federated Fine-Tuning with Pre-trained Transformers Jinyu Chen Wenchao Xu Song Guo Junxiao Wang Jie Zhang Yining Qi FedML 83 36 0 15 Nov 2022
Contextual Transformer for Offline Meta Reinforcement Learning Runji Lin Ye Li Xidong Feng Zhaowei Zhang Xian Hong Wu Fung Haifeng Zhang Jun Wang Yali Du Yaodong Yang OffRL 76 7 0 15 Nov 2022
Teaching Algorithmic Reasoning via In-context Learning Hattie Zhou Azade Nova Hugo Larochelle Rameswar Panda Behnam Neyshabur Hanie Sedghi LRM ReLM 114 117 0 15 Nov 2022
A Survey for Efficient Open Domain Question Answering Qin Zhang Shan Chen Dongkuan Xu Qingqing Cao Xiaojun Chen Trevor Cohn Meng Fang 90 36 0 15 Nov 2022
Evaluating How Fine-tuning on Bimodal Data Effects Code Generation Gabriel Orlanski Seonhye Yang Michael Healy ALM 57 5 0 15 Nov 2022
Prompting Language Models for Linguistic Structure Terra Blevins Hila Gonen Luke Zettlemoyer LRM 125 44 0 15 Nov 2022
Logical Tasks for Measuring Extrapolation and Rule Comprehension Ippei Fujisawa Ryota Kanai ELM LRM 71 4 0 14 Nov 2022