Efficient and Effective Text Encoding for Chinese LLaMA and Alpaca

17 April 2023

Papers citing "Efficient and Effective Text Encoding for Chinese LLaMA and Alpaca"

45 / 45 papers shown

Title
HYPEROFA: Expanding LLM Vocabulary to New Languages via Hypernetwork-Based Embedding Initialization Enes Özeren Yihong Liu Hinrich Schütze 36 0 0 21 Apr 2025
CARE: Aligning Language Models for Regional Cultural Awareness Geyang Guo Tarek Naous Hiromi Wakaki Yukiko Nishimura Yuki Mitsufuji Alan Ritter Wei-ping Xu 54 0 0 07 Apr 2025
TituLLMs: A Family of Bangla LLMs with Comprehensive Benchmarking Shahriar Kabir Nahin R. N. Nandi Sagor Sarker Quazi Sarwar Muhtaseem Md. Kowsher Apu Chandraw Shill Md Ibrahim Mehadi Hasan Menon Tareq Al Muntasir Firoj Alam 68 0 0 24 Feb 2025
UrduLLaMA 1.0: Dataset Curation, Preprocessing, and Evaluation in Low-Resource Settings Layba Fiaz Munief Hassan Tahir Sana Shams Sarmad Hussain 51 0 0 24 Feb 2025
Improving Natural Language Understanding for LLMs via Large-Scale Instruction Synthesis Lin Yuan Jun Xu Honghao Gui Mengshu Sun Qing Cui Lei Liang Jun Zhou AI4CE 231 0 0 06 Feb 2025
Multilingual Machine Translation with Open Large Language Models at Practical Scale: An Empirical Study Menglong Cui Pengzhi Gao Wei Liu Jian Luan Bin Wang LRM 45 2 0 04 Feb 2025
Classic4Children: Adapting Chinese Literary Classics for Children with Large Language Model Jiali Chen Xusen Hei Yuqi Xue Zihan Wu Jiayuan Xie Yi Cai AI4Ed 96 0 0 03 Feb 2025
WisdomBot: Tuning Large Language Models with Artificial Intelligence Knowledge Jingyuan Chen Tao Wu Wei Ji Fei Wu 46 0 0 22 Jan 2025
LicenseGPT: A Fine-tuned Foundation Model for Publicly Available Dataset License Compliance Jingwen Tan Gopi Krishnan Rajbahadur Zi Li Xiangfu Song Jianshan Lin Dan Li Zibin Zheng Ahmed E. Hassan 54 1 0 03 Jan 2025
Facilitating large language model Russian adaptation with Learned Embedding Propagation Mikhail Tikhomirov D. Chernyshev 43 1 0 31 Dec 2024
Extending LLMs to New Languages: A Case Study of Llama and Persian Adaptation Samin Mahdizadeh Sani Pouya Sadeghi Thuy-Trang Vu Yadollah Yaghoobzadeh Gholamreza Haffari 76 2 0 17 Dec 2024
EventSum: A Large-Scale Event-Centric Summarization Dataset for Chinese Multi-News Documents Mengna Zhu Kaisheng Zeng Mao Wang Kaiming Xiao Lei Hou Hongbin Huang Juanzi Li 224 1 0 16 Dec 2024
Adapting Multilingual LLMs to Low-Resource Languages using Continued Pre-training and Synthetic Corpus Raviraj Joshi Kanishk Singla Anusha Kamath Raunak Kalani Rakesh Paul Utkarsh Vaidya Sanjay Singh Chauhan Niranjan Wartikar Eileen Long SyDa CLL 35 2 0 18 Oct 2024
Converging to a Lingua Franca: Evolution of Linguistic Regions and Semantics Alignment in Multilingual Large Language Models Hongchuan Zeng Senyu Han Lu Chen Kai Yu 62 6 0 15 Oct 2024
Efficiently Democratizing Medical LLMs for 50 Languages via a Mixture of Language Family Experts Guorui Zheng Xidong Wang Juhao Liang Nuo Chen Yuping Zheng Benyou Wang MoE 35 5 0 14 Oct 2024
Table Question Answering for Low-resourced Indic Languages Vaishali Pal Evangelos Kanoulas Andrew Yates Maarten de Rijke LMTD 31 0 0 04 Oct 2024
PersLLM: A Personified Training Approach for Large Language Models Zheni Zeng Jiayi Chen Huimin Chen Yukun Yan Yuxuan Chen Zhenghao Liu Zhiyuan Liu Maosong Sun LLMAG 52 2 0 17 Jul 2024
An Empirical Comparison of Vocabulary Expansion and Initialization Approaches for Language Models Nandini Mundra Aditya Nanda Kishore Raj Dabre Ratish Puduppully Anoop Kunchukuttan Mitesh Khapra 30 3 0 08 Jul 2024
A Three-Pronged Approach to Cross-Lingual Adaptation with Multilingual LLMs Vaibhav Singh Amrith Krishna Karthika NJ Ganesh Ramakrishnan 29 4 0 25 Jun 2024
Does Cross-Cultural Alignment Change the Commonsense Morality of Language Models? Yuu Jinnai 54 1 0 24 Jun 2024
CT-Eval: Benchmarking Chinese Text-to-Table Performance in Large Language Models Haoxiang Shi Jiaan Wang Jiarong Xu Cen Wang Tetsuya Sakai LMTD 28 0 0 20 May 2024
OpenLLM-Ro -- Technical Report on Open-source Romanian LLMs Mihai Masala Denis C. Ilie-Ablachim D. Corlatescu Miruna Zavelca Marius Leordeanu Horia Velicu Marius Popescu Mihai Dascalu Traian Rebedea 51 2 0 13 May 2024
Redefining Information Retrieval of Structured Database via Large Language Models Mingzhu Wang Yuzhe Zhang Qihang Zhao Juanyi Yang Hong Zhang RALM KELM 35 0 0 09 May 2024
Relay Decoding: Concatenating Large Language Models for Machine Translation Chengpeng Fu Xiaocheng Feng Yi-Chong Huang Wenshuai Huo Baohang Li Hui Wang Bing Qin Ting Liu 32 0 0 05 May 2024
A Novel Paradigm Boosting Translation Capabilities of Large Language Models Jiaxin Guo Hao Yang Zongyao Li Daimeng Wei Hengchao Shang Xiaoyu Chen 41 7 0 18 Mar 2024
UniCode: Learning a Unified Codebook for Multimodal Large Language Models Sipeng Zheng Bohan Zhou Yicheng Feng Ye Wang Zongqing Lu VLM MLLM 46 7 0 14 Mar 2024
Towards Training A Chinese Large Language Model for Anesthesiology Zhonghai Wang Jie Jiang Yibing Zhan Bohao Zhou Yanhong Li ... Liang Ding Hua Jin Jun Peng Xu Lin Weifeng Liu LM&MA 35 3 0 05 Mar 2024
LEIA: Facilitating Cross-lingual Knowledge Transfer in Language Models with Entity-based Data Augmentation Ikuya Yamada Ryokan Ri KELM 25 0 0 18 Feb 2024
TeenyTinyLlama: open-source tiny language models trained in Brazilian Portuguese N. Corrêa Sophia Falk Shiza Fatimah Aniket Sen N. D. Oliveira 30 9 0 30 Jan 2024
CORECODE: A Common Sense Annotated Dialogue Dataset with Benchmark Tasks for Chinese Large Language Models Dan Shi Chaobin You Jian-Tao Huang Taihao Li Deyi Xiong LRM 30 0 0 20 Dec 2023
Large Scale Foundation Models for Intelligent Manufacturing Applications: A Survey Haotian Zhang S. D. Semujju Zhicheng Wang Xianwei Lv Kang Xu ... Jing Wu Zhuo Long Wensheng Liang Xiaoguang Ma Ruiyan Zhuang UQCV AI4TS AI4CE 29 4 0 11 Dec 2023
How Vocabulary Sharing Facilitates Multilingualism in LLaMA? Fei Yuan Shuai Yuan Zhiyong Wu Lei Li 37 10 0 15 Nov 2023
Qilin-Med: Multi-stage Knowledge Injection Advanced Medical Large Language Model Qichen Ye Junling Liu Dading Chong Peilin Zhou Yining Hua ... Meng Cao Ziming Wang Xuxin Cheng Andrew Liu Zhenhua Guo AI4MH LM&MA ELM 30 20 0 13 Oct 2023
Reformulating Domain Adaptation of Large Language Models as Adapt-Retrieve-Revise Zhen Wan Yating Zhang Yexiang Wang Fei Cheng Sadao Kurohashi CLL AILaw 34 10 0 05 Oct 2023
LawBench: Benchmarking Legal Knowledge of Large Language Models Zhiwei Fei Xiaoyu Shen D. Zhu Fengzhe Zhou Zhuo Han Songyang Zhang Kai-xiang Chen Zongwen Shen Jidong Ge ELM AILaw 36 36 0 28 Sep 2023
Baichuan 2: Open Large-scale Language Models Ai Ming Yang Bin Xiao Bingning Wang Borong Zhang Ce Bian ... Youxin Jiang Yuchen Gao Yupeng Zhang Guosheng Dong Zhiying Wu ELM LRM 75 703 0 19 Sep 2023
Knowledge-tuning Large Language Models with Structured Medical Knowledge Bases for Reliable Response Generation in Chinese Hao Wang Sendong Zhao Zewen Qiang Zijian Li Nuwa Xi ... Haoqiang Guo Yuhan Chen Haoming Xu Bing Qin Ting Liu LM&MA AI4MH 31 17 0 08 Sep 2023
Supervised Learning and Large Language Model Benchmarks on Mental Health Datasets: Cognitive Distortions and Suicidal Risks in Chinese Social Media Hongzhi Qi Qing Zhao Jianqiang Li Changwei Song Wei-dong Zhai ... Y. Yu Fan Wang Huijing Zou Bing Xiang Yang Guanghui Fu AI4MH 29 12 0 07 Sep 2023
From Base to Conversational: Japanese Instruction Dataset and Tuning Large Language Models Masahiro Suzuki Masanori Hirano Hiroki Sakaji 39 6 0 07 Sep 2023
GPT Can Solve Mathematical Problems Without a Calculator Zhengyuan Yang Ming Ding Qingsong Lv Zhihuan Jiang Zehai He Yuyi Guo Jinfeng Bai Jie Tang RALM LRM 39 53 0 06 Sep 2023
Extrapolating Large Language Models to Non-English by Aligning Languages Wenhao Zhu Yunzhe Lv Qingxiu Dong Fei Yuan Jingjing Xu Shujian Huang Lingpeng Kong Jiajun Chen Lei Li 45 66 0 09 Aug 2023
CValues: Measuring the Values of Chinese Large Language Models from Safety to Responsibility Guohai Xu Jiayi Liu Mingshi Yan Haotian Xu Jinghui Si ... Rong Zhang Ji Zhang Chao Peng Feiyan Huang Jingren Zhou ALM ELM 36 74 0 19 Jul 2023
CephGPT-4: An Interactive Multimodal Cephalometric Measurement and Diagnostic System with Visual Large Language Model Lei Ma Jincong Han Zhaoxin Wang Dian Zhang LM&MA 25 8 0 01 Jul 2023
GLM-130B: An Open Bilingual Pre-trained Model Aohan Zeng Xiao Liu Zhengxiao Du Zihan Wang Hanyu Lai ... Jidong Zhai Wenguang Chen Peng-Zhen Zhang Yuxiao Dong Jie Tang BDL LRM 253 1,073 0 05 Oct 2022
Training language models to follow instructions with human feedback Long Ouyang Jeff Wu Xu Jiang Diogo Almeida Carroll L. Wainwright ... Amanda Askell Peter Welinder Paul Christiano Jan Leike Ryan J. Lowe OSLM ALM 363 12,003 0 04 Mar 2022