【论文阅读笔记】PARAMETER-EFFICIENT FINE-TUNING
各种轻量级微调方法的汇总
【论文阅读笔记】LORA:LOW-RANK ADAPTATION OF LARGE LANGUAGE MODELS
LoRA 是一种轻量级的大模型微调技术。
【论文阅读笔记】ATTENTION IS ALL YOUR NEED
记录这篇经典佳作:Attention is all your need.
TRIE树的定义与算法
算法:Trie 树
使用SENTENCEPIECE工具如何使用中文语料训练一个分词模型
什么是 sentencepiece 。
DEEP LEARNING: WHAT IS REGULARISATION ?
正则化的分类和优劣比较