【论文阅读笔记】PARAMETER-EFFICIENT FINE-TUNING

各种轻量级微调方法的汇总

【论文阅读笔记】LORA:LOW-RANK ADAPTATION OF LARGE LANGUAGE MODELS

LoRA 是一种轻量级的大模型微调技术。

【论文阅读笔记】ATTENTION IS ALL YOUR NEED

记录这篇经典佳作:Attention is all your need.

TRIE树的定义与算法

算法:Trie 树

使用SENTENCEPIECE工具如何使用中文语料训练一个分词模型

什么是 sentencepiece 。

DEEP LEARNING: WHAT IS REGULARISATION ?

正则化的分类和优劣比较