4.大模型微调技术LoRA

2024-06-12 00:24:01
开发
19

大模型低秩适配（LoRA）技术

现有PEFT 方法的局限与挑战

Adapter方法，通过增加模型深度而额外增加了模型推理延时。
Prompt Tuning、Prefix Tuning、P-Tuning等方法中的提示较难训练，同时缩短了模型可用的序列长度。
往往难以同时实现高效率和高质量，效果通常不及完全微调（full-finetuning）。
简而言之，尽管大模型参数规模巨大，但关键作用通常是由其中的低秩本质维度（lowintrinsic dimension）发挥的。
受此启发，微软提出了低秩适配（LoRA）方法，设计了特定结构，在涉及矩阵乘法的模块中引入两个低秩矩阵A和B以模拟完全微调过程。这相当于只对语言模型中起关键作用的低秩本质维度进行更新。

LoRA: 小模型有大智慧(2021)

请添加图片描述

为了使微调更加高效，LoRA的方法是通过低秩分解将权重更新表示为两个较小的矩阵（称为更新矩阵）。这些新矩阵可以在适应新数据的同时保持整体变化数量较少进行训练。
原始权重矩阵保持冻结状态，并且不再接受任何进一步的调整。最终结果是通过将原始权重和适应后的权重进行组合得到。

请添加图片描述

LoRA 核心技术揭秘

在LoRA方法中，实际上是在原始预训练语言模型（PLM）旁增加一个附加的网络通路，这可以视作一种“外挂”结构。这个外挂结构的目的是通过两个矩阵A和B的相乘来模拟本征秩（intrinsic rank）。

整体设计：（两个小模型）输入和输出的维度均为d，这与预训练模型层的维度相同。
低秩分解：A矩阵会将输入的d维数据降维至r维（增量矩阵的本征秩），r远小于d（r<< d）。矩阵计算从d x d变为d x r + r x d，减少了模型的参数量和计算量。
回映射：B矩阵将这些r维数据再映射回d维，以便与预训练模型的其他部分保持兼

原文地址:https://blog.csdn.net/YPeng_Gao/article/details/139563039 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：https://www.suanlizi.com/kf/1800564655018610688.html 如若内容造成侵权/违法违规/事实不符，请联系《酸梨子》网邮箱：1419361763@qq.com进行投诉反馈，一经查实，立即删除！

阅读全部

最近更新

题解 - 序列

2024-06-12 00:24:01 5 阅读
CST热仿真案例——电动车直流快充Cable热仿真

2024-06-12 00:24:01 5 阅读
docker php8.1+nginx base 镜像 dockerfile 配置

2024-06-12 00:24:01 5 阅读
Could not load dynamic library ‘cudart64_100.dll‘

2024-06-12 00:24:01 5 阅读
NoSQL之Redis非关系型数据库

2024-06-12 00:24:01 5 阅读
2024.7.22 作业

2024-06-12 00:24:01 6 阅读
GDB调试正在运行的程序

2024-06-12 00:24:01 3 阅读
昇思25天学习打卡营第18天| DCGAN生成漫画头像

2024-06-12 00:24:01 3 阅读
在Django里面运行非项目文件

2024-06-12 00:24:01 4 阅读
SSD基本架构与工作原理

2024-06-12 00:24:01 4 阅读
在誉天学习完HCIE就业吗？

2024-06-12 00:24:01 6 阅读
【合同专题】合同终止协议书、项目合作协议、交底纪要、管理台账

2024-06-12 00:24:01 3 阅读
驾驭云原生日志洪流：高效分析与管理的策略集

2024-06-12 00:24:01 4 阅读
go 协程池的实现

2024-06-12 00:24:01 3 阅读
Shell脚本循环语句与函数

2024-06-12 00:24:01 4 阅读
连锁店收银系统源码（收银称重pos+聚合支付+ERP进销存+营销+会员管理）

2024-06-12 00:24:01 5 阅读
TIA博途V19无法勾选来自远程对象的PUT/GET访问的解决办法

2024-06-12 00:24:01 5 阅读
四大引用——强软弱虚

2024-06-12 00:24:01 4 阅读
Python语言-面向对象

2024-06-12 00:24:01 5 阅读
如何分清楚常见的 Git 分支管理策略Git Flow、GitHub Flow 和 GitLab Flow

2024-06-12 00:24:01 5 阅读
网站安全-CDN篇

2024-06-12 00:24:01 5 阅读