每天一个大模型相关知识点系列--Lora微调-程序员充电站

大模型微调通常发生在预训练模型完成之后，通过在特定任务或领域数据上进行再训练，使模型具备特定的下游任务能力或注入领域知识。然而，由于大规模语言模型参数量巨大，全量微调需要显著的计算资源和存储开销，在多任务或多场景设置下成本较高，且模型参数难以复用。因此，近年来提出了多种参数高效微调方法，其中 LoRA 是一种代表性方法。

LoRA（Low-Rank Adaptation of Large Language Models）并不直接改变预训练模型参数的秩，而是对模型参数更新施加低秩约束。具体而言，在 LoRA 微调过程中，预训练模型的原始参数被冻结，仅在模型中的线性层上引入可训练的低秩适配模块。

对于一个权重矩阵W∈Rm×n 的线性层，LoRA 将其参数更新表示为一个低秩矩阵

ΔW=BA,

其中 A∈Rr×n，B∈Rm×r，且r≪min(m,n)。在训练过程中，仅优化 A 和 B，而原始权重W 保持不变。模型的实际权重为

W′=W+(r\α)BA,

其中 α 为缩放系数。

通过这种方式，LoRA 在显著减少可训练参数数量和计算开销的同时，能够在较大程度上保持模型的原有能力，并实现有效的任务适配。

论文文献引用格式最新规范流出，毕业季限时必看！

毕业季倒计时已敲响，最后3周是决定你能否顺利提交论文的关键窗口。更令人焦虑的是：2025最新版文献引用规范已在学术圈悄然流传，不少高校图书馆与导师群已发出紧急通知——不按新规排版，轻则格式扣分，重则查重率飙升导致…

李华

C++11 -- lambda、包装器和可变参数模板

目录 1、lambda表达式 1.1 语法 1.2 捕捉列表 1.3 原理 1.4 捕捉列表 VS 函数参数 1.5 Lambda 在实际开发中的典型应用 2、包装器 2.1 function 2.2 bind 3、可变参数模板 3.1 概念与使用 3.2 包扩展 1、lambda表达式 1.1 语法 # Lambda 表达式本质上是一个匿名函…