哈工大：2025年大语言模型进展报告-程序员充电站

这份哈工大 2025 年大语言模型进展报告，核心是系统梳理了 2025 年 LLM 从技术架构、训练、部署、智能体、应用、评测、安全到未来趋势的全维度突破，可概括为以下 8 大核心要点：

一、模型架构：从 “堆规模” 转向 “高效率、强统一”

注意力机制：优化 KV 缓存、解决长文本 “中间遗忘”，混合 RoPE 与无位置编码成为主流

稀疏建模：从静态转向动态 Token 级稀疏，大幅降低长文本计算成本

混合专家 MoE：确立 “高参数量、低激活量” 范式，Sigmoid 路由 + 负载均衡成熟，端侧 MoE 开始落地

状态化建模：Mamba 等线性架构 + 全局注意力混合架构成为效率最优解

多模态：从 “外挂视觉” 升级为原生统一架构，感官解耦、思维统一

新方向：扩散语言模型、动态计算、嵌套学习挑战 Transformer

二、模型训练：推理能力爆发，RL 成核心引擎

SFT：LORA 持续进化，参数量更少、收敛更快，解决灾难性遗忘

强化学习爆发：RLVR 可验证奖励成为 2025 年关键，数学 / 代码推理能力暴涨

数据：预训练 / 中训练 / 后训练三级体系成型，长文本、推理、代码数据爆发

能力提升：长上下文、复杂推理、数学代码、工具调用、智能体强化学习五大方向全面突破

训练框架：VeRL、ROLL、OpenRLHF 等开源框架成熟，支持超大模型高效训练

三、模型部署：突破显存墙，全链路软硬协同

压缩：量化突破 2bit 极限，剪枝追求真实速度提升，蒸馏重点迁移推理能力

加速：投机解码走向语义宽松验证，KV 缓存实现超低比特 + 稀疏压缩

框架：vLLM、SGLang、TensorRT-LLM、llama.cpp、Ollama 分层适配云端 / 端侧

核心目标：低成本、低延迟、高吞吐，支持百万 Token 长上下文

四、智能体 Agent：从 “工具调用” 走向 “自主进化”

自主规划：任务分解、环境记忆、自我反思三大能力成熟

工具链：MCP 协议统一工具标准，多智能体协同、多模态工具成为主流

RAG：全链路优化、自适应检索、多智能体 RAG、多模态 RAG 全面升级

长期记忆：独立记忆模块成型，支持文本 / 图谱 / 多模态存储检索

自我修正 / 进化：模型原生反思、迭代控制、自我进化，智能体可自主优化能力

GUI 智能体：桌面 / 手机 / 网页自动化成熟，可像人一样操作电脑

五、应用落地：全行业渗透

通用应用：编程、写作、设计、心理咨询、深度调研、科研助手

行业应用：教育、医疗、金融、法律、农业全覆盖

核心价值：从对话助手转向生产力工具、行业专家、自主执行体

六、评测与生态：标准完善，国产开源崛起

评测基准：多轮对话、工具使用、智能体、多模态四大评测体系建立

模型生态：闭源模型性能登顶，国产开源模型全面崛起

能力榜单：语言、视觉、语音、编程、数学、推理、智能体全面排名

七、安全与伦理：对齐、风控、溯源体系成型

安全对齐：训练 + 推理双阶段风险控制

内容可信：水印、可验证生成、溯源体系建立

攻击防御：提示词安全、数据安全、隐私保护

宪法 AI：规则化 AI 治理成为趋势

八、未来趋势：走向主动智能体与世界模型

模型从规模优先转向智能密度优先

应用从被动应答转向主动智能体

技术走向云边协同、世界模型、具身智能

挑战：算力不均、安全伦理、跨学科融合

3小时变30分钟：这款免费工具让你的桌游卡牌设计效率提升600%

3小时变30分钟：这款免费工具让你的桌游卡牌设计效率提升600% 【免费下载链接】CardEditor 一款专为桌游设计师开发的批处理数值填入卡牌生成器/A card batch generator specially developed for board game designers 项目地址: https://gitcode.com/gh_mirrors/c…

李华

抖音内容保存终极指南：如何用开源工具快速下载视频、图集和直播回放

抖音内容保存终极指南：如何用开源工具快速下载视频、图集和直播回放【免费下载链接】douyin-downloader A practical Douyin downloader for both single-item and profile batch downloads, with progress display, retries, SQLite deduplication, and browser f…

李华

从零配置到安全加固：手把手教你用ipmitool设置BMC独立管理网络

从零配置到安全加固：手把手教你用ipmitool设置BMC独立管理网络第一次接触服务器带外管理时，我被机柜后面那排神秘的网络接口搞懵了——为什么有的服务器有两个管理网口？为什么有些运维同事坚持要用独立的管理网络？直到一次机房断…

李华

从零到精通：Windows系统res-downloader证书配置完全实战手册

从零到精通：Windows系统res-downloader证书配置完全实战手册【免费下载链接】res-downloader 视频号、小程序、抖音、快手、小红书、直播流、m3u8、酷狗、QQ音乐等常见网络资源下载! 项目地址: https://gitcode.com/GitHub_Trending/re/res-downloader 在Wi…

李华

全网最细！网安 5 大子方向对比，从入门到就业帮你精准定位

写在前面近两年，《数据安全法》、《个人信息保护法》的相继出台，网络空间安全专业越来越受到国家政策的支持，越来越多的同学想要攻读网络安全专业，那么问题来了，网安研究生哪个方向更具有前景呢？ 1.网安…

李华

学术“变形记”：书匠策AI如何让期刊论文写作从“地狱模式”变“开挂模式”

在学术圈，写期刊论文常被戏称为“学术版西天取经”——选题是九九八十一难的第一关，文献是迷雾重重的火焰山，逻辑是盘丝洞的蛛网，格式则是通天河的最后一劫。但如今，一位名为书匠策AI的“学术孙悟空”横空出世&#xf…

李华