news 2026/4/19 18:08:50

收藏级指南|Agent Skills重塑AI协作:从对话式交互到工业化智能体

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
收藏级指南|Agent Skills重塑AI协作:从对话式交互到工业化智能体

过去两年,我们与AI的互动大多局限于“对话框交互”的浅层模式。无论是反复叮嘱AI“按公司编码规范审查这段代码”,还是要求“将原始数据按指定格式整理成周报”,这种依赖“一次性提示词”的工作方式,本质上效率低下且难以规模化落地。而随着Agent Skills开放标准的推出,AI智能体正式告别“野蛮生长”,迈入“持证上岗”的工业化应用新阶段,为开发者与小白提供了全新的AI协作范式。

一、Agent Skills是什么?

Agent Skills(智能体技能)是经过组织的一组文件集合,用于封装可组合的过程性知识,以供智能体调用和执行。从本质上讲,Agent Skills是一种可移植、可复用的专业知识包,旨在教会智能体“如何”执行特定的复杂任务

如果将通用大模型比作一名拥有广泛通识、但不懂公司具体流程的“新员工”,那么Agent Skills就是那份详尽的《入职手册与工具包》。它不再是零散的对话指令,而是一个结构化的文件夹,包含指令(Instructions)、脚本(Scripts)和资源(Resources)。这种设计将原本存储在人类大脑中的“隐性知识”,显性化为AI可读取、可执行的“程序性资产”。

Agent Skills是一个目录,包含一个 SKILL.md 文件,里面有有序的指令、脚本和资源 文件夹,为智能体提供额外功能。

在Agent Skills出现之前,开发者和用户面临着三个核心困境:

1、上下文膨胀(Context Bloat):为了让AI完成特定任务,用户往往需要注入长达几千行的系统提示词。这不仅消耗巨大的Token,还会导致模型响应性能下降。

2、重复劳动(Repetitive Prompting):同样的规范和工作流,在不同的对话窗口中需要反复输入。这种不透明且难以维护的模式,阻碍了团队间的知识共享。

3、工具断层(Tool Disconnection):智能体虽然拥有工具(如 MCP),但往往缺乏关于“何时”以及“如何”有效组合使用这些工具的过程性知识。

二、Agent Skills能干什么?

Agent Skills能够将一个通用的、只会“聊天”的 AI 瞬间转化为特定领域的“专家”:

1、注入领域专业知识:它可以是法律条文的审查专家、财务异常的审计员,或者是精通特定行业标准的数据分析师。

2、实现重复性工作流的标准化:例如,自动根据Jira票据生成积压工作(Backlog),或者按照公司特定的视觉规范生成PowerPoint演示文稿。

3、确定性的复杂运算:通过绑定Python或Bash脚本,AI可以执行精确的数学计算或文件处理,彻底告别模型在逻辑运算上的“幻觉”。

4、跨平台的能力流动:由于是开放标准,你编写的一项技能不仅可以在 Claude 中运行,也可以在微软的VS Code、OpenAI的ChatGPT或 Cursor中无缝迁移。

三、Agent Skills的架构:文件夹即大脑

Agent Skills 的魅力在于其简单而强大的文件结构,每个技能本质上都是一个“技能文件夹”:

1、大脑 (The Brain)-SKILL.md:这是唯一的必填文件。它通过YAML 元数据定义了技能的名称和描述,并包含Markdown格式的详细操作指南。

2、双手 (The Hands)-/scripts****目录:存放确定性的执行逻辑。当 AI 需要执行精确的数据转换或复杂的系统调用时,它会直接运行这些脚本。

3、图书馆 (The Library) -/references目录:存储仅在需要时才被引用的长文档,如API文档、数据库模式或法律规章。

4、模板 (The Templates)-/assets:包含静态资源文件,如 HTML 报告模板、图片素材或二进制文件。

四、工作原理与核心机制:优雅的“渐进式披露”

Agent Skills解决上下文膨胀(Context Bloat)的核心武器是“渐进式披露”(Progressive Disclosure)机制。它的执行逻辑分为三个层级:

1、第一层:元数据加载(Metadata):系统启动时,AI仅加载所有可用技能的名称和描述。这仅消耗极少的Token,足以让AI知道“我有这个本事”以及“该什么时候用它”。

2、第二层:按需触发(Instructions):当用户的指令(如“分析这份 PDF”)匹配到技能描述时,AI才会读取SKILL.md的完整指令内容并注入上下文。

3、第三层:深度加载(Resources & Code):只有当执行具体步骤需要时,AI才会进一步读取参考文件或运行配套脚本。

这种“按需索取”的模式确保了智能体在拥有成百上千个技能的同时,上下文窗口依然保持轻量和高效。

此外,它采用了双重消息策略(Dual-Message Strategy):一条消息在UI中可见,告知用户“技能正在加载”;另一条包含完整指令的消息对用户隐藏,实现了透明度与纯净界面的平衡。双重消息策略是一种面向智能体(Agent)与大模型系统的提示工程与控制架构模式,其核心思想是:将“能力定义”和“任务指令”分离为两条独立消息通道,分别管理长期行为约束与短期任务目标,从而提升系统的稳定性、可控性与可复用性。双重消息策略本质上是把“大脑的长期记忆(规则)”与“当前思考(任务)”解耦,让 智能体更稳定、更安全、更工程化,是构建可靠智能体系统的基础设计范式。

五、如何构建高质量的Agent Skills

构建技能就像是为“数字员工”编写《操作手册》,需遵循以下最佳实践:

1、精准的元数据描述description字段是AI检索的关键。必须明确告知 AI:这是什么技能?应该在什么时候使用? 例如,不要写“处理文档”,而应写“从PDF中提取表格并填充Excel表单”。

2、指令的原子化与结构化:在SKILL.md中使用祈使句(如“分析代码漏洞…”)而非描述性语言。利用标题、列表和代码块建立清晰的步骤层级。

3、确保可移植性:在引用技能内部的文件路径时,始终使用变量{baseDir},避免使用硬编码的绝对路径,确保技能在不同环境或容器中都能正常运行。

4、最小权限原则:利用allowed-tools字段严格限制技能可以使用的工具范围(如仅限只读操作),以降低安全风险。

六、Agent Skills实际应用典型场景

Agent Skills是一种轻量级的开放标准,通过将指令(Instructions)、脚本(Scripts)和资源(Resources)封装在特定文件夹中,赋予AI智能体执行复杂任务的专业能力。

以下是Agent Skills在实际应用的典型场景:

1、办公文档自动化处理 (最受欢迎的实例)

Anthropic官方预置了一系列文档技能,使AI能够直接产出符合专业标准的办公文件:

1)Excel技能:用户输入一段模糊的财务数据,智能体调用该技能编写 Python 脚本,生成带有自动计算公式、货币格式化及动态柱状图的专业预算表。

2)Word技能:在创建合同或协议时,智能体可以使用该技能处理修订模式(Track Changes)和添加注释,允许用户或法务人员轻松审查AI生成内容的变更轨迹。

3)PPT技能:结合企业的品牌指南(Brand Guidelines)技能,AI可以根据一段文本大纲,自动生成符合公司配色方案和字体规范的演示文稿。

4)PDF技能:除了读取内容,还可以执行表单自动填充、合并或拆分文件、以及将网页URL直接转化为PDF存档等确定性任务。

2、软件开发与工程化协作

Agent Skills在编程工具(如Claude Code、VS Code)中表现尤为突出:

1)PR审查与提交建议:可以构建专门的技能,教导AI按照团队特定的标准审查代码漏洞,或从git diff中提取变更信息,生成符合规范的Commit Messages

2)Web应用测试**(webapp-testing)**:利用Playwright框架构建技能,使智能体能够自动在本地浏览器中进行UI检查、截屏并分析错误日志。

3)技能创建****器 (skill-creator):这是一个“元技能”,通过对话引导用户描述工作流,由AI自动生成包含SKILL.md和配套脚本的文件夹结构,帮助用户快速构建新的自定义技能。

3、企业级业务流集成

通过与合作伙伴(如Atlassian, Notion和Canva等)的集成,Skills能够承载数库十年的行业经验:

1)Atlassian协作技能:使AI具备处理Jira票据的能力,例如将技术规格书(Specs)自动转化为开发待办列表(Backlogs),或自动生成项目状态报告。

2)Notion知识库检索:将复杂的模糊提问转化为可预测的数据库查询操作,帮助用户在海量文档中快速定位关键信息。

3)Canva语境和视觉语言破获:支持定制化设计智能体,捕获团队独特的品牌语境和视觉语言。

4)内部通****讯 (internal-comms):预设公司特定格式的模板,教导AI如何编写周报、公告或客户邮件,确保所有输出的语气和排版保持高度一致。

4、自定义专业能力包

用户可以根据个人需求构建细分领域的专家技能:

1)URL转PDF存档:创建一个包含特定脚本的技能,用户只需输入链接,AI即可将其捕获并打包为可下载的PDF。

2)可视化代码讲解:通过Skill强制要求AI在解释代码时,必须附带ASCII 流程图和现实生活的类比,从而将通用的模型转化为教学专家。

3)财务审计异常检测:教导智能体识别多个电子表格之间的逻辑冲突,按照会计准则自动发现财务数据中的潜在异常。

5、技能的调用方式

Agent Skills的强大之处在于其“渐进式披露”的工作模式:

1、显式调用 (Explicit):用户在对话中直接指明,如“使用pdf技能提取该文件字段”。

2、隐式触发 (Implicit):AI 根据用户的意图自动匹配。例如用户说“分析这份代码”,AI发现任务与其加载的code-review技能描述匹配,会自动请求启用该技能,而无需用户手动配置。

通过这种方式,AI从一个只能“聊天”的顾问,转变成了可以携带特定领域入职手册和确定性工具包的数字员工。

七、Agent Skills与MCP的协同效应

在智能体(Agent)工程体系中,Skills与MCP(Model Context Protocol)分别承担“本地能力封装”与“远程能力扩展”两类职责,二者共同构成Agent的工具执行层,可理解为内置插件 + 外部服务的协同架构。

很多人容易混淆这两者。简单来说:

1、MCP (Model Context Protocol)数据管道,负责连接外部系统(如 Google Drive, Slack, 数据库),解决“AI 能看到什么”的问题。

2、Agent Skills操作流程,负责定义如何使用这些数据,解决“AI 该怎么做”的问题。

总结:Skills提供“做事能力”,MCP提供“连接世界的能力”。两者共同让智能体从“会说话的模型”升级为“可执行、可集成、可落地的智能体系统”。

八、如何快速体验Agent Skills

想要快速体验Agent Skills,你可以通过以下几种最直接的方式,从现成的官方能力到自定义开发进行尝试:

1、在Claude.ai (网页版或桌面端) 体验

这是普通用户最简单的体验方式。

1)启用功能:进入Settings (设置)->Capabilities (能力)->Skills (技能),将其开关打开。

2)使用预置技能:Anthropic官方已经内置了处理PowerPoint (pptx)Excel (xlsx)Word (docx)PDF (pdf)的技能。你只需上传相关文件并要求Claude处理(例如“生成带图表的预算表”),它就会自动调用这些技能。

3)创建/上传自定义技能:如果你有现成的技能文件夹,可以将其压缩成.zip格式,在设置页面中上传。

4)使用Skill Creator:你可以直接在对话框中对Claude说“帮我创建一个技能”(Help me create a skill),它会调用内置的skill-creator引导你完成定义、指令编写和资源打包的整个过程。

2、在IDE工具(如VS Code)中体验

许多新一代AI编程工具已经深度集成了这一标准。

VS Code (GitHub Copilot)

◦ 这是一个实验性功能,需要在设置中手动搜索并开启 **Skills** 开关。 ◦ 你可以将技能文件夹放在项目的 `.github/skills` 目录下,Copilot 会自动加载这些指令。

3、在Claude Code (命令行工具) 体验

对于开发者来说,这是功能最全的体验方式。

1)安装插件:你可以通过命令/plugin marketplace add anthropics/skills添加官方市场,然后安装如document-skills等功能包。

2)本地开发:只需在本地~/.claude/skills/(个人全局)或项目的.claude/skills/目录下创建一个包含SKILL.md文件的文件夹,Claude Code启动时就会自动发现并加载它。

4、获取现成的技能资源 (从社区学习)

不必从零开始,你可以直接下载并运行优秀的开源实例:

1)官方仓库:访问GitHub上的anthropics/skills仓库,里面包含大量从创意设计到技术测试的成熟案例。

2)技能目录:你可以访问skillsdirectory.org探索更多社区分享的流行技能。

快速体验的小贴士

1)隐式调用:你不需要记住魔法口令。只要你在技能的description(元数据)中写清楚了适用场景(例如“用于生成符合公司风格的代码评审”),当你提出相关要求时,AI 会自动识别并请求你的许可来加载该技能。

2)渐进式披露机制:体验时你会发现 AI 不会一次性加载所有内容,它在启动时只消耗约100个tokens来记住技能名称,只有在你真正需要用它时,才会读取详细的SKILL.md指令或运行配套脚本,这极大地节省了上下文窗口并提高了响应速度。

九、安全考量:AI 的“特洛伊木马”?

作为一项可以直接在本地或受限环境中执行代码的技术,Agent Skills的安全性至关重要。研究表明,它可能成为提示词注入(Prompt Injection)的新温床:

1、隐蔽指令风险:恶意技能可能在冗长的SKILL.md中隐藏指令,诱导AI 在执行正常任务(如“备份文件”)时,静默地将敏感API Key或敏感文件上传到外部服务器。

2、权限静默绕过:由于智能体通常提供“不再询问”(Don’t ask again)选项,一旦用户对某个看似良性的脚本授权,后续隐藏的恶意操作可能在无感知的情况下执行。

建议:仅从受信任来源(如官方市场)安装技能,并在运行前对/scripts代码进行人工审计。

十、Anthropic竞争战略:定义AI时代的底层架构

Anthropic将Agent Skills打造为开放标准,是其深远布局的一部分:

1、定义行业底座:通过开放协议,Anthropic试图成为AI时代的“标准制定者”。这种“先入为主”策略已吸引微软和OpenAI悄然跟进。

2、打破封闭生态:不同于某些平台试图建立封闭的“App Store”,Agent Skills允许企业构建自己私有的、跨平台的技能库,这赢得了对数据主权敏感的企业级用户的青睐。

3、切入企业基础设施:Anthropic意识到,定义“AI如何工作”的协议,比单纯追求模型参数更具长远价值。技能正在成为AI时代的“底层操作系统”。

十一、Anthropic对Agent Skills的生态构建

目前,Agent Skills已展现出极强的生态牵引力:

1、厂商支持:除了Anthropic自身,微软已在VS Code和GitHub中采用了该标准;OpenAI在ChatGPT的Code Interpreter中也悄悄使用了类似的技能文件夹结构。

2、伙伴力量:Atlassian、Notion、Canva、Zapier等行业巨头已加入技能目录,贡献其积累数十年的专业工作流。

3、社区贡献:GitHub上的技能仓库已获得数万Star,社区正在贡献从 Web应用测试到科学研究的各类专业技能包。

十二、未来展望:程序性知识的“App Store”时刻

未来的智能体将默认是“全才”,但通过加载不同的“技能包”,它们能瞬间化身为垂直领域的精英:

1、知识定义的跃迁:知识将从“你知道什么”(Know-That)进化为“你的 Agent能做什么”(Know-How)。复杂的企业SOP(标准作业程序)将被封装成可流转、可交易的模块化资产。

2、数字员工的标准化:复杂的企业工作流(如合规审查、代码审计)将被封装成标准化的技能在市场上流转。

3、智能体的自我进化:长远愿景是让智能体具备自主创建、评估和改进技能的能力,将成功的行为模式固化为可复用的资产。

4、无处不在的技能集成:随着更多厂商的跟进,Agent Skills有望成为所有主流AI产品间交换能力的通用媒介。

5、人类角色的转变:正如Anthropic工程师所担心的,当AI变得无所不能时,人类更需要学会如何编写“入职手册”,而非重复琐碎的操作。

结语

Agent Skills的出现,标志着AI协作从“手工作坊”迈向了“标准化工厂”。它通过将专业的、组织化的隐性知识显性化、模块化和资产化,为我们提供了一个管理AI能力的全新框架。

在这个新标准下,AI不再是一个不可预测的黑盒,而是一个装备精良、流程明确、随时待命的专业助手。为你的智能体装备技能,标准化你的工作流,这将是我们在AI下半场竞争中积累的最核心资产。你能沉淀多少高质量的“技能资产”,将决定你在智能时代的最终位次。

普通人如何抓住AI大模型的风口?

为什么要学习大模型?

在DeepSeek大模型热潮带动下,“人工智能+”赋能各产业升级提速。随着人工智能技术加速渗透产业,AI人才争夺战正进入白热化阶段。如今近**60%的高科技企业已将AI人才纳入核心招聘目标,**其创新驱动发展的特性决定了对AI人才的刚性需求,远超金融(40.1%)和专业服务业(26.7%)。餐饮/酒店/旅游业核心岗位以人工服务为主,多数企业更倾向于维持现有服务模式,对AI人才吸纳能力相对有限。

这些数字背后,是产业对AI能力的迫切渴求:互联网企业用大模型优化推荐算法,制造业靠AI提升生产效率,医疗行业借助大模型辅助诊断……而餐饮、酒店等以人工服务为核心的领域,因业务特性更依赖线下体验,对AI人才的吸纳能力相对有限。显然,AI技能已成为职场“加分项”乃至“必需品”,越早掌握,越能占据职业竞争的主动权

随着AI大模型技术的迅速发展,相关岗位的需求也日益增加。大模型产业链催生了一批高薪新职业:

人工智能大潮已来,不加入就可能被淘汰。如果你是技术人,尤其是互联网从业者,现在就开始学习AI大模型技术,真的是给你的人生一个重要建议!

如果你真的想学习大模型,请不要去网上找那些零零碎碎的教程,真的很难学懂!你可以根据我这个学习路线和系统资料,制定一套学习计划,只要你肯花时间沉下心去学习,它们一定能帮到你!

大模型全套学习资料领取

这里我整理了一份AI大模型入门到进阶全套学习包,包含学习路线+实战案例+视频+书籍PDF+面试题+DeepSeek部署包和技巧,需要的小伙伴文在下方免费领取哦,真诚无偿分享!!!

vx扫描下方二维码即可

部分资料展示

一、 AI大模型学习路线图

这份路线图以“阶段性目标+重点突破方向”为核心,从基础认知(AI大模型核心概念)到技能进阶(模型应用开发),再到实战落地(行业解决方案),每一步都标注了学习周期和核心资源,帮你清晰规划成长路径。

二、 全套AI大模型应用开发视频教程

从入门到进阶这里都有,跟着老师学习事半功倍。

三、 大模型学习书籍&文档

收录《从零做大模型》《动手做AI Agent》等经典著作,搭配阿里云、腾讯云官方技术白皮书,帮你夯实理论基础。

四、大模型大厂面试真题

整理了百度、阿里、字节等企业近三年的AI大模型岗位面试题,涵盖基础理论、技术实操、项目经验等维度,每道题都配有详细解析和答题思路,帮你针对性提升面试竞争力。

适用人群

第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

  • 大模型 AI 能干什么?
  • 大模型是怎样获得「智能」的?
  • 用好 AI 的核心心法
  • 大模型应用业务架构
  • 大模型应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心思想
  • Prompt 典型构成
  • 指令调优方法论
  • 思维链和思维树
  • Prompt 攻击和防范
第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

  • 为什么要做 RAG
  • 搭建一个简单的 ChatPDF
  • 检索的基础概念
  • 什么是向量表示(Embeddings)
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模型本地部署
第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

  • 为什么要做 RAG
  • 什么是模型
  • 什么是模型训练
  • 求解器 & 损失函数简介
  • 小实验2:手写一个简单的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实验数据集的构建
第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

  • 硬件选型
  • 带你了解全球大模型
  • 使用国产大模型服务
  • 搭建 OpenAI 代理
  • 热身:基于阿里云 PAI 部署 Stable Diffusion
  • 在本地计算机运行大模型
  • 大模型的私有化部署
  • 基于 vLLM 部署大模型
  • 案例:如何优雅地在阿里云私有部署开源大模型
  • 部署一套开源 LLM 项目
  • 内容安全
  • 互联网信息服务算法备案

学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/18 5:42:52

内容消失危机!知乎创作全量备份方案,数据安全自主掌控指南

内容消失危机!知乎创作全量备份方案,数据安全自主掌控指南 【免费下载链接】zhihu_spider_selenium 爬取知乎个人主页的想法、文篇和回答 项目地址: https://gitcode.com/gh_mirrors/zh/zhihu_spider_selenium ⚠️ 数字内容正在以每分钟23%的速度…

作者头像 李华
网站建设 2026/4/18 8:41:27

如何通过Bypass Paywalls Clean实现高效信息获取:专业用户指南

如何通过Bypass Paywalls Clean实现高效信息获取:专业用户指南 【免费下载链接】bypass-paywalls-chrome-clean 项目地址: https://gitcode.com/GitHub_Trending/by/bypass-paywalls-chrome-clean 🔍 信息访问的现实挑战与工具价值 在数字化内容…

作者头像 李华
网站建设 2026/4/18 8:36:43

Switch游戏部署工具深度探索:Awoo Installer全场景解决方案

Switch游戏部署工具深度探索:Awoo Installer全场景解决方案 【免费下载链接】Awoo-Installer A No-Bullshit NSP, NSZ, XCI, and XCZ Installer for Nintendo Switch 项目地址: https://gitcode.com/gh_mirrors/aw/Awoo-Installer 基础配置:从环境…

作者头像 李华
网站建设 2026/4/18 5:37:58

实战深度:离线IP定位技术全攻略——从原理到落地的全方位解决方案

实战深度:离线IP定位技术全攻略——从原理到落地的全方位解决方案 【免费下载链接】ip2region Ip2region (2.0 - xdb) 是一个离线IP地址管理与定位框架,能够支持数十亿级别的数据段,并实现十微秒级的搜索性能。它为多种编程语言提供了xdb引擎…

作者头像 李华
网站建设 2026/4/18 8:42:22

设计师福利:UNet抠图镜像支持透明PNG输出

设计师福利:UNet抠图镜像支持透明PNG输出 你是否还在为一张产品图反复调整蒙版而头疼?是否每次都要打开Photoshop,花十几分钟处理发丝边缘?是否在做电商详情页时,被批量换背景的任务压得喘不过气?别再手动…

作者头像 李华
网站建设 2026/4/19 12:23:05

CogVLM2开源:16G显存体验超高清图文对话新高度

CogVLM2开源:16G显存体验超高清图文对话新高度 【免费下载链接】cogvlm2-llama3-chat-19B-int4 项目地址: https://ai.gitcode.com/zai-org/cogvlm2-llama3-chat-19B-int4 导语:清华大学知识工程实验室(KEG)与智谱AI联合发…

作者头像 李华