news 2026/4/18 8:57:02

ChatGLM3-6B模型实践官方导航

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
ChatGLM3-6B模型实践官方导航

仓库资料

Github 仓库:https://github.com/THUDM/ChatGLM3

Huggingface 仓库:https://huggingface.co/THUDM/chatglm3-6b

ModelScope 仓库:https://modelscope.cn/models/ZhipuAI/chatglm3-6b/summary(国内)

ChatGLM3技术文档:https://zhipu-ai.feishu.cn/wiki/WvQbwU9tiPAxGk8ywDck6yfnof

仓库设计:

basic_demo: 基础的调用示例
composite_demo: 一个完整的调用示例(包含工具调用,代码解释)
finetune_demo: 微调示例(包含SFT, p-tuning, lora)
tools_using_demo: 展现模型的工具调用能力。
langchain_demo: 使用 Langchain 配合 GLM3完成简单的调用
openai_api_demo: 模仿 OpenAI API 格式访问模型。
tensorrt_llm_demo: 使用 TensorRT-LLM 推理框架调用模型(本次不会提到)

Function Call 功能使用

ChatGLM3-6B 的“Function Call”(函数调用/工具调用)能力,这是一个让大模型连接外部世界、执行具体任务的核心高级功能。

​ 什么是Function Call

​ 模型能从给定的有限工具集中,自主判断并选择一个或多个最合适的工具来完成任务。模型需要理解用户自然语言的意图,并将其精确地转换成工具所需的参数格式。例如,将“4乘以5”转换为calculate(a=4, b=5, operator=‘*‘))。如果某个工具调用失败或无法给出正确答案,模型应具备“思考”能力,尝试调用其他工具或结合自身知识来回答问题。ChatGLM3-6B 已完整具备此项能力,能有效地选择并调用工具。

​ 工具是模型的**“四肢”和“感官”,极大地扩展了其能力范围,使其从一个“知识渊博的大脑”升级为一个“能动手办事的智能体”。有了工具可以处理大模型本身不擅长或无法完成的任务,例如:获取最新天气、股价,或进行复杂数学运算,查询数据库、发送邮件、控制硬件等。将特定任务交给专精的工具执行,结果比模型自行生成更精确、更可靠**。

代码解释器

​ 代码解释器在 ChatGLM3 中的定位属于模型“工具”的一种,专门用于执行代码并可视化结果,用户可以通过自然语言输入需求,大模型会自动生成对应的代码并执行,最终返回代码执行的结果(例如生成图像、数据图表等)。https://github.com/THUDM/chatglm3/tree/main/composite_demo 用户可以通过该链接访问实际案例和源代码

完整示例演示(可视化)

1. 进入 composite_demo 文件夹

cd composite_demo

2. 替换 client.py 中的模型路径

打开 client.py 文件,找到 MODEL_PATH 行并替换为你的模型本地路径或模型名称

例如:MODEL_PATH = os.environ.get(‘MODEL_PATH’, ‘你的模型路径’)

3. 使用 Streamlit 运行完整演示

streamlit run main.py

LangChain 框架的集成使用

​ 如何利用 LangChain 来增强 ChatGLM3 的能力,使其能够调用外部工具。

​ LangChain提供了与向量数据库交互、工具调用等现成逻辑,能快速构建复杂应用,拥有完善的开发者社区和海量用户,易于获取支持和资源。在国内生态良好,已有基于 LangChain 的二级框架(如Langchain-Chatchat)对 ChatGLM3 进行了充分适配,降低了使用门槛。代码仓库地址:https://github.com/THUDM/ChatGLM3/tree/main/langchain_demo

仿造OpenAI API接入ChatGLM3模型

启动 OpenAI API 服务器

# 进入 openai_api_demo 目录 cd openai_api_demo # 启动 API 服务 python api_server.py

执行示例请求

# 在同一目录下运行请求脚本 python openai_api_request.py

完整的请求示例代码(Python)

# 配置消息messages=[{"role":"system","content":"You are ChatGLM3, a large language model trained by Zhipu.AI. Follow the user's instructions carefully. Respond using markdown."},{"role":"user","content":"你好,请你介绍一下 chatglm3-6b 这个模型"}]# 调用 APIresponse=client.chat.completions.create(model="chatglm3-6b",messages=messages,stream=True,max_tokens=256,temperature=0.8,top_p=0.8)# 处理响应ifresponse:ifuse_stream:# 假设 use_stream 已定义forchunkinresponse:print(chunk.choices[0].delta.content)else:content=response.choices[0].message.contentprint(content)else:print("Error:",response.status_code)

代码仓库地址:https://github.com/THUDM/ChatGLM3/tree/main/openai_api_demo

GLM 大模型的微调(Fine-Tuning)

GLM 官方已提供对LoRAP-Tuning v2和全参数SFT三种方式的支持

官方微调实战代码仓库:https://github.com/THUDM/ChatGLM3/tree/main/finetune_demo

一键启动微调:python finetune_hf.py data/AdvertiseGen fix THUDM/chatglm3-6b configs/lora.yaml

官方支持

GitHub是智谱AI官方重点维护的代码托管与协作平台,是提出问题、技术交流和代码贡献的首选渠道互动方式

  • Issue:用于提交使用中遇到的Bug、错误报告或功能建议
  • Pull Request (PR):如果你对代码有改进或修复方案,可以提交PR,直接为项目做贡献。
  • Discussion:用于与社区的其他开发者和研究者进行开放式交流、讨论

官方承诺对于ChatGLM3-6B 开源模型的相关问题,会在48小时内给予回复

官方仓库地址https://github.com/THUDM/ChatGLM3

其他辅助联系与资源渠道飞书技术文档社交媒体与社群

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/17 12:46:54

StructBERT实战

StructBERT实战:基于StructBERT的中文情感分析服务(WebUI API) 1. 背景与应用场景 在当前自然语言处理(NLP)领域,情感分析作为一项基础且关键的任务,广泛应用于社交媒体监控、用户评论挖掘、…

作者头像 李华
网站建设 2026/4/17 22:06:12

StructBERT情感分析模型调优:准确率提升技巧

StructBERT情感分析模型调优:准确率提升技巧 1. 中文情感分析的技术挑战与优化价值 在自然语言处理(NLP)领域,中文情感分析是企业级应用中极为关键的一环,广泛应用于舆情监控、用户评论挖掘、客服系统智能响应等场景…

作者头像 李华
网站建设 2026/4/18 9:19:44

中文文本情绪识别部署:StructBERT环境配置指南

中文文本情绪识别部署:StructBERT环境配置指南 1. 引言 1.1 中文情感分析的现实需求 在社交媒体、电商评论、客服对话等场景中,中文用户生成内容(UGC)呈爆炸式增长。如何从海量非结构化文本中自动提取情绪倾向,成为…

作者头像 李华
网站建设 2026/4/18 8:05:26

StructBERT部署案例:用户反馈情绪分析教程

StructBERT部署案例:用户反馈情绪分析教程 1. 引言:中文情感分析的现实价值 在当今数字化服务快速发展的背景下,企业每天都会收到来自社交媒体、客服系统、电商平台等渠道的海量用户反馈。如何高效地理解这些文本背后的情绪倾向&#xff0c…

作者头像 李华
网站建设 2026/4/18 10:08:17

中文文本情感分析:StructBERT模型实战指南

中文文本情感分析:StructBERT模型实战指南 1. 引言:中文情感分析的应用价值 在当今信息爆炸的时代,用户每天在社交媒体、电商平台、评论区等场景产生海量的中文文本数据。如何从这些非结构化文本中快速提取情绪倾向,成为企业洞察…

作者头像 李华
网站建设 2026/4/18 12:08:45

中文情感分析应用开发:StructBERT模型集成案例

中文情感分析应用开发:StructBERT模型集成案例 1. 背景与需求:中文情感分析的现实价值 在社交媒体、电商评论、客服对话等场景中,用户生成的中文文本蕴含着丰富的情绪信息。如何自动识别这些情绪倾向——是满意还是不满,是积极还…

作者头像 李华