ChatGLM-6B中文场景实战：政务问答系统原型搭建与提示词设计-程序员充电站

ChatGLM-6B中文场景实战：政务问答系统原型搭建与提示词设计

1. 引言：当大模型遇见政务服务

想象一下，一位市民想咨询办理居住证需要哪些材料。他打开政府网站，不再需要在一堆政策文件里翻找，而是直接输入问题：“办居住证要带什么？” 几秒钟后，一份清晰、准确、包含具体材料清单和办理地点的回答就呈现在眼前。

这背后，就是大语言模型在政务领域的应用潜力。今天，我们就来聊聊如何用开源的ChatGLM-6B模型，快速搭建一个政务问答系统的原型。这个原型不仅能理解市民的自然语言提问，还能基于预设的政策知识库给出专业回答。

为什么选择ChatGLM-6B？因为它是一个62亿参数的中英双语对话模型，由清华大学和智谱AI联合推出。它在中文理解和生成上表现不错，而且完全开源，让我们可以低成本、高效率地进行技术验证和原型开发。

本文将带你完成两件事：

快速部署一个可用的ChatGLM-6B服务（基于CSDN的预置镜像，真正做到开箱即用）。
设计一套针对政务场景的提示词（Prompt），让模型从“通用聊天助手”变身“政务政策专家”。

无论你是政务信息化部门的开发者，还是对AI应用感兴趣的技术爱好者，这篇文章都将提供一个从零到一的完整实践路径。

2. 环境准备：5分钟启动你的ChatGLM-6B服务

过去部署一个大模型，光是下载几十GB的权重文件、配置复杂的CUDA环境就能劝退很多人。现在，我们可以利用集成的镜像，跳过所有繁琐步骤。

2.1 理解我们的“工具箱”：CSDN ChatGLM-6B镜像

这个镜像已经为你准备好了所有东西：

完整的模型：62亿参数的ChatGLM-6B权重文件已经内置在镜像里，无需联网下载。
稳定的服务：用Supervisor工具管理服务进程，即使意外崩溃也能自动重启，保证服务一直在线。
好用的界面：提供了一个基于Gradio的网页界面，你可以在浏览器里直接和模型对话，还能调节回答的“创意度”。

简单说，你拿到的是一个“装好系统、装好软件、插电就能用”的电脑。

2.2 一键启动与访问

启动服务只需要一行命令。通过SSH连接到你的服务器后，执行：

supervisorctl start chatglm-service

这行命令告诉Supervisor去启动名为chatglm-service的程序。怎么知道启动成功了？可以查看实时日志：

tail -f /var/log/chatglm-service.log

当你看到日志里出现“Running on local URL: http://127.0.0.1:7860”之类的信息时，说明服务已经在服务器内部的7860端口跑起来了。

接下来，我们需要把这个端口“映射”到你的本地电脑，才能在浏览器里访问。使用SSH隧道功能：

ssh -L 7860:127.0.0.1:7860 -p <你的服务器端口号> root@你的服务器地址

这条命令的意思是：在你本地电脑的7860端口和服务器内部的7860端口之间，建立一条安全通道。

最后，打开你本地电脑的浏览器，访问http://127.0.0.1:7860。一个简洁的对话界面就会出现，恭喜你，你的私人ChatGLM-6B助手已经就绪！

常用管理命令备忘：

# 查看服务状态 supervisorctl status chatglm-service # 重启服务（修改代码或配置后常用） supervisorctl restart chatglm-service # 停止服务 supervisorctl stop chatglm-service

3. 从通用聊天到政务专家：提示词设计核心思想

现在模型能说话了，但它还是个“通才”，对政务政策一无所知。直接问它“如何申请保障性住房”，它可能只会给出一个非常笼统、甚至包含错误的回答。

我们的目标，是通过“提示词”（Prompt）来引导和约束模型，让它在一个设定的角色和知识范围内回答问题。这就像给一个聪明的实习生一份详细的工作手册和参考资料，他就能出色地完成特定任务。

3.1 政务问答的挑战与设计原则

政务问答和普通聊天有本质区别：

准确性要求极高：回答必须严格依据现行政策，不能臆测或创造。
严谨性与规范性：用语要正式、准确，避免口语化、模糊化的表达。
结构化信息输出：市民需要的是清晰的步骤、具体的材料清单、明确的办理地点，而不是长篇大论。
安全性：对于不确定或超出范围的问题，必须明确告知“无法回答”，而不是胡乱编造。

因此，我们的提示词设计要遵循以下原则：

角色定义清晰：明确告诉模型“你是谁”（例如：政务政策智能问答助手）。
知识边界限定：明确告诉模型“你的知识来源是什么”（例如：基于以下政策文本）。
回答格式规范：明确告诉模型“你应该怎么回答”（例如：分点列出，先给结论，再提供依据）。
安全兜底策略：明确告诉模型“遇到不知道的怎么办”（例如：明确告知该问题不在当前知识库内）。

3.2 基础提示词模板构建

一个强大的提示词通常包含以下几个部分，我们将其组合成一个“系统指令”：

你是一个专业的政务政策智能问答助手。你的核心职责是严格依据用户提供的政策知识库来回答市民的咨询。 【你的知识库】 {在这里插入具体的政策文本，例如关于居住证办理、个人所得税专项附加扣除等条款} 【你的回答规则】 1. 所有回答必须严格以上述知识库内容为依据，不得编造、推测或添加知识库以外的信息。 2. 回答应清晰、结构化。对于流程类问题，请分步骤说明；对于材料类问题，请分项列出。 3. 用语需严谨、正式、准确。 4. 如果用户的问题无法从知识库中找到明确依据，你必须回复：“根据现有政策信息，我无法提供该问题的准确答案，建议您通过12345热线或前往XX政务服务大厅窗口进行详细咨询。” 5. 不要提及“知识库”、“根据上文”等内部术语，直接给出最终答案。 现在，请开始回答用户的问题。 用户问题：{用户的实际问题}

这个模板就像一个“工作框架”。{在这里插入具体的政策文本}是我们要动态填充的内容，也就是模型回答问题的“依据”。

4. 实战演练：构建一个微型政务知识库与问答

让我们用一个具体的例子，把上面的想法变成代码。

4.1 准备一个简单的政务知识库

我们创建一个Python字典来模拟一个小型知识库，实际应用中，这部分数据可能来自数据库或API。

# knowledge_base.py 政务知识库 = { “居住证办理”: “”” 办理本市居住证所需材料及流程： 一、申请条件： 1. 在本市合法稳定居住满6个月。 2. 在本市合法稳定就业或连续就读。 二、所需材料： 1. 本人居民身份证原件及复印件。 2. 近期一寸免冠白底彩色照片2张。 3. 居住证明（如房屋租赁合同、房产证、住宿证明等）。 4. 就业证明（如劳动合同、营业执照）或就读证明（学生证）。 三、办理流程： 1. 申请人携带上述材料前往居住地所属的街道（乡镇）社区事务受理服务中心。 2. 填写《居住证申领表》。 3. 工作人员审核材料，符合条件的当场受理。 4. 审核通过后，一般在15个工作日内制证完成，可凭回执领取。 “””, “个人所得税专项附加扣除（子女教育）”: “”” 子女教育专项附加扣除标准： 1. 扣除范围：纳税人的子女接受全日制学历教育的相关支出。 2. 扣除标准：每个子女每月2000元的标准定额扣除。 3. 扣除主体：父母可以选择由其中一方按扣除标准的100%扣除，也可以选择由双方分别按扣除标准的50%扣除。 4. 所需材料：纳税人需要留存子女的学籍信息、缴费凭证等资料备查，申报时一般无需报送。 “”” }

4.2 实现提示词组装与问答函数

接下来，我们写一个函数，能够根据用户的问题，从知识库里找到最相关的政策，然后组装成完整的提示词，最后发送给ChatGLM-6B模型获取答案。

这里假设我们已经有了一个能和之前部署的服务对话的客户端函数ask_chatglm(prompt)。

# qa_system.py import re from knowledge_base import 政务知识库 # 这是一个模拟的客户端函数，实际需要替换为调用你部署的7860端口API的代码 def ask_chatglm(prompt): """ 模拟调用ChatGLM-6B服务。 实际应用中，这里应该是一个HTTP请求，发送到 http://127.0.0.1:7860 的API。 """ # 模拟一个简单响应，实际响应来自模型 print(f”[发送给模型的提示词]：\n{prompt}\n{‘-’*50}“) # 此处应替换为真实的API调用，例如： # response = requests.post(‘http://127.0.0.1:7860/api/chat’, json={‘prompt’: prompt}) # return response.json()[‘response’] return “[这里是ChatGLM-6B根据提示词生成的回答]" def find_relevant_knowledge(user_question): """简单地根据关键词匹配知识库，实际项目可使用更复杂的语义匹配（如Embedding）""" user_question_lower = user_question.lower() for topic, content in 政务知识库.items(): if topic.lower() in user_question_lower: return content # 如果没找到，返回一个通用的“未找到”提示，这也会被整合进系统指令 return None def generate_prompt(user_question, knowledge_text): """组装完整的系统提示词""" system_instruction = “”“你是一个专业的政务政策智能问答助手。你的核心职责是严格依据用户提供的政策知识库来回答市民的咨询。 【你的知识库】 {knowledge} 【你的回答规则】 1. 所有回答必须严格以上述知识库内容为依据，不得编造、推测或添加知识库以外的信息。 2. 回答应清晰、结构化。对于流程类问题，请分步骤说明；对于材料类问题，请分项列出。 3. 用语需严谨、正式、准确。 4. 如果用户的问题无法从知识库中找到明确依据，你必须回复：“根据现有政策信息，我无法提供该问题的准确答案，建议您通过12345热线或前往相关政务服务大厅窗口进行详细咨询。” 5. 不要提及“知识库”、“根据上文”等内部术语，直接给出最终答案。 现在，请开始回答用户的问题。 用户问题：{question}”“” if knowledge_text: final_prompt = system_instruction.format(knowledge=knowledge_text, question=user_question) else: # 当知识库中没有相关信息时，在知识库部分明确说明 final_prompt = system_instruction.format(knowledge=“当前知识库中未包含与该问题直接相关的政策内容。”, question=user_question) return final_prompt def answer_question(user_question): """主问答函数""" print(f”用户问题：{user_question}“) # 1. 知识检索 knowledge = find_relevant_knowledge(user_question) # 2. 提示词工程 prompt = generate_prompt(user_question, knowledge) # 3. 调用模型 answer = ask_chatglm(prompt) print(f”助手回答：{answer}\n“) return answer # 测试一下 if __name__ == “__main__”: test_questions = [ “办理居住证需要带什么材料？”, “子女教育扣除每个月多少钱？”, “如何申请保障性住房？” # 这个问题不在我们知识库 ] for q in test_questions: answer_question(q)

运行这个测试，你会看到：

对于前两个问题，模型会接收到包含具体政策文本的提示词，从而生成结构化的准确答案。
对于第三个问题，因为知识库中找不到“保障性住房”的内容，模型会根据规则4，给出一个安全、规范的兜底回复，建议用户通过其他渠道咨询。

5. 进阶优化与扩展思路

上面的原型已经能工作了，但要投入实际使用，还需要考虑更多。

5.1 提升知识检索的准确性

我们之前用的关键词匹配太简单了。市民可能会问“办暂住证要啥？”，这和“居住证”是同一个东西，但关键词没匹配上。解决方案是引入语义检索。

使用Embedding模型：将知识库中的每段文本和用户的问题，都通过一个模型（如text2vec）转换成一组数字（向量）。
计算相似度：计算用户问题向量和所有知识向量的相似度。
返回最相关的文本：把相似度最高的知识文本，作为提示词中的依据。

这样，即使用户的表达和知识库原文不同，只要意思相近，也能被正确检索到。

5.2 完善系统架构

一个完整的系统不会每次问答都重新组装全部提示词，尤其是知识库很大时。典型的架构如下：

用户问题 -> 语义检索模块 -> 召回相关N条政策文本 -> 提示词组装模块 -> 大语言模型 -> 结构化答案

同时，需要建立知识库管理后台，方便政策法规的增删改查。

5.3 提示词的迭代与评估

提示词不是一次写好的，需要不断调试和评估。

评估标准：答案的准确性、完整性、结构清晰度、安全性。
A/B测试：对于同一个问题，尝试不同版本的提示词（例如，改变角色描述、调整规则顺序），看哪个版本生成的答案更好。
收集反馈：在原型测试阶段，记录下模型回答不佳的情况，分析是知识库缺失、检索不准还是提示词规则有漏洞，然后针对性优化。

6. 总结

通过这篇文章，我们完成了一次从模型部署到场景化应用的技术实践：

快速部署：利用预置的CSDN ChatGLM-6B镜像，我们绕过了复杂的环境配置，在几分钟内就获得了一个稳定、可交互的大模型服务。这为后续的所有开发工作奠定了坚实基础。
理解核心：我们认识到，让大模型在专业领域（如政务）发挥作用的关键，不在于模型本身有多大，而在于如何通过提示词设计和知识库构建来引导和约束它。模型是引擎，提示词是方向盘，知识库是地图。
动手实践：我们设计了一个包含角色定义、知识边界、回答格式和安全兜底的提示词模板，并用代码实现了一个简单的、基于关键词检索的政务问答原型。这个原型清晰地展示了“检索-增强-生成”的技术路径。
展望未来：要将原型变为真正可用的系统，我们还需要在语义检索、系统架构、评估迭代等方面做大量工作。这条路很长，但起点已经非常清晰。

技术的价值在于解决实际问题。用ChatGLM-6B搭建政务问答原型，不仅是一次有趣的技术尝试，更是探索AI如何提升公共服务效率、改善市民体验的切实一步。希望这个实战指南能为你打开一扇门，启发更多有价值的应用创新。