Qwen3-4B-Instruct基础教程：prompt模板注入+system message定制方法-程序员充电站

Qwen3-4B-Instruct基础教程：prompt模板注入+system message定制方法

1. 模型简介

Qwen3-4B-Instruct-2507是Qwen3系列的端侧/轻量旗舰模型，专为指令跟随任务优化设计。这个4B参数的模型在保持轻量化的同时，提供了出色的推理能力和任务完成度。

最令人印象深刻的是其超长上下文处理能力：

原生支持256K token（约50万字）上下文窗口
可扩展至1M token
轻松处理整本书、大型PDF、长代码库等长文本任务

2. 快速部署指南

2.1 环境准备

本项目使用torch29Conda环境，包含以下关键依赖：

PyTorch 2.9.0 + CUDA 12.8
Transformers 5.5.0
Gradio
Accelerate

模型路径位于：/root/ai-models/Qwen/Qwen3-4B-Instruct-2507

2.2 服务管理命令

# 查看服务状态 supervisorctl status qwen3-4b-instruct # 重启服务 supervisorctl restart qwen3-4b-instruct # 停止服务 supervisorctl stop qwen3-4b-instruct # 启动服务 supervisorctl start qwen3-4b-instruct

2.3 访问WebUI

在浏览器中打开：http://localhost:7860

如果从外部访问，需确保服务器防火墙已开放7860端口：

# CentOS/RHEL firewall-cmd --add-port=7860/tcp --permanent firewall-cmd --reload # Ubuntu/Debian ufw allow 7860/tcp

3. Prompt模板注入方法

3.1 基础Prompt结构

Qwen3-4B-Instruct遵循标准的对话格式：

<|im_start|>system {system_message}<|im_end|> <|im_start|>user {user_message}<|im_end|> <|im_start|>assistant

3.2 模板注入示例

假设我们要创建一个代码生成助手，可以这样注入模板：

def generate_code_prompt(task_description): system_msg = """你是一个专业的Python编程助手，擅长编写高效、可读性强的代码。 请遵循以下规则： 1. 使用Python 3.10+语法 2. 添加适当的类型注解 3. 包含清晰的文档字符串 4. 提供使用示例""" prompt = f"""<|im_start|>system {system_msg}<|im_end|> <|im_start|>user 请帮我编写一个Python函数来实现：{task_description}<|im_end|> <|im_start|>assistant""" return prompt

3.3 多轮对话模板

对于需要多轮对话的场景：

def multi_turn_prompt(history, new_query): prompt = "" for turn in history: prompt += f"<|im_start|>{turn['role']}\n{turn['content']}<|im_end|>\n" prompt += f"<|im_start|>user\n{new_query}<|im_end|>\n" prompt += "<|im_start|>assistant" return prompt

4. System Message定制技巧

4.1 角色定义

通过system message可以精确定义模型角色：

<|im_start|>system 你是一位资深软件架构师，拥有15年大型分布式系统设计经验。 你的回答应该： 1. 专业且详细 2. 包含架构图描述 3. 提供备选方案比较 4. 考虑可扩展性和容错性<|im_end|>

4.2 输出格式控制

可以指定响应格式要求：

<|im_start|>system 请按照以下格式回答问题： 【问题重述】 用1句话概括用户问题 【核心解答】 提供主要解决方案 【详细说明】 分步骤解释实现方法 【示例代码】 提供可运行的代码示例<|im_end|>

4.3 领域知识注入

对于专业领域任务，可以直接在system message中注入相关知识：

<|im_start|>system 你是一位量子计算专家，熟悉以下概念： - 量子比特(Qubit) - 超导量子电路 - 量子门操作 - 量子纠错码 请用通俗易懂的方式解释量子计算概念，避免过度简化。<|im_end|>

5. 高级应用示例

5.1 长文档处理

利用256K上下文窗口处理长文档：

def process_long_document(document_text, question): prompt = f"""<|im_start|>system 你是一个文档分析专家，能够从长文档中精确提取信息。 当前文档内容： {document_text}<|im_end|> <|im_start|>user {question}<|im_end|> <|im_start|>assistant""" return prompt

5.2 代码审查助手

定制代码审查场景的prompt：

def code_review_prompt(code): system_msg = """你是一个严格的代码审查员，请检查以下Python代码： 1. 找出所有潜在bug 2. 评估代码风格 3. 提出性能优化建议 4. 按严重程度分级报告问题""" prompt = f"""<|im_start|>system {system_msg}<|im_end|> <|im_start|>user {code}<|im_end|> <|im_start|>assistant""" return prompt

6. 常见问题解决

6.1 服务启动问题

如果服务启动失败，建议检查：

# 查看详细日志 cat /root/Qwen3-4B-Instruct/logs/webui.log # 检查GPU内存 nvidia-smi --query-gpu=memory.used --format=csv # 检查端口占用 ss -tlnp | grep 7860

6.2 性能优化建议

如果显存不足，可以考虑使用4-bit量化版本
对于长文本处理，适当调整max_length参数
批量请求可以提高吞吐量

6.3 模型响应控制

通过system message可以控制响应风格：

<|im_start|>system 请用以下格式响应： 1. 首先用一句话回答核心问题 2. 然后用3-5个要点详细说明 3. 最后提供一个简单示例 保持回答简洁专业，避免冗余解释。<|im_end|>

获取更多AI镜像
想探索更多AI镜像和应用场景？访问 CSDN星图镜像广场，提供丰富的预置镜像，覆盖大模型推理、图像生成、视频生成、模型微调等多个领域，支持一键部署。

Qwen3-4B-Instruct基础教程：prompt模板注入+system message定制方法

Qwen3-4B-Instruct基础教程：prompt模板注入+system message定制方法

1. 模型简介

2. 快速部署指南

2.1 环境准备

2.2 服务管理命令

2.3 访问WebUI

3. Prompt模板注入方法

3.1 基础Prompt结构

3.2 模板注入示例

3.3 多轮对话模板

4. System Message定制技巧

4.1 角色定义

4.2 输出格式控制

4.3 领域知识注入

5. 高级应用示例

5.1 长文档处理

5.2 代码审查助手

6. 常见问题解决

6.1 服务启动问题

6.2 性能优化建议

6.3 模型响应控制

开源词汇管理工具OpenWord：开发者如何构建个人术语库与知识图谱

安卓误删文件先别慌！5个实用小技巧指南教你补救

GLM-4.1V-9B-Base保姆级教学：如何通过Web界面调试prompt engineering技巧

CarbonPATH框架：AI加速器的可持续异构集成设计优化

2026届学术党必备的五大AI学术神器实测分析

Claude大模型最佳实践指南：从提示工程到工作流集成的系统化方法