OpenClaw+千问3.5-9B自动化办公：会议纪要自动生成实战-程序员充电站

OpenClaw+千问3.5-9B自动化办公：会议纪要自动生成实战

1. 为什么需要自动化会议纪要

上周三的团队会议让我意识到手动整理会议纪要的效率瓶颈。那次会议持续了2小时，我花了整整一个下午才完成纪要整理——先要反复听录音确认关键点，再手动提取行动项，最后调整格式发给参会者。这种重复劳动不仅消耗时间，还容易遗漏重要信息。

这正是我尝试用OpenClaw+千问3.5-9B搭建自动化流程的契机。通过将语音识别、文本摘要和格式优化串联起来，现在我的MacBook能在会议结束后10分钟内生成结构化纪要。这个方案特别适合我们这样6-8人的小团队，既不需要购买商业SaaS服务，又能保证会议内容不离开本地环境。

2. 技术方案设计思路

2.1 核心组件选型

整个系统需要三个关键组件协同工作：

语音识别引擎：采用本地部署的Whisper.cpp，避免敏感会议内容上传云端
大语言模型：千问3.5-9B作为文本处理核心，负责摘要提取和格式转换
自动化框架：OpenClaw作为调度中枢，串联各个环节并处理异常情况

选择千问3.5-9B而非更大模型的原因很实际：32k的上下文窗口足够处理2小时会议转录文本，且在我的M1 Max笔记本上能流畅运行。实测显示，处理1万字左右的转录内容时，响应时间控制在3分钟以内，完全在可接受范围。

2.2 工作流设计

典型的自动化流程包含以下阶段：

会议结束后自动触发录音文件处理
Whisper进行语音转文字（生成原始转录文本）
千问模型执行多轮文本处理：
- 第一轮：去除重复、无意义语气词等干扰内容
- 第二轮：识别并标记不同发言人的核心观点
- 第三轮：提取待办事项和决策点
最终格式化为标准会议纪要模板

这个设计最巧妙的地方在于利用OpenClaw的"技能链"特性，当某环节失败时会自动重试或转人工处理，避免了传统脚本"一错全停"的问题。

3. 具体实现步骤

3.1 环境准备

首先需要配置基础环境，我的MacBook Pro（M1 Max, 32GB）运行以下组件：

# 安装Whisper.cpp brew install whisper.cpp # 部署千问3.5-9B（使用星图平台镜像） docker run -d -p 5000:5000 qwen3.5-9b-api # 安装OpenClaw核心 curl -fsSL https://openclaw.ai/install.sh | bash

3.2 OpenClaw对接千问模型

关键配置位于~/.openclaw/openclaw.json的模型部分：

{ "models": { "providers": { "qwen-local": { "baseUrl": "http://localhost:5000/v1", "apiKey": "sk-no-key-required", "api": "openai-completions", "models": [ { "id": "qwen3.5-9b", "name": "Local Qwen", "contextWindow": 32768 } ] } } } }

配置完成后需要重启网关服务：

openclaw gateway restart

3.3 开发会议纪要技能

在OpenClaw中创建自定义技能meeting-miner，核心处理逻辑如下：

def process_transcription(text): # 第一轮清洗 prompt = f"""请清理以下会议记录： 1. 移除"嗯"、"啊"等语气词 2. 合并同一发言人的连续段落 3. 删除与主题无关的闲谈 文本：{text[:20000]}""" # 分块处理长文本 cleaned = qwen_api.generate(prompt) # 第二轮提取要点 template = """请从会议记录中提取： 1. 关键决策点（标记决策人） 2. 待办事项（明确负责人和截止时间） 3. 需要跟进的问题 格式要求：使用Markdown输出""" summary = qwen_api.generate(template.format(cleaned)) return format_as_template(summary)

这个技能通过OpenClaw的插件机制注册后，就能在Web控制台或飞书机器人中直接调用。

4. 实战效果与优化

4.1 典型使用场景

每周三的立项会现在完全交给自动化流程处理：

会议使用Zoom本地录音（保存为meeting.mp3）

会后执行命令触发流程：

openclaw run meeting-miner --input ~/Downloads/meeting.mp3

约8分钟后收到飞书消息通知，包含：
- 清理后的完整转录文本（作为附件）
- 结构化会议摘要
- 待办事项清单

4.2 遇到的典型问题

问题1：发言人识别错误

现象：多人快速对话时，Whisper无法区分说话人
解决：在会前收集参会者语音样本，训练简单的声纹模型辅助识别

问题2：行动项提取不完整

现象：模型有时会遗漏模糊表达的任务（如"小明有空看看"）
解决：在prompt中加入我们团队特有的任务表达习惯示例

问题3：长会议内存溢出

现象：3小时以上的会议处理会失败
解决：实现自动分块处理机制，每30分钟内容为一个处理单元

5. 安全与隐私考量

这套方案最让我满意的是数据全程本地处理的特性：

语音文件始终不离开本地磁盘
千问模型通过内网API调用
中间产物（转录文本、处理结果）保存在加密的OpenClaw工作区
最终纪要通过企业微信/飞书等安全通道分享

相比使用第三方会议纪要SaaS，不仅节省了每年数千元的订阅费用，更重要的是避免了商业机密外泄的风险。我们的法务团队审核后，确认该方案符合公司数据安全规范。

获取更多AI镜像
想探索更多AI镜像和应用场景？访问 CSDN星图镜像广场，提供丰富的预置镜像，覆盖大模型推理、图像生成、视频生成、模型微调等多个领域，支持一键部署。

OpenClaw+千问3.5-9B自动化办公：会议纪要自动生成实战