OpenClaw+千问3.5-9B自动化办公:会议纪要自动生成实战
1. 为什么需要自动化会议纪要
上周三的团队会议让我意识到手动整理会议纪要的效率瓶颈。那次会议持续了2小时,我花了整整一个下午才完成纪要整理——先要反复听录音确认关键点,再手动提取行动项,最后调整格式发给参会者。这种重复劳动不仅消耗时间,还容易遗漏重要信息。
这正是我尝试用OpenClaw+千问3.5-9B搭建自动化流程的契机。通过将语音识别、文本摘要和格式优化串联起来,现在我的MacBook能在会议结束后10分钟内生成结构化纪要。这个方案特别适合我们这样6-8人的小团队,既不需要购买商业SaaS服务,又能保证会议内容不离开本地环境。
2. 技术方案设计思路
2.1 核心组件选型
整个系统需要三个关键组件协同工作:
- 语音识别引擎:采用本地部署的Whisper.cpp,避免敏感会议内容上传云端
- 大语言模型:千问3.5-9B作为文本处理核心,负责摘要提取和格式转换
- 自动化框架:OpenClaw作为调度中枢,串联各个环节并处理异常情况
选择千问3.5-9B而非更大模型的原因很实际:32k的上下文窗口足够处理2小时会议转录文本,且在我的M1 Max笔记本上能流畅运行。实测显示,处理1万字左右的转录内容时,响应时间控制在3分钟以内,完全在可接受范围。
2.2 工作流设计
典型的自动化流程包含以下阶段:
- 会议结束后自动触发录音文件处理
- Whisper进行语音转文字(生成原始转录文本)
- 千问模型执行多轮文本处理:
- 第一轮:去除重复、无意义语气词等干扰内容
- 第二轮:识别并标记不同发言人的核心观点
- 第三轮:提取待办事项和决策点
- 最终格式化为标准会议纪要模板
这个设计最巧妙的地方在于利用OpenClaw的"技能链"特性,当某环节失败时会自动重试或转人工处理,避免了传统脚本"一错全停"的问题。
3. 具体实现步骤
3.1 环境准备
首先需要配置基础环境,我的MacBook Pro(M1 Max, 32GB)运行以下组件:
# 安装Whisper.cpp brew install whisper.cpp # 部署千问3.5-9B(使用星图平台镜像) docker run -d -p 5000:5000 qwen3.5-9b-api # 安装OpenClaw核心 curl -fsSL https://openclaw.ai/install.sh | bash3.2 OpenClaw对接千问模型
关键配置位于~/.openclaw/openclaw.json的模型部分:
{ "models": { "providers": { "qwen-local": { "baseUrl": "http://localhost:5000/v1", "apiKey": "sk-no-key-required", "api": "openai-completions", "models": [ { "id": "qwen3.5-9b", "name": "Local Qwen", "contextWindow": 32768 } ] } } } }配置完成后需要重启网关服务:
openclaw gateway restart3.3 开发会议纪要技能
在OpenClaw中创建自定义技能meeting-miner,核心处理逻辑如下:
def process_transcription(text): # 第一轮清洗 prompt = f"""请清理以下会议记录: 1. 移除"嗯"、"啊"等语气词 2. 合并同一发言人的连续段落 3. 删除与主题无关的闲谈 文本:{text[:20000]}""" # 分块处理长文本 cleaned = qwen_api.generate(prompt) # 第二轮提取要点 template = """请从会议记录中提取: 1. 关键决策点(标记决策人) 2. 待办事项(明确负责人和截止时间) 3. 需要跟进的问题 格式要求:使用Markdown输出""" summary = qwen_api.generate(template.format(cleaned)) return format_as_template(summary)这个技能通过OpenClaw的插件机制注册后,就能在Web控制台或飞书机器人中直接调用。
4. 实战效果与优化
4.1 典型使用场景
每周三的立项会现在完全交给自动化流程处理:
- 会议使用Zoom本地录音(保存为meeting.mp3)
- 会后执行命令触发流程:
openclaw run meeting-miner --input ~/Downloads/meeting.mp3 - 约8分钟后收到飞书消息通知,包含:
- 清理后的完整转录文本(作为附件)
- 结构化会议摘要
- 待办事项清单
4.2 遇到的典型问题
问题1:发言人识别错误
- 现象:多人快速对话时,Whisper无法区分说话人
- 解决:在会前收集参会者语音样本,训练简单的声纹模型辅助识别
问题2:行动项提取不完整
- 现象:模型有时会遗漏模糊表达的任务(如"小明有空看看")
- 解决:在prompt中加入我们团队特有的任务表达习惯示例
问题3:长会议内存溢出
- 现象:3小时以上的会议处理会失败
- 解决:实现自动分块处理机制,每30分钟内容为一个处理单元
5. 安全与隐私考量
这套方案最让我满意的是数据全程本地处理的特性:
- 语音文件始终不离开本地磁盘
- 千问模型通过内网API调用
- 中间产物(转录文本、处理结果)保存在加密的OpenClaw工作区
- 最终纪要通过企业微信/飞书等安全通道分享
相比使用第三方会议纪要SaaS,不仅节省了每年数千元的订阅费用,更重要的是避免了商业机密外泄的风险。我们的法务团队审核后,确认该方案符合公司数据安全规范。
获取更多AI镜像
想探索更多AI镜像和应用场景?访问 CSDN星图镜像广场,提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。