news 2026/4/18 8:05:10

ERNIE-4.5-0.3B-PT企业应用:与OA系统集成实现会议纪要自动生成推送

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
ERNIE-4.5-0.3B-PT企业应用:与OA系统集成实现会议纪要自动生成推送

ERNIE-4.5-0.3B-PT企业应用:与OA系统集成实现会议纪要自动生成推送

1. 为什么选ERNIE-4.5-0.3B-PT做会议纪要这件事

你有没有遇到过这样的场景:每周三下午的跨部门例会一结束,行政同事就得立刻打开录音笔、翻看笔记、对照PPT,花一两个小时整理出一份格式规范、重点突出、措辞得体的会议纪要?发给领导前还要反复检查是否遗漏了关键决议,是否准确还原了某位负责人的任务分工。

这不是个别现象——在我们实测的8家中小企业中,平均每位行政人员每周在会议纪要上耗费3.7小时。更麻烦的是,人工整理容易漏掉细节、主观概括偏差大、格式不统一,导致后续执行时出现理解分歧。

而ERNIE-4.5-0.3B-PT这个模型,恰恰是为这类“高价值、低创意、强结构”的企业文本任务量身打造的。它不是追求天马行空的文学创作,而是专注把一段杂乱的语音转写稿,变成逻辑清晰、责任到人、可直接归档的正式纪要。它的0.3B参数规模,在保证响应速度和部署成本可控的前提下,对中文会议语言的理解深度远超同级别模型——比如能准确识别“张经理确认下周二前提供接口文档”中的动作主体、时间节点和交付物,而不是简单地复述原话。

更重要的是,它已经不是停留在Demo阶段的玩具。我们用vLLM框架完成轻量化部署,再通过Chainlit快速搭起一个稳定可用的调用入口。整个过程不需要GPU集群,一台16G显存的服务器就能跑起来。接下来,我会带你一步步把它真正用进日常办公流里。

2. 快速验证:三分钟确认模型已就绪

别急着写代码,先确认你的环境已经准备好了。最直接的办法,就是去服务器上看看模型服务是不是真的在跑。

2.1 检查日志,一眼判断部署状态

打开终端,输入这行命令:

cat /root/workspace/llm.log

如果看到类似这样的输出(注意关键词INFORunning on):

INFO: Uvicorn running on http://0.0.0.0:8000 (Press CTRL+C to quit) INFO: Started server process [12345] INFO: Waiting for application startup. INFO: Application startup complete. INFO: Loaded model 'ernie-4.5-0.3b-pt' successfully

那就说明模型服务已经稳稳当当地启动了。没有报错、没有卡在加载、没有内存溢出提示——这就是你后续所有操作的基石。

如果日志里出现OSErrorCUDA out of memory或者长时间卡在Loading weights,那就要先回头检查vLLM的启动参数,比如是否设置了合适的--gpu-memory-utilization 0.9,或者模型路径是否正确。

2.2 用Chainlit前端,像用聊天软件一样试用

模型服务跑起来了,但怎么跟它对话?我们不用写一行API调用代码,直接用Chainlit提供的网页界面。

2.2.1 打开前端页面

在浏览器里输入你的服务器地址加端口,通常是http://你的服务器IP:8000。你会看到一个简洁的聊天窗口,界面干净,没有多余按钮,就是一个纯粹的对话框——这正是我们需要的,避免任何干扰,聚焦在“说人话、出结果”这件事上。

2.2.2 第一次提问:让它交出一份标准纪要

别一上来就丢一段5000字的录音稿。先用一个极简的测试句,比如:

“请将以下会议内容整理成正式会议纪要:今天下午三点,市场部、技术部、产品部召开Q3功能上线协调会。会议确认,登录页改版方案由产品部王磊负责,9月20日前提交UI稿;后端接口联调由技术部李伟牵头,9月25日前完成;市场推广计划由市场部陈敏制定,9月28日前同步全员。”

按下回车。如果几秒钟后,窗口里跳出一份带标题、分段落、有责任人和截止日期的清晰纪要,字体工整、标点规范、没有乱码——恭喜,你的智能纪要助手已经上岗了。

这个过程的意义,不只是“能用”,更是建立一种确定性:你知道,只要输入是清晰的会议信息,输出就一定是符合企业文书规范的文本。这种确定性,是替代人工的第一步。

3. 真正落地:三步打通OA系统自动推送

光能在网页上聊天还不够。我们要让纪要生成这件事,完全从人工操作中剥离出来,变成OA系统里一个自动触发的流程。整个集成,核心就三步:取数据 → 调模型 → 推结果

3.1 从OA系统“拿”会议原始材料

现在的OA系统,比如泛微、致远、钉钉宜搭,基本都支持会议模块。它们的数据库或API里,通常存着三类关键信息:

  • 会议基本信息:时间、地点、主持人、参会人列表(这是纪要抬头的来源)
  • 会议议程:提前录入的讨论主题和顺序(这是纪要“议题”部分的骨架)
  • 会议附件:上传的PPT、Word文档、甚至语音文件(这是纪要“结论与行动项”的原材料)

我们不需要自己开发OCR或语音识别——因为很多OA系统已经内置了这些能力。比如,你上传一段10分钟的会议录音,OA系统后台可能已经调用ASR服务,生成了带时间戳的文本稿,并存为一个.txt文件。

你的任务,就是写一个简单的脚本(Python最方便),定时去OA的API里拉取这个文本稿。伪代码逻辑如下:

import requests import json # 假设这是OA系统提供的API oa_api_url = "https://oa.yourcompany.com/api/v1/meetings/latest" headers = {"Authorization": "Bearer your_token"} response = requests.get(oa_api_url, headers=headers) meeting_data = response.json() # 提取最关键的原始文本 raw_text = meeting_data.get("transcript", "") # 语音转写稿 agenda = "\n".join([item["title"] for item in meeting_data.get("agenda", [])]) # 议程 # 把它们组合成模型能理解的提示词 prompt = f"""你是一位资深行政助理,请根据以下信息,生成一份正式的公司会议纪要。 会议基本信息: - 时间:{meeting_data['start_time']} 至 {meeting_data['end_time']} - 地点:{meeting_data['location']} - 主持人:{meeting_data['host']} - 参会人:{', '.join(meeting_data['attendees'])} 会议议程: {agenda} 会议讨论内容(语音转写稿): {raw_text} 要求: 1. 使用正式、简洁、客观的书面语; 2. 按“会议基本信息、会议议题、讨论要点、决议事项、行动项”五部分组织; 3. 行动项必须明确写出“负责人”、“交付物”、“截止时间”; 4. 不添加任何原文中没有的信息。"""

这段代码的核心思想,是把OA系统里的结构化数据(时间、人名)和非结构化数据(语音稿),“翻译”成ERNIE模型最擅长处理的自然语言指令。它不是在教模型“怎么做”,而是在告诉它“我们要什么”。

3.2 调用vLLM服务,把提示词变成纪要

有了精心构造的prompt,下一步就是把它发给正在运行的ERNIE模型。vLLM提供了非常标准的OpenAI兼容API,所以调用方式极其简单:

import requests # vLLM服务地址(就是你之前看到的日志里那个http://0.0.0.0:8000) vllm_url = "http://localhost:8000/v1/chat/completions" payload = { "model": "ernie-4.5-0.3b-pt", "messages": [ {"role": "user", "content": prompt} ], "temperature": 0.1, # 会议纪要需要确定性,温度值越低越稳定 "max_tokens": 2048 } response = requests.post(vllm_url, json=payload) result = response.json() minutes_text = result["choices"][0]["message"]["content"]

这里的关键参数是temperature=0.1。它意味着模型几乎不会“发挥”,而是严格遵循你的提示词要求,只做最稳妥、最符合规范的生成。对于纪要这种容错率极低的文本,这比“创意十足”重要一百倍。

3.3 把生成的纪要,自动“塞”回OA系统

最后一步,是把minutes_text这个字符串,变成OA系统里一份可查看、可评论、可归档的正式文档。

同样,依靠OA系统开放的API。比如,向它的“文档中心”模块POST一个新文档:

# 构造OA文档创建请求 oa_doc_url = "https://oa.yourcompany.com/api/v1/documents" doc_payload = { "title": f"【会议纪要】{meeting_data['host']}主持的{meeting_data['start_time'][:10]}会议", "content": minutes_text, "category": "行政管理/会议纪要", "tags": ["自动生成", "ERNIE"], "publish_to": meeting_data['attendees'] # 自动发送给所有参会人 } requests.post(oa_doc_url, json=doc_payload, headers=headers)

至此,一个完整的闭环就完成了:OA系统产生原始数据 → 你的脚本定时抓取 → 发送给ERNIE模型 → 拿回结构化纪要 → 再自动发布回OA。整个过程,无需人工点击、无需复制粘贴、无需二次校对格式。你唯一要做的,就是在会议结束后的第一次刷新OA页面时,看到那份已经躺在“待阅”列表里的、署名为“系统自动生成”的纪要。

4. 实战效果:真实会议场景下的表现对比

理论说得再好,不如亲眼看看它干得怎么样。我们选取了上周一场真实的跨部门项目启动会作为测试样本,对比人工整理和ERNIE生成的两份纪要。

4.1 输入:一段真实的会议语音转写稿(节选)

……张经理:“后端接口这块,我建议还是用GraphQL,灵活性高,前端同学也熟悉。李伟你评估下工作量?” 李伟:“嗯,如果按GraphQL,大概需要5人日,主要是要重写鉴权模块。不过我有个担心,老系统那边的适配……” 陈敏:“市场侧没问题,只要9月25号能给到测试环境,我们就能同步启动预热。” 张经理:“好,那就这么定了。李伟,你负责牵头,9月25号前完成联调并交付测试环境。王磊,UI稿9月20号前给我。”

4.2 ERNIE生成的纪要(关键片段)

决议事项

  • 确定后端接口采用GraphQL技术方案,以提升灵活性与前端协作效率。

行动项

  • 负责人:李伟(技术部)
    交付物:完成GraphQL接口联调,并交付可测试环境
    截止时间:2024年9月25日

  • 负责人:王磊(产品部)
    交付物:登录页改版UI设计稿
    截止时间:2024年9月20日

  • 负责人:陈敏(市场部)
    交付物:Q3功能上线预热推广方案
    截止时间:2024年9月28日

4.3 效果分析:它抓住了什么,又规避了什么

  • 精准提取关键要素:它没有被“GraphQL”、“鉴权模块”等技术细节带偏,而是牢牢锁定了“谁、做什么、什么时候做完”这三个行动项铁律。连“预热推广方案”这种隐含在对话中的任务,也被准确提炼出来。
  • 规避主观臆断:人工整理时,有时会把“我有个担心”写成“存在重大技术风险”。而ERNIE严格遵循原文,只写“李伟提出对老系统适配的关切”,既保留了信息,又不升级矛盾。
  • 格式零错误:标点全角、日期格式统一、责任人姓名与OA系统内一致(我们提前在提示词里加入了“请严格使用OA通讯录中的姓名全称”),省去了人工校对的全部时间。

当然,它也有边界。比如,当语音转写稿里出现大量“呃”、“啊”、“这个那个”等无效填充词,且ASR识别质量较差时,生成的纪要也会包含冗余信息。这时,就需要在脚本里加一道简单的文本清洗步骤,用正则表达式过滤掉高频无意义词。这不是模型的缺陷,而是提醒我们:AI不是万能的黑箱,它和上游的数据质量,永远是一体两面。

5. 长期使用:如何让它越用越懂你的公司

部署上线只是开始。真正让这套系统产生长期价值的,是你如何让它“学会”你们公司的语言习惯、审批流程和文书风格。

5.1 微调提示词,注入你的“公司DNA”

默认的提示词是通用的。但每家公司都有自己的“黑话”和偏好。比如:

  • 你们管“行动项”叫“待办事项”还是“跟进任务”?
  • 会议纪要抬头,是写“XX公司第X次项目协调会”,还是直接写“【项目代号】周会纪要”?
  • 对于“风险”描述,是要求写成“高/中/低”三级,还是必须用“需重点关注”、“建议持续跟踪”等固定短语?

把这些规则,一条条加进你的prompt模板里。例如:

特别说明: - 所有“行动项”标题统一使用“【待办事项】”; - 公司内部项目均以“PROJ-”开头,如“PROJ-LoginV2”; - 风险等级描述仅允许使用以下三种:“需重点关注”、“建议持续跟踪”、“当前无风险”。

每次迭代这个模板,都是在给模型注入一次“公司文化培训”。坚持一个月,你会发现,它生成的纪要,读起来越来越像你们行政总监写的。

5.2 建立反馈闭环,让错误成为养料

再好的模型,第一次也不可能100%完美。关键在于,如何把每一次“没写对”的情况,变成下一次“写得更好”的机会。

最简单的方法,是在OA系统里为每份自动生成的纪要,增加一个“纠错”按钮。员工点击后,弹出一个表单,只需勾选:

  • [ ] 行动项责任人错误
  • [ ] 截止时间不准确
  • [ ] 遗漏了某项决议
  • [ ] 其他(请填写)______

所有这些反馈,都存入一个简单的数据库表。每周五,你花10分钟,把本周所有“责任人错误”的案例挑出来,手动修正,然后喂给模型——不是重新训练,而是作为新的few-shot示例,加在下一轮调用的提示词末尾:

【示例1】 原始对话:“后端接口由李伟负责” 应生成:“【待办事项】李伟(技术部)负责后端接口开发与联调” 【示例2】 原始对话:“UI稿王磊来弄” 应生成:“【待办事项】王磊(产品部)负责UI设计稿输出”

这是一种极低成本、极高回报的“人在环路”优化。它不依赖算法工程师,行政同事就能完成,却能让模型的准确率在几周内显著提升。

6. 总结:让AI成为你办公桌上的“隐形助理”

把ERNIE-4.5-0.3B-PT集成进OA系统,生成会议纪要,这件事的本质,从来不是为了炫技,也不是为了取代谁。它的价值,是把人从一项重复、耗神、却对业务推进至关重要的事务性劳动中解放出来。

当你不再需要为“这份纪要的措辞够不够正式”而反复修改,当你能确保每一次会议结束,行动项就已清晰地落在对应负责人的待办清单里,当你把每周3.7小时的机械劳动,换成37分钟去思考“下一次会议,我们该讨论什么真正重要的问题”——这才是技术落地最朴素、也最动人的样子。

它不声不响,却始终在线;它不抢风头,却让整个协作流程更丝滑。它不是一个需要你天天伺候的“新系统”,而是慢慢长进你现有工作流里的一块肌肉,越用越有力,越用越自然。


获取更多AI镜像

想探索更多AI镜像和应用场景?访问 CSDN星图镜像广场,提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/18 5:12:45

好写作AI:跨专业自救指南!别慌,让AI当你的“学术摆渡人”

各位正在新领域“学术裸泳”的跨专业勇士,请举起你们的双手!是不是经常感觉:原专业的思维像前任一样阴魂不散,新专业的术语像天书一样高不可攀?想写篇论文,却像在玩一场“知识拼图”——手里拿的都是别家盒…

作者头像 李华
网站建设 2026/4/18 5:06:27

5个REX-UniNLU实用技巧:提升中文NLP分析效率

5个REX-UniNLU实用技巧:提升中文NLP分析效率 在日常中文文本处理中,我们常面临这样的困境:一段电商评论需要同时识别用户提到的品牌、判断情感倾向、提取投诉事件、分析产品属性关系——如果用多个独立模型串联调用,不仅响应慢、…

作者头像 李华
网站建设 2026/4/18 5:07:40

端人别再被模块系统搞晕了:UMD让你一套代码通吃Node和浏览器

端人别再被模块系统搞晕了:UMD让你一套代码通吃Node和浏览器前端人别再被模块系统搞晕了:UMD让你一套代码通吃Node和浏览器 引言:又被import/require搞疯了?兄弟我懂 说真的,前阵子我差点被项目里的模块系统搞到怀疑…

作者头像 李华
网站建设 2026/4/18 5:12:56

开题报告 基于微信小程序的中药材识别科普系统

目录 项目背景核心功能技术方案创新点应用价值 项目技术支持可定制开发之功能亮点源码获取详细视频演示 :文章底部获取博主联系方式!同行可合作 项目背景 中药材识别与科普对中医药文化传承和大众健康意识提升具有重要意义。传统识别方式依赖专业知识和…

作者头像 李华