Agent Skill 开发实战:跟着口播剪辑学习 AI 工具开发
开源地址 :https://github.com/threelab/claude-mate-skills
先聊聊:这个课程能帮你做什么?
想象一下:你是一个口播博主,录完视频发现里面有好多"嗯、啊、那个、然后…",还有好几处说错了又重说的。如果手动剪辑,10分钟的视频可能要花20分钟去听、去找、去剪。
但如果有个工具能自动帮你做这些事呢?比如:
- 自动提取音频- 从视频里把声音扒出来
- 语音转文字- 告诉你每个字在第几秒说的
- 标记"废话"- 把语气词、停顿、重复的地方标出来
- 帮你预览- 给你一个界面,让你看着文字来选择删什么
- 自动剪辑- 根据你的选择生成新视频
这就是这个课程要带你做的事——开发一个智能的口播视频剪辑工具。
更重要的是,你会学会如何把这些能力打包成一个Agent Skill(智能技能包),让 AI 能理解你的需求并自动完成任务。
这个课程适合谁?
| 情况 | 能不能学 |
|---|---|
| 编程小白,从零开始 | ✅ 完全可以,跟着做就行 |
| 只会一点点 JavaScript | ✅ 够用了 |
| 录口播视频想提高效率 | ✅ 最适合你 |
| 想学 AI 工具开发 | ✅ 这是个很好的起点 |
你会学到什么?
通过做这个口播剪辑工具,你会掌握:
技术层面:
- 怎么让电脑听懂人话(调用语音识别 API)
- 怎么让电脑处理视频(FFmpeg 工具)
- 怎么做一个网页界面(前端开发)
- 怎么让网页和服务器对话(前后端交互)
思维层面:
- 怎么把一个复杂问题拆成小步骤
- 怎么设计让用户容易理解的界面
- 怎么定义"规则"让 AI 帮你做决策
课程怎么安排的?
这个项目分成5 个步骤,每个步骤都是独立的,但又一环扣一环:
第1步:搭建项目框架
就像装修房子前先搞清楚户型图。
- 你想让这个工具做什么?(帮我剪口播视频)
- 需要哪些"房间"?(配置区、工具区、界面区)
- 每个"房间"放什么东西?
这一步不写太多代码,主要是搞清楚:我们要做什么、怎么分工。
第2步:定规则和配置
就像开店前先定好"店规"。
- 什么内容该删?(语气词、长停顿)
- 什么内容不能删?(关键信息、完整句子)
- 用户喜欢什么风格?(保守一点还是大胆一点?)
这一步很重要,因为规则定好了,AI 才有判断的依据。
就像你招聘一个剪辑助理,得先告诉他:
"嗯、啊、那个"这样的词可以删;中间停顿超过2秒可以删;但是如果是口误后纠正了,保留后面那句就行。
第3步:让工具干活
就像招聘员工,给他们分配任务。
现在你需要两个"员工":
| “员工” | 做什么 | 现实中的类比 |
|---|---|---|
| 语音识别 API | 听音频,告诉你每句话在第几秒 | 一个超快的速记员 |
| FFmpeg | 处理视频和音频文件 | 一个专业视频剪辑师 |
这一步我们会学习:
- 怎么"雇佣"这些员工(申请 API Key、配置工具)
- 怎么给他们发指令(写代码调用)
- 他们出错了怎么办(错误处理)
第4步:做一个好用的界面
就像开实体店,得有个柜台让顾客来办事。
现在工具都准备好了,但用户怎么用呢?需要一个界面:
- 用户能选择视频文件
- 用户能看到处理进度
- 用户能看到结果
这一步我们会做一个网页界面,就像你用过的那些在线工具一样。
你会学会:
- 怎么让网页和电脑"说话"(前后端通信)
- 怎么显示"正在处理中…"(状态管理)
- 怎么处理"我想跳过这一步"(流程控制)
第5步:审核页面和发布
就像产品完工,再加点高级功能,然后摆上货架。
最后一步我们要做两个事:
- 做一个"审核页面"- 让用户看着每一句话,选择删哪些。就像你在 Word 里编辑文章一样,但它还能同步播放视频。
- 把项目打包好- 让别人也能用你的工具,或者自己以后方便调用。
你会学会:
- 怎么让文字和视频同步播放
- 怎么做"选中/取消"的交互
- 怎么把项目整理好,方便上传分享
用生活中的例子理解整个流程
假设你是一个小饭馆老板(这就是你的角色):
| 阶段 | 你在做什么 | 对应我们的项目 |
|---|---|---|
| 规划 | 我想开一家卖什么菜的店? | 第1步:定义项目目标 |
| 定规则 | 客人点单后多久上菜?菜怎么做? | 第2步:配置和原则 |
| 雇人 | 招聘厨师、服务员、收银员 | 第3步:集成工具和 API |
| 店面 | 装修店铺、设收银台、菜单 | 第4步:做用户界面 |
| 优化 | 增加特色菜、搞好卫生 | 第5步:高级功能和发布 |
我们的"口播剪辑工具"就是这个饭馆:
- 厨师= FFmpeg(处理视频)
- 速记员= 火山引擎 API(转写文字)
- 服务员= 前端界面(和用户交互)
- 厨师长= 后端服务器(调度一切)
- 菜谱= 配置文件(规则和偏好)
这样是不是就好理解了?
学习建议
学这个课程的心态:
- 不要死记硬背- 理解思路比记住代码重要
- 跟着做- 看完一步就去实践一步
- 不懂就问- 遇到问题是正常的
- 先跑起来再优化- 先让工具能用,再想怎么用好
推荐学习顺序:
- 完整看一遍第1-2步(搞清楚"做什么"和"为什么")
- 边看第3-4步边跟着写代码
- 第5步独立完成,检验学习成果
- 用真实的口播视频测试一下你的工具!
准备好了吗?
如果你是一个:
- 想提高剪辑效率的口播博主
- 对 AI 工具开发感兴趣的学习者
- 想从零开始做一个完整项目的开发者
那么…
👉开始第1步:搭建项目框架
版权声明:http://mowanyan.com/