news 2026/6/9 21:42:56

结构化机器学习项目 第二周:误差分析与学习方法(一)误差分析与快速迭代

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
结构化机器学习项目 第二周:误差分析与学习方法(一)误差分析与快速迭代

周为第三课的第二周内容,本周的内容关于在上周的基础上继续展开,并拓展介绍了几种“学习方法”,可以简单分为误差分析和学习方法两大部分。

其中,对于后者的的理解可能存在一些难度。同样,我会更多地补充基础知识和实例来帮助理解。

本篇的内容关于误差分析与快速迭代,是在上周的优化策略上的再一次完善。

1.如何误差分析?

误差分析,一个在理工科里常见的词,我们就不多介绍了,在这里更关键的是,如何在DL领域进行科学的误差分析?

我们继续用课程里的例子来进行介绍:

image.png

就像例子里所说,我们找到了一个误差原因,可是我们并不知道花费大量时间解决这个问题后指标能上升多少,这个问题到底占全部误差的多少?如何找到最大问题?这就是误差分析的科学所在。

由此,我们继续往下看:

image.png

image.png

错误现象除此之外还有很多,比如滤镜,标签标注错误等等。

总之,在误差分析中,我们可以找一组错误样例并统计不同错误类型的样本占比,就可以找到更需要优先被解决的问题。

下面的内容,我们再展开一些需要细化的方面和其他策略。

2. 标签标注错误

之前,我们都一直默认数据集是一定正确的。

具体说一下,在监督学习中,每个数据对应其标签,所有猫图像对应一个标签,其他类同理,不会出现一个猫的标签确是狗的情况。

但实际上,图片的标签也是人工标注的,因此,出现这种错误并不奇怪,我们由此来展开这种情况带来的影响和相应的处理措施。

来看这个例子:

image.png

因此,总结来说,这种标注错误在训练集中的影响往往不大。

另外,这里要专门强调一点:

稳健性是指系统或模型在面对变化或干扰时保持有效性和稳定性的能力,就像面对此时的标注错误。

你也可以叫他健壮性,稳定性等等可以表达这类含义的词。

但是在论文里或者其他学术相关的地方,我们一般统一叫它鲁棒性。

这种叫法是源于英文中的“robustness”一词,是它的音译,来更准确地传达英文原意。

所以,如果你在别的地方看到了鲁棒性,请记住:鲁棒性就是稳健性,稳健性就是鲁棒性。

(如果你看了这节的视频课程,会发现弹幕因为这个问题吵起来了)

我们继续:

image.png

3.快速迭代

实际上这部分的思想和软件工程中的敏捷开发有些相似,适用于模型的构建初期阶段,很容易理解,就不多展开了。

image.png

4.总结

概念 原理 比喻

误差分析(Error Analysis) 从错误样本中统计不同类型错误的占比,以确定最影响性能、最值得优先解决的问题。 就像你做完一张考卷后,不是盲目重学一整本书,而是先数一数:数学丢分多,语文只错一道,那就先补数学。

数据集标注错误(Label Error) 训练集中少量“猫被标成狗”这类错误通常不会使模型崩溃,但过多会导致模型混乱。 就像有人偶尔喊错你名字你也能反应过来,但如果十个人里有一半都叫你错名,你就不知道谁是谁了。

鲁棒性(Robustness) 模型在面对噪声、标注问题、输入扰动等情况下仍保持稳定性能的能力。 像一个听力很好的朋友:周围很吵他也能准确听懂你说话,就是很“鲁棒”。

快速迭代(Rapid Iteration) 不用一次做出完美模型,而是做—>训练—>看结果—>修正—>继续的循环,类似敏捷开发。 像画画:先画草稿确定构图,再慢慢精细化,而不是一开始就拼命画细节。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/10 13:22:57

1小时用Vue3文档完成项目原型开发

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 构建一个Vue3快速原型生成器,功能包括:1) 从Vue3文档中提取常用组件模板;2) 可视化拖拽界面组合组件;3) 一键生成可运行的项目骨架&a…

作者头像 李华
网站建设 2026/6/10 15:08:08

延凡 APM 应用性能管理系统:AI+eBPF 驱动全栈智能可观测

延凡 APM 应用性能管理系统是专为中小企业、互联网团队及数字化转型企业打造的轻量化智能可观测平台,紧扣《数据中心智能化运维综合管控技术要求》(YDT 6231-2024)核心规范,聚焦 “故障快诊、性能优化、合规审计、成本可控” 核心…

作者头像 李华
网站建设 2026/6/10 1:07:18

如何导入和导出Android联系人(4 种可行方法)

管理联系人是Android用户的重要任务之一,尤其是在更换手机、创建备份或在帐户之间共享联系人时。幸运的是, Android提供了多种快速安全地导入和导出联系人的方法。无论您是新手还是技术娴熟的用户,本指南都将引导您轻松掌握导入和导出Android…

作者头像 李华
网站建设 2026/6/10 14:58:46

网络安全到底要怎么学?这份3个月上岸攻略,已经帮500+小白

网络安全学习宝典:3个月入门VS半年挣扎,收藏这份高效学习法,少走弯路! 文章系统化呈现了网络安全高效学习路线,从理论知识、渗透测试基础、操作系统、网络协议到Web渗透,强调编程能力是"脚本小子&quo…

作者头像 李华
网站建设 2026/6/10 13:21:57

如何使用openCustomDialog禁止手势关闭的实现方案?提供源码和方案思路

如何使用openCustomDialog禁止手势关闭的实现方案?提供源码和方案思路 一、结论 要实现禁止手势 / 外部点击关闭弹窗,核心依赖两个关键配置: 1、autoCancel 参数: 控制点击弹窗外部遮障层是否触发关闭,设置为 false 可直接禁用该关闭方式。 **2、onWillDismiss 回调: *…

作者头像 李华
网站建设 2026/6/10 14:51:32

电商秒杀系统实战:Redisson分布式锁的最佳实践

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 创建一个电商秒杀场景下的Redisson分布式锁应用示例。要求:1. 模拟商品库存扣减场景 2. 实现不同粒度的锁控制(商品ID级别和用户ID级别) 3. 处理…

作者头像 李华