news 2026/5/16 20:47:59

018、机器学习基础:监督学习、无监督学习与强化学习

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
018、机器学习基础:监督学习、无监督学习与强化学习

018 机器学习基础:监督学习、无监督学习与强化学习

去年调一个STM32上的手势识别模型,跑KNN分类器,死活准确率上不去。翻来覆去查数据,发现训练集里“握拳”和“张开”的标签贴反了三分之一。那一刻我盯着屏幕,突然意识到一个残酷的事实:机器学习项目里,80%的坑不在算法,而在你根本没搞懂自己到底在解决哪类问题

今天这篇笔记,不扯数学公式,只聊三件事:监督学习、无监督学习、强化学习。它们不是教科书里并列的三个章节,而是三种完全不同的“与数据对话的方式”。搞混了,轻则模型不收敛,重则整个项目方向跑偏。

一、监督学习:你给答案,它学规律

先讲个真实翻车现场。有次给工业相机做缺陷检测,采集了5000张PCB板照片,每张都人工标注了“有焊渣”“缺元件”“正常”。跑了个CNN,训练loss降得漂亮,上线第一天误报率飙到40%。排查发现:标注员把“正常但有灰尘”全标成了“缺元件”——监督学习的命根子是标签质量,不是模型结构

监督学习的本质是:你手里有一堆“问题-答案”对,让模型自己找映射关系。嵌入式里最常见的场景:

  • 分类:判断传感器数据属于哪一类(比如加速度计波形是“走路”还是“跑步”)
  • 回归:预测连续数值(比如根据温湿度预测空调功率)

踩过的坑清单:

  1. 标签噪声比想象中致命。STM32上跑轻量模型,参数少,抗噪能力弱。标签错5%,准确率可能掉20%
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/16 20:43:16

比特币钱包密码恢复终极指南:如何找回丢失的密码和助记词

比特币钱包密码恢复终极指南:如何找回丢失的密码和助记词 【免费下载链接】btcrecover An open source Bitcoin wallet password and seed recovery tool designed for the case where you already know most of your password/seed, but need assistance in trying…

作者头像 李华
网站建设 2026/5/16 20:42:07

3个步骤将你的Scratch项目变成跨平台桌面应用

3个步骤将你的Scratch项目变成跨平台桌面应用 【免费下载链接】packager Converts Scratch projects into HTML files, zip archives, or executable programs for Windows, macOS, and Linux. 项目地址: https://gitcode.com/gh_mirrors/pack/packager 你是否曾为Scrat…

作者头像 李华
网站建设 2026/5/16 20:38:07

T2080工控主板开发实战:从核心特性到系统部署全解析

1. 项目概述:从一块“硬核”主板说起 最近在整理手头的嵌入式项目资料,翻出了一块来自东大金智科技的T2080工控主板。这块板子在我经手过的众多嵌入式平台里,算是相当有“分量”的一位——不是指物理重量,而是其内在的“硬核”实力…

作者头像 李华
网站建设 2026/5/16 20:36:21

模型逆向攻击(MIA)实战剖析:从原理到攻防演进

1. 模型逆向攻击(MIA)的本质与核心原理 第一次听说模型逆向攻击(Model Inversion Attack)时,我脑海中浮现的是黑客电影里那种对着键盘一通乱敲就能破解系统的场景。但真正深入研究后才发现,MIA更像是一种&q…

作者头像 李华