018、机器学习基础：监督学习、无监督学习与强化学习-程序员充电站

018 机器学习基础：监督学习、无监督学习与强化学习

去年调一个STM32上的手势识别模型，跑KNN分类器，死活准确率上不去。翻来覆去查数据，发现训练集里“握拳”和“张开”的标签贴反了三分之一。那一刻我盯着屏幕，突然意识到一个残酷的事实：机器学习项目里，80%的坑不在算法，而在你根本没搞懂自己到底在解决哪类问题。

今天这篇笔记，不扯数学公式，只聊三件事：监督学习、无监督学习、强化学习。它们不是教科书里并列的三个章节，而是三种完全不同的“与数据对话的方式”。搞混了，轻则模型不收敛，重则整个项目方向跑偏。

一、监督学习：你给答案，它学规律

先讲个真实翻车现场。有次给工业相机做缺陷检测，采集了5000张PCB板照片，每张都人工标注了“有焊渣”“缺元件”“正常”。跑了个CNN，训练loss降得漂亮，上线第一天误报率飙到40%。排查发现：标注员把“正常但有灰尘”全标成了“缺元件”——监督学习的命根子是标签质量，不是模型结构。

监督学习的本质是：你手里有一堆“问题-答案”对，让模型自己找映射关系。嵌入式里最常见的场景：

分类：判断传感器数据属于哪一类（比如加速度计波形是“走路”还是“跑步”）
回归：预测连续数值（比如根据温湿度预测空调功率）

踩过的坑清单：

标签噪声比想象中致命。STM32上跑轻量模型，参数少，抗噪能力弱。标签错5%，准确率可能掉20%

告别Selenium！用影刀RPA零代码搞定网页自动化与数据抓取（附实战案例）

告别Selenium！用影刀RPA零代码搞定网页自动化与数据抓取（附实战案例） 在数字化办公时代，网页数据抓取和自动化操作已成为市场分析、竞品监测、财务对账等场景的刚需。传统解决方案如Selenium虽功能强大，却让非技术背景…

李华

比特币钱包密码恢复终极指南：如何找回丢失的密码和助记词

比特币钱包密码恢复终极指南：如何找回丢失的密码和助记词【免费下载链接】btcrecover An open source Bitcoin wallet password and seed recovery tool designed for the case where you already know most of your password/seed, but need assistance in trying…

李华

别再只会用DC-DC了！手把手教你用SPX3819这类LDO芯片，搞定5V转3.3V的电路设计（附外围电路图）

从零实战：用SPX3819打造高效5V转3.3V电源系统当你在深夜调试一块STM32开发板时，突然发现USB供电的5V电压让芯片发烫——这种场景是否似曾相识？对于嵌入式开发者而言，构建一个稳定、低噪声的3.3V供电系统往往是项目成功的第一步。…

李华

3个步骤将你的Scratch项目变成跨平台桌面应用

3个步骤将你的Scratch项目变成跨平台桌面应用【免费下载链接】packager Converts Scratch projects into HTML files, zip archives, or executable programs for Windows, macOS, and Linux. 项目地址: https://gitcode.com/gh_mirrors/pack/packager 你是否曾为Scrat…

李华

T2080工控主板开发实战：从核心特性到系统部署全解析

1. 项目概述：从一块“硬核”主板说起最近在整理手头的嵌入式项目资料，翻出了一块来自东大金智科技的T2080工控主板。这块板子在我经手过的众多嵌入式平台里，算是相当有“分量”的一位——不是指物理重量，而是其内在的“硬核”实力…

李华

模型逆向攻击（MIA）实战剖析：从原理到攻防演进

1. 模型逆向攻击（MIA）的本质与核心原理第一次听说模型逆向攻击（Model Inversion Attack）时，我脑海中浮现的是黑客电影里那种对着键盘一通乱敲就能破解系统的场景。但真正深入研究后才发现，MIA更像是一种&q…

李华