news 2026/4/17 22:19:35

为什么标准化要用均值0和方差1?

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
为什么标准化要用均值0和方差1?


为什么标准化要把均值设为0、方差设为1?

先说均值。均值就是平均数,所有观测值加起来除以个数。

μ是均值,n是数据点总数,xᵢ是每个数据点,所以均值就是数据的重心位置。比如均值是20,那20就是平衡点。这不是说所有点到20的距离相等而是说两边的"重量"刚好在20这个位置抵消掉。

而方差衡量的是数据有多分散,定义是每个值与均值偏差的平方的平均值。

n是数据点总数,xᵢ是每个数据点,μ是均值。

那均值为0有什么用?

可以把数据想象成坐标系里的一团“点云”。每个值减去均值(x — μ)之后,整团云就被平移到了原点位置。数据不再飘在某个角落而是以原点为中心分布。

这对很多机器学习算法都有好处,尤其是用梯度下降的时候。数据居中之后优化过程更平衡、收敛也更快。因为特征要是一开始就偏离原点很远,训练起来会麻烦不少。

那方差为1呢?

这是为了防止某个特征"欺负"其他特征。

举个例子:年龄和薪资两个特征,年龄范围10-70,薪资范围10,000-70,000。直接喂给模型的话,模型会觉得薪资比年龄重要1000倍(数字大嘛)。但这两个特征本来是独立的,凭什么薪资就更重要?

所以标准化就是除以标准差,让所有特征的方差都变成1。这样年龄和薪资就在同一个量级上了,变化幅度差不多。年龄有个小波动,不会因为薪资数字大就被模型无视掉。

可视化效果:

标准化之前,特征1(红色,小尺度)和特征2(蓝色,大尺度)放一起,红色那条几乎看不见。标准化之后,两个特征尺度一致,都能清晰显示出来。模型终于可以公平对待它们了。

什么时候需要标准化?逻辑回归、神经网络、KNN这类用梯度下降的算法,标准化影响最大。

总结一下:

均值为0让数据居中,方差为1让特征尺度统一。两者配合,算法学得更快,也不会偏心某个特征。至于什么时候该用标准化、什么时候该用MinMaxScaler,老实说我也还在摸索。

https://avoid.overfit.cn/post/957b1b35bc1047e185dab369ae8d84ed

作者:vaishnavi

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/18 3:48:15

吐血推荐专科生必用TOP9AI论文网站

吐血推荐专科生必用TOP9AI论文网站 2026年专科生论文写作工具测评:为何需要一份精准榜单? 随着AI技术在教育领域的深入应用,越来越多的专科生开始借助AI工具提升论文写作效率。然而,面对市场上五花八门的论文辅助平台,…

作者头像 李华
网站建设 2026/4/17 18:03:57

提升效率:如何为企业挑选完美的RFID解决方案

在物联网赋能企业数字化转型的进程中,RFID(射频识别)技术凭借非接触式批量读取、数据实时上传、标签抗磨损等核心优势,已成为物流仓储、智能制造、零售管控等领域提升效率的关键抓手。然而,多数企业在选型时易陷入“参…

作者头像 李华
网站建设 2026/4/18 3:49:26

智能座舱:汽车内饰的交互革命

一、引言:从交通工具到第三空间的本质变革 汽车产业的百年演进中,座舱始终是连接人与车的核心载体。从最初仅满足驾乘功能的机械空间,到如今集成人工智能、物联网、显示技术的智能终端,座舱的进化史本质上是一部人机交互的革命史。…

作者头像 李华
网站建设 2026/4/18 3:51:18

柔性生产:小批量定制与大规模生产的完美融合

一、生产模式的时代演进:从规模标准化到柔性协同化 工业革命以来,生产模式的变革始终围绕着“效率”与“需求”的平衡不断迭代。上世纪初,福特汽车开创的流水线大规模生产模式,以标准化产品、专业化分工和连续性作业为核心&#x…

作者头像 李华
网站建设 2026/4/17 23:09:03

厂房车间设备摆放平面图在线绘制的规范要求和模板大全

在工业生产领域,厂房车间设备摆放平面图是连接生产规划与实际落地的关键技术文档。它不仅直观呈现了车间内设备、通道、仓储区域、安全设施等核心要素的空间布局,更直接影响生产流程的顺畅性、空间利用效率、操作人员安全以及后续产能扩展的可行性。无论…

作者头像 李华
网站建设 2026/4/18 3:48:20

增量微调优化在线更新

💓 博客主页:借口的CSDN主页 ⏩ 文章专栏:《热点资讯》 智能优化:增量微调在线更新的效率革命与伦理挑战 目录 智能优化:增量微调在线更新的效率革命与伦理挑战 引言:动态AI的进化需求 现在时:成…

作者头像 李华