069、卷积神经网络(CNN)原理与实现:从像素到智能的跨越
一、那个让我顿悟的调试夜晚
上周三凌晨两点,实验室的咖啡机已经空了第三轮。我在调试一个手写数字识别模型,准确率卡在92%死活上不去。传统全连接网络把28×28的图片拉成784维向量,参数爆炸到70多万个,训练了三个小时还在过拟合的边缘挣扎。当我第一次把卷积层替换进去,参数量骤降到2万,准确率却飙到98.5%——那一刻我盯着终端输出的训练曲线,突然理解了为什么说“卷积是计算机视觉的基石”。
二、卷积到底在卷什么?
很多人第一次接触卷积都被数学公式吓退,其实核心思想简单得惊人。想象你拿着一个手电筒在黑暗的房间里扫视墙上的壁画,手电筒的光圈每次只能照亮一小块区域,你移动手电筒逐步看清整幅画——卷积核就是那个手电筒,特征图就是你看到的部分画面。
importnumpyasnp# 自己手搓一个卷积操作,比调库更能理解本质defnaive_conv2d(inputs