news 2026/4/20 17:17:53

卷积层里的多输入多输出通道

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
卷积层里的多输入多输出通道
  1. 问题
    探索卷积层里的多输入多输出通道
  2. 方法
    通过网络搜索,加以学习,以此来解决问题
    1. 输入通道
      通常来说,我们会用到彩色图片,彩色图像一般是由RGB三个通道组成的。彩色图片一般会有更加丰富的信息。
      但是转换为灰度会丢失信息,所以在图片的表示中通道数应该是3。我们之前都是只用了一个通道,简单图片对于单通道来说还是ok的,但是对于复杂图像就不行了。


      假设图片的大小为200x200,那么图像的张量表示应该是200x200x3,不仅仅是一个简单的矩阵了。
      当输入有了多个通道之后,假设有2个通道,Input中,前面的是通道0,后面是通道1。那么每个通道就会需要一个卷积核,比如针对通道0的卷积核对通道0做卷积,针对通道1的卷积核对通道1做卷积。再按元素相加,得到我们最终的结果。
      ① 核的通道数与输入的通道数一样。如果有多个通道,每一个通道都有一个卷积核,结果是所有通道卷积结果的和。

      我们假设:

      卷积核也会对应的变成三维的矩阵,但是输出是一个单通道,因为不管输入是多少通道,输出是把结果相加之后产生的。也就是说对每一个通道,把它对应的输入和对应的核做卷积,再按元素相加起来,得到输出
    2. 多个输出通道
      无论有多少通道的输入,到目前为止不论有多少输入通道,我们只会得到单输出通道。
      如果我们希望输出是多维的,得到多输出通道该怎么办呢?
      做法是对每一个输出都有一个自己的三维的卷积核,总共设置多个三维的卷积核,每一个卷积核计算出来的结果作为一个通道,把每一个通道一一做运算,再把它们concat起来得到我们的输出。
      相比于之前单输出通道多了一个参数Co。输出通道数,即卷积核的个数是卷积层的另一个超参数。

      输出里面的第i个通道,其实就是完整的输入X与对应第i个核,做多输入的卷积,然后对所有的i做遍历。

      这样就得到了多输出通道的结果。
      那为什么要这么做呢?
      我们可以认为每一个通道识别出来的都是一些特殊的模式,这是输出通道干的事情。

      多输入通道干什么呢?假设我把这6个通道丢给下一层,下一层要把这每个模式识别出来并组合起来,得到一个组合的模式序列。
      当然, 每一层有多个输出通道时至关重要的。在最流行的神经网络架构中,随着神经网络层数的加深,我们常会增加输出通道的维数,通过减少空间分别率以获得更大的通道深度。
      比如说,我们可以先识别猫的胡须,耳朵,再往上走的话,把这些纹理组合起来,在上层的一些卷积层可能就是识别的猫头。
      直观地说,我们可以将每个通道看作是对不同特征的响应。而现实可能更为复杂一些,因为每个通道不是独立学习的,而是为了共同使用而优化的。
      因此,多输出通道并不仅是学习多个单通道的检测器。
    3. 1*1卷积核
      (1,1)的卷积核是一个常用的卷积核,它并不能识别空间信息,它的作用是融合通道。
      因为1x1卷积层每次只识别一个像素,而不查看该像素与周围像素的关系,所以它并不识别空间信息。

      等价于把整个NhxNw的输入拉成一个长为NhNw的向量,也就是说空间信息没有了,然后通道数拉成特征数Ci。将卷积核重新写成CoxCi,等价于输入为NhxNwxCi,权重为CoxCi的全连接层。
    4. 二维卷积层

      模型储存小,计算量不一定小。
  3. 总结

输出通道数是卷积层的超参数;

每个输入通道有独立的二位积核,所有通道结果相加得到一个输出通道结果;

每个输出通道有独立的三维积核。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/18 11:55:18

ST7789V驱动时序调试:常见问题与解决

ST7789V驱动调试实战:从花屏到丝滑显示的全栈解析在嵌入式开发的世界里,一块小小的彩色屏幕,往往能成为产品成败的关键。而当你满怀期待地焊好ST7789V显示屏模块、烧录代码后,却发现——白屏?花屏?颜色错乱…

作者头像 李华
网站建设 2026/4/18 2:44:12

JLink接线实现SWD调试的实战案例分析

JLink接线实现SWD调试的实战案例分析 在嵌入式系统开发中, “程序烧不进去”、“调试器连不上” 是每个工程师都曾遭遇过的噩梦。你反复点击下载按钮,J-Link Commander却始终报出冰冷的一句: No target connected 。这时,问题…

作者头像 李华
网站建设 2026/4/18 13:32:29

PDF-Extract-Kit扩展开发:添加自定义文档处理模块

PDF-Extract-Kit扩展开发:添加自定义文档处理模块 1. 引言 1.1 背景与需求驱动 在现代文档数字化流程中,PDF作为最通用的格式之一,承载了大量结构化与非结构化信息。尽管已有多种工具支持PDF内容提取,但在实际工程场景中&#…

作者头像 李华
网站建设 2026/4/18 8:46:46

基于STM32的CANFD与Ethernet桥接设计:系统学习方案

从车载到工业:如何用一颗STM32打通CAN FD与以太网的“任督二脉”?你有没有遇到过这样的场景?一台新能源汽车的BMS(电池管理系统)正在高速采集电芯数据,每秒产生上千帧CAN报文;与此同时&#xff…

作者头像 李华
网站建设 2026/4/17 10:54:39

轻量级ModbusTCP协议详解栈在STM32中的集成方案

轻量级ModbusTCP协议栈在STM32中的实战集成:从原理到代码落地为什么我们需要一个“轻”的ModbusTCP?在工业现场,你是否遇到过这样的困境?——想给一台基于STM32F103的小型温控器加上以太网通信功能,却发现标准的LwIP …

作者头像 李华
网站建设 2026/4/18 2:03:32

espi入门必看:超详细版协议基础讲解

eSPI从零到实战:一文搞懂现代计算机的“神经中枢”你有没有想过,当你按下笔记本电源键的瞬间,背后有多少芯片在默默协作?CPU还没醒,是谁接收了按键信号?BIOS是如何被安全加载的?这些看似简单的操…

作者头像 李华