news 2026/6/10 8:01:35

pytorch深度学习笔记12

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
pytorch深度学习笔记12

目录

摘要

输出层的反向传播和实现


摘要

本篇文章继续学习尚硅谷深度学习教程,学习内容是输出层的反向传播和代码实现

输出层的反向传播和实现

在输出层,我们一般使用Softmax作为激活函数。

对于Softmax函数:

其偏导数为:

而对于输出层,一般会直接将结果代入损失函数的计算。对于我们之前介绍的分类问题,这里选择交叉熵误差(Cross Entropy Error)作为损失函数,就可以得到一个Softmax-with-Loss层,它包含了Softmax和Cross Entropy Loss两部分。

导数的计算会比较复杂,可以用计算图表示如下:

简化得:

在代码中可以实现为一个类 SoftmaxWithLoss:

class SoftmaxWithLoss: def __init__(self): self.loss = None self.y = None # softmax的输出 self.t = None # 监督数据 def forward(self, x, t): self.t = t self.y = softmax(x) self.loss = cross_entropy_error(self.y, self.t) return self.loss def backward(self, dout=1): batch_size = self.t.shape[0] if self.t.size == self.y.size: # 监督数据是one-hot-vector的情况 dx = (self.y - self.t) / batch_size else: dx = self.y.copy() dx[np.arange(batch_size), self.t] -= 1 dx = dx / batch_size return dx
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/9 22:33:21

Redis 面试必看:内存淘汰策略解析

文章目录Redis的回收策略(淘汰策略)?一、内存淘汰策略的背景二、Redis支持的内存淘汰策略1. **noeviction(默认策略)**配置代码:优缺点分析:2. **allkeys-lru**配置代码:优缺点分析&…

作者头像 李华
网站建设 2026/6/9 23:58:30

DUT功能验证中的断言使用技巧:实战经验分享

断言实战指南:如何用SVA为DUT验证装上“雷达眼”你有没有遇到过这样的场景?一个复杂的SoC设计在仿真中跑了整整一晚,第二天打开波形一看——数据错乱、协议违规、状态跳转异常……但问题到底出在哪一拍?是驱动没对齐,还…

作者头像 李华
网站建设 2026/6/10 9:56:51

CES 2026 | 重大更新:NVIDIA DGX Spark开启“云边端”模式

作者:毛烁算力日益增长的需求与数据搬运效率之间的矛盾,在过去两年尤为尖锐。当开源模型的参数量级迈过 100B(千亿)门槛, MoE(混合专家)架构成为主流,数百万开发者和科研人员尴尬地发…

作者头像 李华
网站建设 2026/6/10 9:49:23

Java中多线程异步调用

新启动一个或多个线程去完成所要完成的工作,主线程继续执行,互不干扰。异步场景:1、视频文件的格式转换(比较耗时);2、一般都是耗时的步骤,使用一个新的线程去完成,主线程不受限制&a…

作者头像 李华
网站建设 2026/6/10 9:46:37

ddodiag.exe文件丢失找不到问题 免费下载方法

在使用电脑系统时经常会出现丢失找不到某些文件的情况,由于很多常用软件都是采用 Microsoft Visual Studio 编写的,所以这类软件的运行需要依赖微软Visual C运行库,比如像 QQ、迅雷、Adobe 软件等等,如果没有安装VC运行库或者安装…

作者头像 李华
网站建设 2026/6/10 9:47:01

液冷技术的未来:相变冷却、喷淋冷却等前沿技术探索

随着人工智能、大数据和云计算技术的迅猛发展,全球算力需求呈指数级增长。芯片性能提升伴随功耗急剧攀升,传统风冷技术已无法满足高功率密度服务器的散热需求。在这一背景下,液冷技术正从边缘走向主流,成为数据中心散热的新标准。…

作者头像 李华