687678687
7678678
张小明
前端开发工程师
Jupyter Notebook保存为Markdown格式:方便技术文档输出
Jupyter Notebook 保存为 Markdown:让实验成果轻松转化为技术文档 在深度学习项目中,我们常常会经历这样的场景:花了几天时间在 Jupyter Notebook 里调通模型、画出关键图表、写下分析逻辑,最后却卡在“怎么把这一切讲清楚”这一…
Conda环境备份迁移:复制现有PyTorch配置到新机器
Conda环境备份迁移:复制现有PyTorch配置到新机器 在深度学习项目中,最让人头疼的往往不是模型调参,而是“在我电脑上明明能跑”的环境问题。一个团队里五个人装环境,最后可能配出三种不同的行为结果——有人CUDA不识别,…
Conda列出已安装包:筛选出与PyTorch相关的库
Conda筛选PyTorch相关包:高效验证深度学习环境完整性的实践指南 在深度学习项目中,最令人沮丧的场景之一莫过于代码写完准备训练时,却突然报出 ModuleNotFoundError: No module named torch。更糟的是,在远程服务器或团队共享环境…
Conda环境删除恢复:误删后如何找回PyTorch配置
Conda环境删除恢复:误删后如何找回PyTorch配置 在深度学习项目开发中,一个稳定的运行环境往往比代码本身更“脆弱”。你可能花了一整天调试好 PyTorch CUDA 的版本组合,结果一条 conda remove -n pytorch_env --all 命令误执行,…
Conda环境变量设置:指定CUDA_VISIBLE_DEVICES控制GPU使用
Conda环境变量设置:指定CUDA_VISIBLE_DEVICES控制GPU使用 在现代深度学习开发中,我们经常面对这样一个现实:服务器上插着四块A100显卡,但你只想用其中一块跑实验,而同事正占用另一张卡训练大模型。如果程序一启动就抢占…
PyTorch混合精度训练AMP:节省显存并加快收敛速度
PyTorch混合精度训练AMP:节省显存并加快收敛速度 在大模型时代,显存瓶颈成了每个深度学习工程师绕不开的难题。你是否也经历过这样的场景:满怀期待地启动一个Transformer模型训练任务,结果刚进入第一个epoch就收到“CUDA out of m…