news 2026/6/10 16:03:43

GPEN输出文件命名规则自定义:脚本修改详细教程

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
GPEN输出文件命名规则自定义:脚本修改详细教程

GPEN输出文件命名规则自定义:脚本修改详细教程

GPEN人像修复增强模型镜像

本镜像基于GPEN人像修复增强模型构建,预装了完整的深度学习开发环境,集成了推理及评估所需的所有依赖,开箱即用。

1. 镜像环境说明

组件版本
核心框架PyTorch 2.5.0
CUDA 版本12.4
Python 版本3.11
推理代码位置/root/GPEN

主要依赖库:

  • facexlib: 用于人脸检测与对齐
  • basicsr: 基础超分框架支持
  • opencv-python,numpy<2.0,datasets==2.21.0,pyarrow==12.0.1
  • sortedcontainers,addict,yapf

2. 快速上手

2.1 激活环境

conda activate torch25

2.2 模型推理 (Inference)

进入代码目录并使用预置脚本进行推理测试:

cd /root/GPEN

使用下面命令进行推理测试,可以通过命令行参数灵活指定输入图片。

# 场景 1:运行默认测试图 # 输出将保存为: output_Solvay_conference_1927.png python inference_gpen.py # 场景 2:修复自定义图片 # 输出将保存为: output_my_photo.jpg python inference_gpen.py --input ./my_photo.jpg # 场景 3:直接指定输出文件名 # 输出将保存为: custom_name.png python inference_gpen.py -i test.jpg -o custom_name.png

推理结果将自动保存在项目根目录下,测试结果如下:


3. 默认输出命名机制分析

3.1 命名逻辑解析

当你运行inference_gpen.py脚本时,如果没有通过-o参数显式指定输出文件名,系统会根据输入文件的名称自动生成一个默认的输出名。其规则如下:

  • 输入文件名为xxx.jpgxxx.png,则输出文件名为output_xxx.png
  • 若未提供输入文件(使用默认测试图),则输出为output_Solvay_conference_1927.png

这个逻辑隐藏在脚本内部的get_save_path()或类似函数中,通常位于主函数调用前的数据处理部分。

3.2 查看原始命名代码

我们可以通过查看/root/GPEN/inference_gpen.py文件中的关键段落来确认这一行为:

# 示例代码片段(非原生,模拟实际逻辑) if args.input is None: input_path = 'test_images/Solvay_conference_1927.jpg' else: input_path = args.input # 提取文件名(不含扩展名) base_name = os.path.splitext(os.path.basename(input_path))[0] # 构造输出路径 if args.output is None: output_path = f'output_{base_name}.png' else: output_path = args.output

可以看到,默认命名是通过拼接"output_" + 原始文件名(无后缀) + .png"实现的。


4. 自定义输出命名规则的方法

虽然可以通过-o参数临时指定输出名,但如果你需要批量处理多张图像或希望统一命名风格(如按时间戳、用户ID、场景分类等),手动加参数显然不现实。因此,我们需要修改脚本本身来实现持久化、个性化的命名策略。

4.1 修改目标定位

打开推理脚本:

nano /root/GPEN/inference_gpen.py

搜索以下关键字之一:

  • output_path
  • save_path
  • args.output
  • f'output_'

找到负责生成默认输出路径的那一段代码。

4.2 添加时间戳命名规则

假设你希望每次生成的文件都带有时间信息,便于归档和区分,可以这样改写:

import datetime # 在文件顶部导入 datetime 模块 # 找到原输出路径生成逻辑,替换为: if args.output is None: base_name = os.path.splitext(os.path.basename(input_path))[0] timestamp = datetime.datetime.now().strftime("%Y%m%d_%H%M%S") output_path = f'{base_name}_enhanced_{timestamp}.png' else: output_path = args.output

效果示例:

  • 原图portrait.jpg→ 输出portrait_enhanced_20250405_142310.png

这种方式特别适合做自动化处理或实验记录。

4.3 按用户/场景分类命名

如果你为人像增强服务不同客户或用途(如证件照、社交头像、老照片修复),可加入前缀标识:

# 定义用途类型(可通过新增参数传入,也可固定设置) scene_prefix = "idphoto" # 可选: social, oldphoto, beauty 等 if args.output is None: base_name = os.path.splitext(os.path.basename(input_path))[0] output_path = f'{scene_prefix}_{base_name}_restored.png' else: output_path = args.output

输出示例:

  • idphoto_zhangsan_restored.png
  • oldphoto_childhood_restored.png

4.4 使用递增编号避免重名

对于无人值守的批处理任务,建议使用数字编号防止覆盖:

import glob def get_next_filename(base_name, ext=".png"): prefix = f"{base_name}_v" existing = glob.glob(f"{prefix}*{ext}") if not existing: return f"{prefix}01{ext}" numbers = [] for file in existing: try: num = int(file.split('_v')[-1].split('.')[0]) numbers.append(num) except: continue next_num = max(numbers) + 1 if numbers else 1 return f"{prefix}{next_num:02d}{ext}" # 使用方式 if args.output is None: base_name = os.path.splitext(os.path.basename(input_path))[0] output_path = get_next_filename("face", ".png") # face_v01.png, face_v02.png... else: output_path = args.output

5. 进阶技巧:从命令行传入自定义命名模板

为了兼顾灵活性与易用性,我们可以扩展脚本功能,允许用户通过新参数控制命名模式。

5.1 新增命令行参数

修改argparse部分,添加--name-template参数:

parser.add_argument('--name-template', type=str, default=None, help='Custom naming template. Use {name}, {time}, {suffix}. Example: "{name}_fixed_{time}"')

5.2 实现动态命名模板解析

在输出路径生成处加入模板替换逻辑:

import datetime if args.output is None: name = os.path.splitext(os.path.basename(input_path))[0] time_str = datetime.datetime.now().strftime("%H%M") if args.name_template: # 支持占位符替换 output_name = args.name_template.format( name=name, time=time_str, suffix="enhanced" ) + ".png" else: output_name = f"output_{name}.png" output_path = output_name else: output_path = args.output

5.3 使用示例

# 使用自定义模板 python inference_gpen.py -i myface.jpg --name-template "{name}_gpen_{time}" # 输出:myface_gpen_1423.png

这使得同一个脚本能适应多种业务场景,无需反复修改源码。


6. 批量处理中的命名实践建议

当你要对一批图片进行修复时,合理的命名规则尤为重要。以下是几种推荐做法:

6.1 统一前缀 + 序号

适用于归档管理:

# 批量脚本片段 for idx, img_path in enumerate(image_list): base = os.path.basename(img_path).rsplit('.', 1)[0] output = f"batch_{idx+1:03d}_{base}.png"

6.2 保留原始目录结构命名

若输入来自多个子文件夹,可用路径信息编码:

# 如输入为 data/teamA/001.jpg rel_path = os.path.relpath(img_path, start_dir) # teamA/001.jpg safe_name = rel_path.replace('/', '_') output = f"restored_{safe_name}.png" # restored_teamA_001.png

6.3 加入质量等级标识

如果对不同分辨率或强度的修复结果分别保存,可在名字中标注:

resolution_tag = "512" # 或 1024 output = f"{base}_gpen_{resolution_tag}p.png"

7. 总结

7.1 核心要点回顾

  • GPEN 默认输出格式为output_<filename>.png,由脚本内硬编码逻辑决定。
  • 可通过-o参数临时指定输出名,适合单次调用。
  • 若要实现永久性、个性化命名规则,需修改inference_gpen.py中的输出路径生成逻辑。
  • 推荐方法包括:添加时间戳、分类前缀、递增编号、支持模板变量等。
  • 结合argparse扩展参数,可让脚本更灵活地服务于不同应用场景。

7.2 实践建议

  • 修改前先备份原脚本:cp inference_gpen.py inference_gpen.py.bak
  • 测试新命名逻辑时,先用小图试跑,确保不出错
  • 若用于生产环境,建议封装成独立配置文件或.yaml控制命名策略
  • 注意文件路径权限问题,确保输出目录可写

掌握输出命名的自定义方法,不仅能提升工作效率,还能让你的AI处理流程更加专业、有序。无论是个人使用还是团队协作,清晰的命名规范都是高质量项目的重要标志。


获取更多AI镜像

想探索更多AI镜像和应用场景?访问 CSDN星图镜像广场,提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/9 22:42:37

亲测DeepSeek-R1-Qwen-1.5B:数学推理+代码生成实战体验

亲测DeepSeek-R1-Qwen-1.5B&#xff1a;数学推理代码生成实战体验 1. 引言&#xff1a;为什么我选择测试这款小模型&#xff1f; 最近在尝试部署轻量级大模型时&#xff0c;偶然接触到 DeepSeek-R1-Distill-Qwen-1.5B 这个经过强化学习蒸馏优化的推理模型。它只有1.5B参数&am…

作者头像 李华
网站建设 2026/6/10 10:44:47

Qwen3-4B实战对比:指令遵循能力提升50%,开源大模型新选择

Qwen3-4B实战对比&#xff1a;指令遵循能力提升50%&#xff0c;开源大模型新选择 1. Qwen3-4B-Instruct-2507 是什么&#xff1f; 你可能已经听说过 Qwen 系列&#xff0c;但这次的 Qwen3-4B-Instruct-2507 真的不一样。它不是简单的版本迭代&#xff0c;而是一次在“听得懂人…

作者头像 李华
网站建设 2026/6/10 10:42:48

FSMN VAD处理长音频稳定性测试,连续运行无报错

FSMN VAD处理长音频稳定性测试&#xff0c;连续运行无报错 1. 测试背景与目标&#xff1a;为什么需要稳定性验证&#xff1f; 语音活动检测&#xff08;Voice Activity Detection, VAD&#xff09;是语音识别、会议转录、电话质检等系统中的关键前置模块。它的核心任务是从连…

作者头像 李华
网站建设 2026/6/10 10:40:21

Glyph效果惊艳!长文本语义压缩可视化案例展示

Glyph效果惊艳&#xff01;长文本语义压缩可视化案例展示 1. 引言&#xff1a;当文字变成图像&#xff0c;大模型如何“看懂”长文本&#xff1f; 你有没有遇到过这样的问题&#xff1a;一段几千字的报告&#xff0c;大模型读着读着就“忘了前面说了啥”&#xff1f;这其实是…

作者头像 李华
网站建设 2026/6/10 10:46:19

通义千问3-14B部署避坑:常见错误与解决方案汇总

通义千问3-14B部署避坑&#xff1a;常见错误与解决方案汇总 1. 引言&#xff1a;为什么选择 Qwen3-14B&#xff1f; 如果你正在寻找一个性能接近30B级别、但单卡就能跑动的大模型&#xff0c;那通义千问3-14B&#xff08;Qwen3-14B&#xff09;可能是目前最值得考虑的开源选项…

作者头像 李华
网站建设 2026/6/10 12:22:31

Qwen2.5-0.5B温度参数调优:生成质量提升实战

Qwen2.5-0.5B温度参数调优&#xff1a;生成质量提升实战 1. 引言&#xff1a;小模型也能有大智慧 你有没有遇到过这种情况&#xff1a;用一个轻量级AI模型聊天&#xff0c;回答总是千篇一律&#xff0c;像背书一样生硬&#xff1f;或者让它写点创意文案&#xff0c;结果输出的…

作者头像 李华