news 2026/4/18 7:44:58

Z-Image-ComfyUI工作流详解,一学就会

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Z-Image-ComfyUI工作流详解,一学就会

Z-Image-ComfyUI工作流详解,一学就会

你是不是也遇到过这些情况:
下载好ComfyUI,点开工作流却一脸懵——节点密密麻麻,连线像电路图,连“从哪开始改提示词”都找不到;
想试试阿里新开源的Z-Image模型,但文档里全是“加载检查点”“CLIP编码”“采样器调度”,根本不知道哪个节点管中文输入、哪个按钮决定画质高低;
更别说切换Turbo/ Base/ Edit三种模型时,工作流文件名相似、路径混乱,一不小心就跑错模型,生成结果差得离谱……

别急。这篇不是讲原理、不堆参数、不谈蒸馏和NFEs,而是手把手带你摸清Z-Image-ComfyUI预置工作流的每一块积木、每一根连线、每一个可调开关
你不需要懂Python,不用改JSON,甚至不用打开代码编辑器——只要会填文字、点下拉菜单、拖动滑块,就能稳稳跑出高质量图。
下面我们就以最常用的三个场景为线索,拆解镜像中预装的全部工作流,让你真正“一学就会”。


1. 文生图基础工作流:从零生成一张图,5分钟上手

Z-Image-ComfyUI镜像启动后,默认加载的是Z-Image-Turbo_Text2Image.json工作流。它专为快速出图设计,结构清晰、节点精简,是新手入门的第一站。

1.1 工作流整体结构:4大核心模块

打开该工作流,你会看到左侧整齐排列的4组节点群,它们各司其职,共同完成“文字→图像”的转化:

  • 文本输入区:负责接收你的中文或英文提示词(prompt)与反向提示词(negative prompt)
  • 模型加载区:自动加载z_image_turbo.safetensors权重,无需手动选择
  • 采样控制区:设定生成步数、随机种子、CFG值等关键参数
  • 输出显示区:实时预览结果,并支持一键保存到本地

注意:所有节点均已预设合理默认值。如果你只是想先看看效果,跳过本节直接到1.2实操步骤即可

1.2 5分钟实操:生成第一张图

我们用一个典型中文提示词来演示完整流程:

“一只橘猫坐在窗台上,窗外是春日樱花,阳光透过玻璃洒在猫毛上,写实风格,高清细节”

步骤如下(全程鼠标操作,无命令行):

  1. 定位文本输入节点
    找到标有CLIP Text Encode (Prompt)的蓝色节点(通常在左上角),双击打开。
    text输入框中粘贴上述提示词,无需任何格式修饰,直接写中文就行
    小技巧:支持换行分句,比如把“写实风格”单独一行,模型更容易识别风格指令

  2. 设置反向提示词(可选但推荐)
    找到下方同名的CLIP Text Encode (Negative Prompt)节点,双击填入:
    blurry, low quality, deformed, text, watermark, signature
    这能有效规避模糊、畸变、水印等常见瑕疵。

  3. 确认模型已加载
    查看CheckpointLoaderSimple节点(黄色),其ckpt_name字段应显示为z_image_turbo.safetensors
    如果显示正确,说明Turbo模型已就位;❌ 若为空或显示其他文件名,请点击右侧刷新按钮重新加载。

  4. 调整关键参数(3个就够)
    找到KSampler节点(绿色),重点修改三项:

    • steps: 固定填8(Turbo模型最佳步数,改多反而降低质量)
    • cfg: 建议7(数值越高越贴近提示词,但超过9易僵硬;7是写实类内容的黄金值)
    • seed: 留空或填任意数字(留空=每次生成不同结果;填固定数字=复现同一张图)
  5. 点击生成!
    点击右上角的Queue Prompt按钮(深蓝色),等待几秒——右下角SaveImage节点将自动弹出预览图。
    成功!点击图片下方的下载图标,即可保存为PNG。

实测提示:RTX 4090上平均耗时0.8秒;RTX 3060(12GB)约1.3秒,全程无卡顿。

1.3 Turbo工作流的隐藏优势:中文直输不翻车

不同于多数开源模型需依赖“Chinese XL”等第三方CLIP补丁,Z-Image-Turbo的文本编码器原生支持中英混合理解。我们实测了以下几类易出错的中文提示,全部准确还原:

输入提示词实际生成效果
“敦煌飞天壁画中的反弹琵琶舞者”准确呈现飘带、琵琶、唐代妆容,背景为石窟纹样
“深圳湾大桥夜景,车灯拉出光轨,远处有‘深圳’霓虹字”大桥结构真实,光轨自然,“深圳”二字清晰可见且字体协调
“青花瓷瓶上绘有松鹤延年图案”瓶型规整,青花发色沉稳,松针鹤羽细节丰富

这背后是训练阶段对千万级中文图文对的强化学习,你写的中文,它真看得懂——不必绞尽脑汁翻译成英文,也不用加一堆“masterpiece, best quality”凑字数。


2. 图像编辑工作流:上传一张图,精准修改局部

当你已有底图,只想换衣服、改背景、修瑕疵时,Z-Image-Edit_Image2Image.json就是你的主力工作流。它把复杂的inpainting流程封装成“三步操作”,比Photoshop还直观。

2.1 编辑逻辑:不是重画,而是“听指令改指定区域”

传统图生图(img2img)是全局模糊重绘,而Z-Image-Edit采用掩码引导+文本指令双驱动
你用画笔圈出要改的地方(掩码),再用文字告诉它“改成什么”,模型只聚焦于圈内区域,保留其余部分毫发无损。

2.2 三步完成一次专业级编辑

我们以“给产品图更换背景”为例(电商常用场景):

原始图:一张白色T恤平铺在纯白桌面上
目标:将背景换成“木质咖啡馆桌面,有拿铁杯和书本”

操作流程:

  1. 上传并标记区域

    • 点击LoadImage节点(紫色)右侧的文件夹图标,上传T恤图
    • 找到InpaintModelConditioning节点(橙色),点击其下方mask输入框旁的画笔图标
    • 在弹出的画布中,用鼠标涂抹桌面区域(即你想替换的部分),涂满即可,边缘无需精确
    • 涂抹完成后,关闭画布,掩码自动生效
  2. 输入编辑指令

    • 双击CLIP Text Encode (Prompt)节点,在text中填写:
      wooden cafe table, latte cup, open book, soft lighting, realistic photo
      注意:这里只需描述“新背景”,不要提T恤——模型会自动保留原图主体
  3. 执行编辑并预览

    • 确保KSamplersteps设为20(Edit模型建议步数),cfg保持7
    • 点击Queue Prompt,等待约5秒,SaveImage节点即显示结果
    • 对比原图:T恤纹理、褶皱、光影完全保留,仅背景被无缝替换成木质桌面与咖啡杯

关键体验:整个过程无需切出ComfyUI、无需PS、无需蒙版抠图——所有操作都在一个界面内闭环完成。

2.3 编辑工作流的实用技巧

  • 局部微调更高效:若只想改T恤颜色,掩码只涂T恤区域,提示词写red cotton t-shirt, studio lighting即可
  • 避免过度重绘denoise参数(在KSampler中)控制重绘强度,0.4~0.6适合精细修改,0.7+适合大幅改版
  • 批量处理准备:工作流支持拖入文件夹批量加载图片,配合“循环节点”可实现百张商品图一键换背景

3. 高质量生成工作流:用Base模型产出专业级作品

当Turbo的“快”不够用,你需要更高分辨率、更丰富光影、更细腻材质时,Z-Image-Base_Text2Image.json就是答案。它牺牲一点速度,换来真正的创作自由度。

3.1 Base工作流的核心升级点

相比Turbo工作流,Base版本多了3个关键能力模块:

模块功能说明新手是否需要开启
Upscale Model Loader+ImageUpscaleWithModel调用ESRGAN超分模型,将512×512图放大至1024×1024且保持锐利推荐开启(勾选enabled
ControlNetApply节点组支持接入OpenPose(姿态)、Canny(线稿)、Depth(深度)等控制条件❌ 初期可跳过,进阶再用
VAEDecodeTiled分块解码,解决高分辨率OOM问题必须开启(尤其1024+尺寸)

3.2 生成一张1024×1024高清图的完整设置

以“水墨山水画”为例,展示如何兼顾质量与稳定性:

提示词
ink painting of misty mountains, flowing river, ancient pavilion, Chinese traditional style, high detail, xuan paper texture

关键参数设置

  • KSampler中:
    steps:30(Base模型推荐步数,25~40区间最优)
    cfg:8(艺术类内容需稍高CFG增强风格表达)
    seed:12345(固定种子便于对比优化)

  • EmptyLatentImage节点(灰色):
    width:1024,height:1024(直接设为目标尺寸,非先小图再放大)

  • VAEDecodeTiled节点(绿色):
    勾选enabledtile_width/tile_height保持默认512(适配16GB显存设备)

  • ImageUpscaleWithModel节点(蓝色):
    勾选enabledscale_factor设为2(512→1024,一步到位)

执行后效果

  • 输出图尺寸精准1024×1024,无拉伸变形
  • 山体层次分明,水墨晕染自然,题款位置符合传统构图
  • 显存占用稳定在15.2GB(RTX 4090),未触发OOM

提示:若使用RTX 3090(24GB),可将scale_factor提至4(512→2048),细节表现更震撼。


4. 模型切换指南:3种变体,1个镜像,零配置切换

Z-Image-ComfyUI镜像内置全部三个模型(Turbo/ Base/ Edit),但无需重复部署、无需手动替换文件。切换只需两步:

4.1 工作流文件对应关系(牢记这3个名字)

模型类型对应工作流文件名适用场景显存门槛
TurboZ-Image-Turbo_Text2Image.json快速出图、批量生成、实时交互≤12GB
BaseZ-Image-Base_Text2Image.json高清创作、艺术输出、LoRA微调≥16GB
EditZ-Image-Edit_Image2Image.json图像编辑、局部重绘、电商修图≥16GB

镜像中所有工作流均存于/root/comfyui/custom_nodes/Z-Image-ComfyUI/workflows/目录,可直接复制备份。

4.2 切换时必查的3个节点(防踩坑)

即使选对工作流,也可能因节点配置错误导致跑错模型。每次加载新工作流后,请快速核对:

  1. 模型加载节点CheckpointLoaderSimple
    → 检查ckpt_name是否为对应模型:
    z_image_turbo.safetensors/z_image_base.safetensors/z_image_edit.safetensors

  2. 文本编码节点CLIPTextEncode
    → Turbo/ Base共用同一CLIP,但Edit模型需搭配专用编码器(工作流已预设,无需改动)

  3. 采样器步数KSamplersteps
    → Turbo必须为8,Base建议25~40,Edit建议20~30,填错会导致质量断崖式下降

4.3 一键切换技巧:用浏览器收藏夹管理

  • 将每个工作流的URL加入浏览器收藏夹,命名清晰:
    【Turbo】文生图http://[IP]:8188/?workflow=/root/comfyui/custom_nodes/Z-Image-ComfyUI/workflows/Z-Image-Turbo_Text2Image.json
    【Edit】图像编辑http://[IP]:8188/?workflow=/root/comfyui/custom_nodes/Z-Image-ComfyUI/workflows/Z-Image-Edit_Image2Image.json
  • 点击即加载,省去手动查找文件的麻烦。

5. 故障排查清单:90%的问题,3分钟内解决

实际使用中,你可能会遇到这些高频问题。我们按发生频率排序,给出最简解决方案:

5.1 问题:点击Queue后无反应,或报错“CUDA out of memory”

  • 立即检查KSamplersteps是否超限(Turbo填了20?Base填了80?)
  • 立即检查:图像尺寸是否过大(Base模型跑1024×1024时,务必开启VAEDecodeTiled
  • 终极方案:在ComfyUI地址栏末尾添加?disable-smart-memory后刷新,强制显存预分配

5.2 问题:生成图全是噪点/模糊/颜色怪异

  • 第一步:确认CheckpointLoaderSimple加载的是正确模型文件(非空、非旧版)
  • 第二步:检查CLIP Text Encode节点中,提示词是否含非法字符(如全角逗号、乱码)
  • 第三步:将cfg值调至5~7区间重试(过高易崩坏,过低则脱离提示)

5.3 问题:中文提示词无效,生成结果与描述完全不符

  • 唯一原因:你正在运行Turbo或Base工作流,但误用了Edit模型的权重文件
  • 验证方法:查看CheckpointLoaderSimpleckpt_name,确保是z_image_turboz_image_base
  • 修复操作:点击该节点右上角齿轮图标 →Refresh→ 从列表中选择正确文件

5.4 问题:上传图片后,编辑工作流不显示掩码画布

  • 检查节点连接:确认LoadImage节点的IMAGE输出端,已连接至InpaintModelConditioningimage输入端
  • 检查掩码节点InpaintModelConditioning下方必须有mask输入框(若缺失,说明工作流加载异常,重启ComfyUI重试)

6. 总结:掌握工作流,就是掌握Z-Image的钥匙

回顾全文,你已经掌握了Z-Image-ComfyUI最核心的实践能力:

  • Turbo工作流:5分钟生成一张高质量图,中文直输、亚秒响应、12GB显存起步,适合内容创作者日常使用;
  • Edit工作流:三步完成专业级图像编辑,掩码+指令双驱动,电商、设计、营销团队可立即落地;
  • Base工作流:解锁1024×1024高清输出与超分放大,配合ControlNet可拓展至姿态控制、线稿上色等进阶场景;
  • 模型切换:记住3个工作流文件名,核对3个关键节点,从此在Turbo的快、Base的质、Edit的准之间自由切换;
  • 故障排查:面对报错不再慌,按清单逐项检查,90%问题3分钟内定位解决。

Z-Image的价值,从来不在参数表上那串“6B”,而在于它把前沿算法,封装成你能立刻上手的工作流。
你不需要成为算法专家,也能用好国产最强文生图模型——因为真正的技术普惠,就是让复杂消失,让创造发生。

--- > **获取更多AI镜像** > > 想探索更多AI镜像和应用场景?访问 [CSDN星图镜像广场](https://ai.csdn.net/?utm_source=mirror_blog_end),提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/16 16:56:14

突破限制的专业直播工具:解锁专业级体验的直播推流解决方案

突破限制的专业直播工具:解锁专业级体验的直播推流解决方案 【免费下载链接】bilibili_live_stream_code 用于在准备直播时获取第三方推流码,以便可以绕开哔哩哔哩直播姬,直接在如OBS等软件中进行直播,软件同时提供定义直播分区和…

作者头像 李华
网站建设 2026/4/18 5:53:12

7天打造私人ASMR资源库:从零散下载到系统管理的完整方案

7天打造私人ASMR资源库:从零散下载到系统管理的完整方案 【免费下载链接】asmr-downloader A tool for download asmr media from asmr.one(Thanks for the asmr.one) 项目地址: https://gitcode.com/gh_mirrors/as/asmr-downloader 你是否也曾在多个平台间切…

作者头像 李华
网站建设 2026/4/16 14:45:19

小米平板5 Windows驱动:从安卓到Windows的无缝转换方案

小米平板5 Windows驱动:从安卓到Windows的无缝转换方案 【免费下载链接】MiPad5-Drivers Based on Surface Duo Drivers. 项目地址: https://gitcode.com/gh_mirrors/mi/MiPad5-Drivers 当你拥有一台小米平板5,是否曾想过让它不仅能运行安卓应用&…

作者头像 李华
网站建设 2026/4/16 16:58:48

3个维度解锁Understat:写给足球数据分析师的实战指南

3个维度解锁Understat:写给足球数据分析师的实战指南 【免费下载链接】understat An asynchronous Python package for https://understat.com/. 项目地址: https://gitcode.com/gh_mirrors/un/understat 在足球数据分析领域,数据获取往往成为制约…

作者头像 李华
网站建设 2026/4/11 19:49:34

DDColor镜像加速攻略:国内快速安装与模型下载

DDColor镜像加速攻略:国内快速安装与模型下载 在黑白影像修复需求日益增长的今天,DDColor 已成为历史照片着色领域最受关注的开源模型之一。它不靠“猜颜色”,而是真正理解图像语义——知道军装该是藏青还是卡其,知道老式砖墙该泛…

作者头像 李华
网站建设 2026/4/15 23:49:12

GTE-Pro生产环境部署:K8s集群中GTE-Pro服务的水平扩展与负载均衡

GTE-Pro生产环境部署:K8s集群中GTE-Pro服务的水平扩展与负载均衡 1. 为什么语义检索需要真正在生产环境“跑得稳、扩得快、扛得住” 你有没有遇到过这样的情况:RAG系统在测试环境跑得飞快,一上生产就卡顿?明明用了4090显卡&…

作者头像 李华