Kandinsky-5.0-I2V-Lite-5s效果实测:低光照首帧下动态细节保留能力评估
1. 模型概述
Kandinsky-5.0-I2V-Lite-5s是一款轻量级图生视频模型,只需上传一张首帧图片并补充运动或镜头描述,就能生成约5秒、24fps的短视频。本次测试重点评估该模型在低光照条件下对首帧图片动态细节的保留能力。
2. 测试环境与配置
2.1 硬件环境
测试使用RTX 4090 D 24GB显卡,确保模型能够稳定运行。该配置能够满足模型对显存的需求,同时保证生成速度在合理范围内。
2.2 软件配置
模型采用开箱即用的Web页面,已对齐模型能力并补齐相关依赖:
- 主DiT权重
- HunyuanVideo VAE
- Qwen2.5-VL文本编码器
- CLIP文本编码器
默认采用offload + sdpa策略,更适合24GB显存环境。
3. 低光照测试方案
3.1 测试样本选择
我们选取了三组不同场景的低光照图片作为首帧输入:
- 夜间街景(主体:行走的路人)
- 室内烛光(主体:摇曳的烛火)
- 黄昏海滩(主体:涌动的海浪)
每组图片分别测试不同采样步数(12/24/36)下的生成效果。
3.2 提示词设计
为保持测试一致性,每组图片使用相同的运动描述:
- "主体自然运动,镜头缓慢推进,保留原始光影细节"
4. 测试结果分析
4.1 动态细节保留度
在低光照条件下,模型对以下细节的保留表现:
| 测试场景 | 12步 | 24步 | 36步 |
|---|---|---|---|
| 夜间街景 | 路人动作较模糊 | 行走动作清晰 | 衣物褶皱可见 |
| 室内烛光 | 火焰轮廓保留 | 火焰跳动自然 | 烛光阴影细腻 |
| 黄昏海滩 | 波浪基本形态 | 浪花细节显现 | 水面反光层次 |
4.2 光影连贯性
模型在低光照条件下的特殊表现:
- 能较好地维持原始图片的光照风格
- 高采样步数下会出现轻微的光照波动
- 暗部细节在24步以上开始显现
5. 实际效果展示
5.1 最佳参数组合
经过测试,在低光照条件下推荐使用:
- 采样步数:24-30步
- 引导强度:5.0-7.0
- 调度缩放:保持默认10.0
5.2 生成案例对比
以黄昏海滩场景为例:
原始描述:海浪轻轻拍打沙滩,镜头缓慢拉远,保持黄昏暖色调 生成效果: - 12步:基本波浪形态,缺乏细节 - 24步:可见浪花破碎效果 - 36步:水面反光与泡沫细节丰富6. 使用建议
6.1 低光照场景优化技巧
- 首帧图片尽量保留更多暗部细节
- 提示词中明确说明需要保留的光影特征
- 适当提高引导强度(6.0-7.0)以稳定风格
- 固定随机种子进行多次生成对比
6.2 参数调整策略
- 快速测试:12步 + 5.0引导强度
- 质量优先:24-30步 + 6.0引导强度
- 极致细节:36步 + 7.0引导强度(等待时间显著增加)
7. 总结
Kandinsky-5.0-I2V-Lite-5s在低光照条件下展现出不错的动态细节保留能力,特别是在24-30步采样区间能够平衡质量与速度。对于专业用途,建议:
- 准备高质量的首帧图片
- 进行多组参数测试
- 重点关注24步以上的生成效果
- 合理管理生成预期(5秒短视频定位)
获取更多AI镜像
想探索更多AI镜像和应用场景?访问 CSDN星图镜像广场,提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。