SkyReels V1:革命性开源视频生成模型完整指南
【免费下载链接】SkyReels-V1SkyReels V1: The first and most advanced open-source human-centric video foundation model项目地址: https://gitcode.com/gh_mirrors/sk/SkyReels-V1
SkyReels V1 是首个且最先进的开源以人为中心的视频基础模型,通过在千万级高质量影视片段上对 HunyuanVideo 进行微调,实现了开源领域领先的文本到视频和图像到视频生成能力。无论是专业创作者还是 AI 爱好者,都能通过这个强大的工具轻松创建电影级别的视频内容。
🌟 为什么选择 SkyReels V1?
作为开源视频生成领域的突破性模型,SkyReels V1 带来三大核心优势:
🚀 开源领先性能
在 VBench 基准测试中,SkyReels V1 以 82.43 的总分超越所有开源文本到视频模型,包括 VideoCrafter-2.0 VEnhancer (82.24) 和 CogVideoX1.5-5B (82.17),尤其在动态程度和多目标处理指标上表现突出。
🎭 高级面部动画系统
精准捕捉 33 种不同面部表情和 400 多种自然动作组合,能够细腻呈现人类情感变化,使生成人物更加生动逼真。
🎬 电影级光影美学
基于好莱坞级影视数据训练,每帧画面在构图、人物定位和 camera 角度上都展现出专业电影制作水准。
📋 核心功能介绍
1. 双模型架构支持
- 文本到视频(T2V):通过文字描述直接生成视频,支持 544×960 分辨率、24 FPS、97 帧(约 4 秒)视频生成
- 图像到视频(I2V):将静态图片转换为动态视频,保持原始图像风格和主体特征
2. 高效推理框架 SkyReelsInfer
skyreelsinfer/ 目录下的推理框架提供:
- 多 GPU 并行支持:上下文并行、CFG 并行和 VAE 并行技术
- 消费级 GPU 部署:通过模型量化和参数级卸载策略,实现 RTX 4090 等用户级 GPU 的高效运行
- 性能优化:相比 HunyuanVideo XDiT 减少 58.3% 的端到端延迟
🛠️ 快速开始指南
环境准备
首先克隆项目仓库:
git clone https://gitcode.com/gh_mirrors/sk/SkyReels-V1 cd SkyReels-V1安装依赖:
pip install -r requirements.txt基础视频生成(A800 等高配置 GPU)
python3 video_generate.py \ --model_id Skywork/SkyReels-V1-Hunyuan-T2V \ --task_type t2v \ --guidance_scale 6.0 \ --height 544 \ --width 960 \ --num_frames 97 \ --prompt "FPS-24, A cat wearing sunglasses and working as a lifeguard at a pool" \ --embedded_guidance_scale 1.0⚠️ 注意:生成视频时,提示词需以 "FPS-24, " 开头,这是训练时采用的帧率控制方法
RTX 4090 等消费级 GPU 优化方案
python3 video_generate.py \ --model_id Skywork/SkyReels-V1-Hunyuan-T2V \ --task_type t2v \ --guidance_scale 6.0 \ --height 544 \ --width 960 \ --num_frames 97 \ --prompt "FPS-24, A cat wearing sunglasses and working as a lifeguard at a pool" \ --embedded_guidance_scale 1.0 \ --quant \ --offload \ --high_cpu_memory \ --parameters_level此配置在单 RTX 4090 上生成 4 秒视频(544×960, 97 帧)显存峰值约 18.5G,通过多 GPU 并行可显著缩短生成时间。
多 GPU 并行推理
python3 video_generate.py \ --model_id Skywork/SkyReels-V1-Hunyuan-T2V \ --guidance_scale 6.0 \ --height 544 \ --width 960 \ --num_frames 97 \ --prompt "FPS-24, A cat wearing sunglasses and working as a lifeguard at a pool" \ --embedded_guidance_scale 1.0 \ --quant \ --offload \ --high_cpu_memory \ --gpu_num 4💻 网页界面使用
SkyReels V1 提供 Gradio 网页界面,方便直观操作:
pip install gradio cd scripts && python3 gradio_web.py --task_type t2v --gpu_num 1根据终端提示打开浏览器访问本地服务器,即可通过图形界面进行视频生成。
📊 性能对比
在相同硬件条件下,SkyReelsInfer 相比传统方案展现出显著优势:
| GPU 数量 | HunyuanVideo XDIT | SkyReelsInfer | 性能提升 |
|---|---|---|---|
| 1 (RTX 4090) | 显存不足 | 889.31s | - |
| 4 (RTX 4090) | 464.3s | 293.3s | 58.3% |
| 4 (A800) | 263.48s | 205.49s | 28.2% |
📚 相关资源
- 项目文档:docs/
- 推理代码:video_generate.py
- Gradio 界面:scripts/gradio_web.py
- 模型管道:skyreelsinfer/pipelines/
SkyReels V1 正在持续迭代中,未来将支持提示词重写、CFG 蒸馏模型、720P 版本和 ComfyUI 集成等功能,敬请期待!
【免费下载链接】SkyReels-V1SkyReels V1: The first and most advanced open-source human-centric video foundation model项目地址: https://gitcode.com/gh_mirrors/sk/SkyReels-V1
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考