BAAI发布URSA-1.7B：轻量级AI视频生成新模型-程序员充电站

BAAI发布URSA-1.7B：轻量级AI视频生成新模型

【免费下载链接】URSA-1.7B-FSQ320项目地址: https://ai.gitcode.com/BAAI/URSA-1.7B-FSQ320

导语：BAAI（北京人工智能研究院）正式推出轻量级文本到视频生成模型URSA-1.7B-FSQ320，以1.7B参数量实现高效视频生成，为边缘设备部署和创意工具开发带来新可能。

行业现状：视频生成模型迈向轻量化与实用化

随着Sora等大模型掀起视频生成技术热潮，行业正面临"算力门槛高"与"落地需求迫切"的矛盾。当前主流视频生成模型动辄数十亿甚至千亿参数，需依赖高端GPU集群支持，难以实现个人设备或中小型应用场景的部署。据Gartner最新报告，2025年边缘AI计算市场规模将达1150亿美元，轻量化模型成为满足实时性、隐私性需求的关键突破口。在此背景下，URSA-1.7B的推出恰逢其时，标志着视频生成技术从实验室走向实用化的重要一步。

模型亮点：小体量实现多模态视频创作

URSA-1.7B-FSQ320作为BAAI-Vision-URSA模型家族的最新成员，展现出三大核心优势：

高效轻量的架构设计：采用1.7B参数量设计（基于Qwen3-1.7B基座模型），配合FP16精度优化，在保持512×320分辨率视频生成能力的同时，显著降低计算资源需求。相比同类视频模型，其参数量减少80%以上，为普通GPU甚至高端消费级显卡的实时运行提供可能。

多模态创作能力：支持文本到视频（Text-to-Video）、图像到视频（Image-to-Video）、视频到视频（Video-to-Video）全流程创作。通过在提示词中添加"motion=9.0"等参数，可精确控制视频运动强度，实现从静态图像到动态场景的自然过渡。模型采用Nvidia Cosmos-Tokenize1-DV4x8x8-360p作为视频Tokenizer，优化了时空特征的编码效率。

灵活的部署与扩展：基于Diffusers库实现快速集成，开发者可通过简单Python代码调用模型。示例代码显示，仅需49帧（4秒@12fps）即可生成连贯视频，且支持通过循环迭代生成更长时长内容，为视频创作工具提供了灵活的技术基础。

行业影响：开启视频AIGC民主化进程

URSA-1.7B的推出将在多维度重塑视频生成技术的应用生态：

降低创作门槛：对于教育、自媒体、小型设计工作室等资源有限的用户，轻量化模型意味着无需昂贵硬件投入即可开展视频创作。模型支持生成艺术作品、教学素材等应用场景，有望推动创意产业的平民化发展。

拓展边缘计算应用：1.7B参数规模使其具备在边缘设备部署的潜力，未来可能集成到手机、平板等移动设备，实现实时视频生成与编辑，开启"口袋里的视频工作室"时代。

推动技术标准化：模型采用Apache 2.0开源协议，完整代码与文档已开放，将加速视频生成技术的研究迭代。其提出的"Uniform Discrete Diffusion with Metric Path"方法（论文已发表于arXiv），为解决视频生成中的运动一致性问题提供了新思路。

结论与前瞻：轻量化与质量的平衡之道

URSA-1.7B-FSQ320在模型轻量化与生成质量间取得了突破性平衡，但其仍存在已知局限：如无法生成清晰文字、复杂动作可能出现失真、手指等细节处理有待优化。这些问题也反映了当前视频生成技术的共性挑战。

随着技术迭代，我们或将看到"基础模型轻量化+专业任务精调"的发展路径：通过URSA这类轻量级模型降低应用门槛，同时针对特定领域（如广告制作、影视特效）开发专用优化模块。BAAI表示，未来将持续优化模型的运动连贯性与细节表现力，探索更小体量（如700M参数）模型的可能性。

对于行业而言，URSA-1.7B不仅是一个技术成果，更代表着视频AIGC从"炫技"向"实用"转变的关键节点。当创作工具的算力门槛大幅降低，真正的创意民主化才可能实现。

【免费下载链接】URSA-1.7B-FSQ320项目地址: https://ai.gitcode.com/BAAI/URSA-1.7B-FSQ320

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

3大核心功能解决医学影像处理难题：面向临床与科研人员的开源解决方案

3大核心功能解决医学影像处理难题：面向临床与科研人员的开源解决方案【免费下载链接】Slicer Multi-platform, free open source software for visualization and image computing. 项目地址: https://gitcode.com/gh_mirrors/sl/Slicer 医学影像处理面临三…

李华

三步解锁智能电视增强工具：无广告观影与老旧设备升级指南

三步解锁智能电视增强工具：无广告观影与老旧设备升级指南【免费下载链接】SmartTube SmartTube - an advanced player for set-top boxes and tv running Android OS 项目地址: https://gitcode.com/GitHub_Trending/smar/SmartTube 智能电视增强工具是提升…

李华

智能客服搭建流程优化：从零到高可用的工程实践

背景痛点：传统客服系统“三座大山” 去年双十一，我们老客服系统直接“罢工”——高峰期 3k 并发，CPU 飙到 95%，用户平均等待 18s 才收到“人工客服请排队”。复盘发现三大硬伤： 单体服务里“查询-意图-回复”全挤在一…

李华

Video2X智能增强技术全解析：从原理到效能优化的专业指南

Video2X智能增强技术全解析：从原理到效能优化的专业指南【免费下载链接】video2x A lossless video/GIF/image upscaler achieved with waifu2x, Anime4K, SRMD and RealSR. Started in Hack the Valley II, 2018. 项目地址: https://gitcode.com/GitHub_Trendin…

李华

BAAI发布URSA-1.7B：轻量级AI视频生成新模型