news 2026/6/26 0:37:05

BAAI发布URSA-1.7B:轻量级AI视频生成新模型

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
BAAI发布URSA-1.7B:轻量级AI视频生成新模型

BAAI发布URSA-1.7B:轻量级AI视频生成新模型

【免费下载链接】URSA-1.7B-FSQ320项目地址: https://ai.gitcode.com/BAAI/URSA-1.7B-FSQ320

导语:BAAI(北京人工智能研究院)正式推出轻量级文本到视频生成模型URSA-1.7B-FSQ320,以1.7B参数量实现高效视频生成,为边缘设备部署和创意工具开发带来新可能。

行业现状:视频生成模型迈向轻量化与实用化

随着Sora等大模型掀起视频生成技术热潮,行业正面临"算力门槛高"与"落地需求迫切"的矛盾。当前主流视频生成模型动辄数十亿甚至千亿参数,需依赖高端GPU集群支持,难以实现个人设备或中小型应用场景的部署。据Gartner最新报告,2025年边缘AI计算市场规模将达1150亿美元,轻量化模型成为满足实时性、隐私性需求的关键突破口。在此背景下,URSA-1.7B的推出恰逢其时,标志着视频生成技术从实验室走向实用化的重要一步。

模型亮点:小体量实现多模态视频创作

URSA-1.7B-FSQ320作为BAAI-Vision-URSA模型家族的最新成员,展现出三大核心优势:

高效轻量的架构设计:采用1.7B参数量设计(基于Qwen3-1.7B基座模型),配合FP16精度优化,在保持512×320分辨率视频生成能力的同时,显著降低计算资源需求。相比同类视频模型,其参数量减少80%以上,为普通GPU甚至高端消费级显卡的实时运行提供可能。

多模态创作能力:支持文本到视频(Text-to-Video)、图像到视频(Image-to-Video)、视频到视频(Video-to-Video)全流程创作。通过在提示词中添加"motion=9.0"等参数,可精确控制视频运动强度,实现从静态图像到动态场景的自然过渡。模型采用Nvidia Cosmos-Tokenize1-DV4x8x8-360p作为视频Tokenizer,优化了时空特征的编码效率。

灵活的部署与扩展:基于Diffusers库实现快速集成,开发者可通过简单Python代码调用模型。示例代码显示,仅需49帧(4秒@12fps)即可生成连贯视频,且支持通过循环迭代生成更长时长内容,为视频创作工具提供了灵活的技术基础。

行业影响:开启视频AIGC民主化进程

URSA-1.7B的推出将在多维度重塑视频生成技术的应用生态:

降低创作门槛:对于教育、自媒体、小型设计工作室等资源有限的用户,轻量化模型意味着无需昂贵硬件投入即可开展视频创作。模型支持生成艺术作品、教学素材等应用场景,有望推动创意产业的平民化发展。

拓展边缘计算应用:1.7B参数规模使其具备在边缘设备部署的潜力,未来可能集成到手机、平板等移动设备,实现实时视频生成与编辑,开启"口袋里的视频工作室"时代。

推动技术标准化:模型采用Apache 2.0开源协议,完整代码与文档已开放,将加速视频生成技术的研究迭代。其提出的"Uniform Discrete Diffusion with Metric Path"方法(论文已发表于arXiv),为解决视频生成中的运动一致性问题提供了新思路。

结论与前瞻:轻量化与质量的平衡之道

URSA-1.7B-FSQ320在模型轻量化与生成质量间取得了突破性平衡,但其仍存在已知局限:如无法生成清晰文字、复杂动作可能出现失真、手指等细节处理有待优化。这些问题也反映了当前视频生成技术的共性挑战。

随着技术迭代,我们或将看到"基础模型轻量化+专业任务精调"的发展路径:通过URSA这类轻量级模型降低应用门槛,同时针对特定领域(如广告制作、影视特效)开发专用优化模块。BAAI表示,未来将持续优化模型的运动连贯性与细节表现力,探索更小体量(如700M参数)模型的可能性。

对于行业而言,URSA-1.7B不仅是一个技术成果,更代表着视频AIGC从"炫技"向"实用"转变的关键节点。当创作工具的算力门槛大幅降低,真正的创意民主化才可能实现。

【免费下载链接】URSA-1.7B-FSQ320项目地址: https://ai.gitcode.com/BAAI/URSA-1.7B-FSQ320

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/22 8:27:44

7800美元训练!VibeThinker-1.5B:小模型也有大逻辑

7800美元训练!VibeThinker-1.5B:小模型也有大逻辑 【免费下载链接】VibeThinker-1.5B 项目地址: https://ai.gitcode.com/hf_mirrors/WeiboAI/VibeThinker-1.5B 导语:微博AI团队推出仅15亿参数的VibeThinker-1.5B模型,以7…

作者头像 李华
网站建设 2026/6/25 9:25:39

颠覆认知!这款OS让你的旧电脑焕发新生——深度体验NeonOS

颠覆认知!这款OS让你的旧电脑焕发新生——深度体验NeonOS 【免费下载链接】Atlas 🚀 An open and lightweight modification to Windows, designed to optimize performance, privacy and security. 项目地址: https://gitcode.com/GitHub_Trending/at…

作者头像 李华
网站建设 2026/6/12 16:05:35

三步解锁智能电视增强工具:无广告观影与老旧设备升级指南

三步解锁智能电视增强工具:无广告观影与老旧设备升级指南 【免费下载链接】SmartTube SmartTube - an advanced player for set-top boxes and tv running Android OS 项目地址: https://gitcode.com/GitHub_Trending/smar/SmartTube 智能电视增强工具是提升…

作者头像 李华
网站建设 2026/6/10 8:58:12

智能客服搭建流程优化:从零到高可用的工程实践

背景痛点:传统客服系统“三座大山” 去年双十一,我们老客服系统直接“罢工”——高峰期 3k 并发,CPU 飙到 95%,用户平均等待 18s 才收到“人工客服请排队”。复盘发现三大硬伤: 单体服务里“查询-意图-回复”全挤在一…

作者头像 李华
网站建设 2026/6/19 7:43:52

Video2X智能增强技术全解析:从原理到效能优化的专业指南

Video2X智能增强技术全解析:从原理到效能优化的专业指南 【免费下载链接】video2x A lossless video/GIF/image upscaler achieved with waifu2x, Anime4K, SRMD and RealSR. Started in Hack the Valley II, 2018. 项目地址: https://gitcode.com/GitHub_Trendin…

作者头像 李华