Avataar AI视频模型专为印度规模化场景而生-程序员充电站

与美国、欧洲和中国相比，印度的AI模型产出一直相对滞后。目前仅有少数初创企业在发布模型，且大多集中在大语言模型或语音模型领域。为推动更多创新，印度政府启动了"印度AI使命"计划，这是一项规模约12亿美元的举措，核心内容之一是为入选的初创企业提供补贴算力资源，条件是企业须将其模型公开发布。Avataar AI是12家入选企业之一，近日推出了一款名为Varya的视频模型，该模型专为理解本地语境而设计，能够识别不同节日、食物及服饰等文化元素。

Avataar AI由知名投资机构Peak XV支持，专注于为电商场景提供视频创作工具。Varya并非从零构建，而是以阿里巴巴公开发布的视频生成模型Wan 2.2为基础，通过"知识蒸馏"技术——即将模型能力压缩为更精简、更快速的版本——针对Avataar的具体使用场景进行优化。最终成果是一个仅需四步即可完成推理的模型，而Wan 2.2需要50步，Varya的生成速度提升了10倍，成本也大幅降低。

以具体数据为例：使用NVIDIA H200 GPU时，Varya生成一段5秒720p视频仅需45秒，而Wan 2.2则需要1230秒。

Varya最引人注目的或许是其定价。该公司计划在托管服务上以每秒0.48印度卢比（约合0.005美元）的价格提供服务，远低于Veo、Kling、Luma、Runway等模型通常每秒0.10美元以上的收费标准，价格差距约达20倍。

"印度是一个视频优先的市场。纵观印度所有头部消费互联网产品，视频的表现始终优于文字。当前的AI视频模型对于印度规模化应用而言成本过高。如果视频AI要真正触达学生、教师、中小微企业、创作者、企业及公共服务，成本必须大幅下降。成本是推动AI在印度普及的最关键突破口。"Peak XV董事总经理Rajan Anandan在接受TechCrunch采访时表示。

图像和视频生成模型往往忽视文化细节，输出结果容易流于刻板印象或过于泛化——这一问题此前TechCrunch已有报道。Avataar AI表示，已通过精心筛选的数据对Varya进行训练，使其能够识别包括食物、服饰、建筑和节日在内的文化细节。

Varya将作为开放权重模型发布于印度政府搭建的AI Kosh平台——这是印度政府集中托管公开AI模型与数据集的统一平台——同时附带训练数据，开发者可自行部署或按需修改。Avataar还计划向企业客户开放该模型，并表示欢迎与Higgsfield、Adobe Firefly等视频工具展开合作。目前任何人均可通过官网，使用文字提示或参考图像进行体验。

Varya的发布折射出印度AI雄心背后的深层取舍。业界资深人士指出，印度在AI领域的优势路径在于打造应用产品与完善的开发者生态，而非与他国在基础模型层面正面竞争。这一务实选择背后有其现实原因：受限于算力不足与高质量数据匮乏，印度的模型研发进展明显慢于全球竞争对手。

"印度AI使命"也是政府弥合这一差距的更宏观战略布局的组成部分。去年，该计划遴选了包括Avataar AI在内的12家初创企业开展AI模型研发，并为其提供低成本算力支持。今年早些时候，印度信息技术部长Ashwini Vaishnaw表示，印度的目标是到2028年吸引2000亿美元的AI投资，并在六个月内将GPU算力容量翻倍以上。

Q&A

Q1：Varya视频模型是怎么做到比其他模型便宜这么多的？

A：Varya并非从头训练，而是基于阿里巴巴开源的Wan 2.2模型，通过知识蒸馏技术进行压缩和优化，将推理步骤从50步缩减至4步，生成速度提升10倍，成本大幅降低。托管服务定价为每秒0.48印度卢比（约0.005美元），而Veo、Runway等模型通常每秒收费0.10美元以上，价格差距约20倍。

Q2：Varya是如何处理印度本土文化识别的？

A：Avataar AI通过精心筛选的本土数据对Varya进行专项训练，使模型能够识别印度特有的文化元素，包括本地节日、传统服饰、特色食物和建筑风格等，从而避免通用视频生成模型常见的文化失真或刻板化输出问题。

Q3：Varya模型是否对外开放，普通开发者能用吗？

A：可以。Varya将作为开放权重模型发布在印度政府的AI Kosh平台上，并附带训练数据，开发者可以自行部署或二次修改。目前任何人都可以在Avataar官网通过文字提示或参考图像直接体验该模型。

抖音直播数据抓取：5分钟搭建实时弹幕监控系统

抖音直播数据抓取：5分钟搭建实时弹幕监控系统【免费下载链接】DouyinLiveWebFetcher 抖音直播间网页版的弹幕数据抓取（2025最新版本） 项目地址: https://gitcode.com/gh_mirrors/do/DouyinLiveWebFetcher 在直播电商时代，…

李华

个人GPU部署LLM：68个可运行模型的显存、量化与框架实战指南

1. 为什么“68个适合个人GPU部署的LLM”这个标题背后藏着一场静默革命你有没有在深夜调试过PyTorch——明明 nvidia-smi 显示GPU在跑， torch.cuda.is_available() 却返回 False ？有没有对着 pip install torch 报错里那一长串 CUDA version mi…