news 2026/6/18 16:46:15

Avataar AI视频模型专为印度规模化场景而生

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Avataar AI视频模型专为印度规模化场景而生

与美国、欧洲和中国相比,印度的AI模型产出一直相对滞后。目前仅有少数初创企业在发布模型,且大多集中在大语言模型或语音模型领域。为推动更多创新,印度政府启动了"印度AI使命"计划,这是一项规模约12亿美元的举措,核心内容之一是为入选的初创企业提供补贴算力资源,条件是企业须将其模型公开发布。Avataar AI是12家入选企业之一,近日推出了一款名为Varya的视频模型,该模型专为理解本地语境而设计,能够识别不同节日、食物及服饰等文化元素。

Avataar AI由知名投资机构Peak XV支持,专注于为电商场景提供视频创作工具。Varya并非从零构建,而是以阿里巴巴公开发布的视频生成模型Wan 2.2为基础,通过"知识蒸馏"技术——即将模型能力压缩为更精简、更快速的版本——针对Avataar的具体使用场景进行优化。最终成果是一个仅需四步即可完成推理的模型,而Wan 2.2需要50步,Varya的生成速度提升了10倍,成本也大幅降低。

以具体数据为例:使用NVIDIA H200 GPU时,Varya生成一段5秒720p视频仅需45秒,而Wan 2.2则需要1230秒。

Varya最引人注目的或许是其定价。该公司计划在托管服务上以每秒0.48印度卢比(约合0.005美元)的价格提供服务,远低于Veo、Kling、Luma、Runway等模型通常每秒0.10美元以上的收费标准,价格差距约达20倍。

"印度是一个视频优先的市场。纵观印度所有头部消费互联网产品,视频的表现始终优于文字。当前的AI视频模型对于印度规模化应用而言成本过高。如果视频AI要真正触达学生、教师、中小微企业、创作者、企业及公共服务,成本必须大幅下降。成本是推动AI在印度普及的最关键突破口。"Peak XV董事总经理Rajan Anandan在接受TechCrunch采访时表示。

图像和视频生成模型往往忽视文化细节,输出结果容易流于刻板印象或过于泛化——这一问题此前TechCrunch已有报道。Avataar AI表示,已通过精心筛选的数据对Varya进行训练,使其能够识别包括食物、服饰、建筑和节日在内的文化细节。

Varya将作为开放权重模型发布于印度政府搭建的AI Kosh平台——这是印度政府集中托管公开AI模型与数据集的统一平台——同时附带训练数据,开发者可自行部署或按需修改。Avataar还计划向企业客户开放该模型,并表示欢迎与Higgsfield、Adobe Firefly等视频工具展开合作。目前任何人均可通过官网,使用文字提示或参考图像进行体验。

Varya的发布折射出印度AI雄心背后的深层取舍。业界资深人士指出,印度在AI领域的优势路径在于打造应用产品与完善的开发者生态,而非与他国在基础模型层面正面竞争。这一务实选择背后有其现实原因:受限于算力不足与高质量数据匮乏,印度的模型研发进展明显慢于全球竞争对手。

"印度AI使命"也是政府弥合这一差距的更宏观战略布局的组成部分。去年,该计划遴选了包括Avataar AI在内的12家初创企业开展AI模型研发,并为其提供低成本算力支持。今年早些时候,印度信息技术部长Ashwini Vaishnaw表示,印度的目标是到2028年吸引2000亿美元的AI投资,并在六个月内将GPU算力容量翻倍以上。

Q&A

Q1:Varya视频模型是怎么做到比其他模型便宜这么多的?

A:Varya并非从头训练,而是基于阿里巴巴开源的Wan 2.2模型,通过知识蒸馏技术进行压缩和优化,将推理步骤从50步缩减至4步,生成速度提升10倍,成本大幅降低。托管服务定价为每秒0.48印度卢比(约0.005美元),而Veo、Runway等模型通常每秒收费0.10美元以上,价格差距约20倍。

Q2:Varya是如何处理印度本土文化识别的?

A:Avataar AI通过精心筛选的本土数据对Varya进行专项训练,使模型能够识别印度特有的文化元素,包括本地节日、传统服饰、特色食物和建筑风格等,从而避免通用视频生成模型常见的文化失真或刻板化输出问题。

Q3:Varya模型是否对外开放,普通开发者能用吗?

A:可以。Varya将作为开放权重模型发布在印度政府的AI Kosh平台上,并附带训练数据,开发者可以自行部署或二次修改。目前任何人都可以在Avataar官网通过文字提示或参考图像直接体验该模型。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/18 16:44:13

探索未来文件管理:ownCloud Infinite Scale

探索未来文件管理:ownCloud Infinite Scale 【免费下载链接】ocis :atom_symbol: ownCloud Infinite Scale 项目地址: https://gitcode.com/GitHub_Trending/oc/ocis 项目介绍 ownCloud Infinite Scale(简称oCIS)是下一代的文件同步与…

作者头像 李华
网站建设 2026/6/18 16:26:34

抖音直播数据抓取:5分钟搭建实时弹幕监控系统

抖音直播数据抓取:5分钟搭建实时弹幕监控系统 【免费下载链接】DouyinLiveWebFetcher 抖音直播间网页版的弹幕数据抓取(2025最新版本) 项目地址: https://gitcode.com/gh_mirrors/do/DouyinLiveWebFetcher 在直播电商时代,…

作者头像 李华
网站建设 2026/6/16 6:45:41

个人GPU部署LLM:68个可运行模型的显存、量化与框架实战指南

1. 为什么“68个适合个人GPU部署的LLM”这个标题背后藏着一场静默革命 你有没有在深夜调试过PyTorch——明明 nvidia-smi 显示GPU在跑, torch.cuda.is_available() 却返回 False ?有没有对着 pip install torch 报错里那一长串 CUDA version mi…

作者头像 李华
网站建设 2026/6/18 11:27:34

普通电脑跑大模型:llama.cpp+GGUF+Q4_K_M实战指南

1. 项目概述:为什么普通电脑也能跑大模型?这事儿真不是画饼“不用高价显卡!llama.cpp教程 普通电脑全速跑大模型”——这个标题一出来,我身边做AI应用的同事、搞嵌入式开发的老伙计,甚至刚买完MacBook Air写毕业论文的…

作者头像 李华
网站建设 2026/6/18 16:27:09

Claude Opus 4.7快速模式与MiMo-V2-Pro百万上下文实战解析

1. 项目概述:这不是一则普通科技新闻,而是一次模型能力边界的集体重估“AI 日报 2026-05-13 Claude Opus 4.7 快速模式上线,Xiaomi MiMo API 新规”——这个标题里藏着两股正在交汇的暗流。它表面是两条产品线的常规更新,实则标志…

作者头像 李华
网站建设 2026/6/18 16:25:52

企业级报表系统核心挑战:从“creport 412”错误看架构设计与排查实践

1. 项目概述:从“creport 412”看企业级报表系统的核心挑战最近在梳理一个遗留项目的技术债时,一个名为“creport 412”的报错日志频繁出现在监控告警里。这个看似简单的错误代码,背后牵扯出的是一整套企业级报表系统的设计、性能、稳定性和团…

作者头像 李华