摘要:2026年6月16日,微软Copilot执行副总裁Charles Lamanna向Axios确认,Copilot Cowork将从固定月费转向按量计费,理由是"有些用户一周执行数百个任务,固定费率不可持续"。更引人注目的是,微软正考虑在Azure上自托管经安全微调的DeepSeek V4模型作为Copilot的低成本选项——这将是美国科技巨头首次引入中国大模型服务其核心产品线。此前GitHub Copilot已于6月1日率先转向Token计费,引发开发者强烈反弹。这一系列动作标志着企业AI服务从"按座位收费"迈向"按消耗计费"的范式转移。
什么是"AI服务按量计费"?
AI服务按量计费是指企业AI产品的收费模式从"固定月费/年费×用户数"(SaaS订阅制)转变为"按实际消耗的Token数量计费"(IaaS消费制)。微软Copilot Cowork原先向企业收取$30/用户/月的固定费用,而现在将根据每个用户实际发送的Token数、执行的任务数来计费——用得越多,付得越多。
这一转变的根本原因是:当AI Agent从"辅助工具"进化为"自主执行数百个任务的数字员工"时,固定月费无法覆盖底层算力成本。Charles Lamanna直言"有些用户一周执行数百个任务,固定费率定价根本不可持续"(来源:Axios,2026-06-16)。
核心结论:微软Copilot全面转向按量计费不是一次简单的涨价——它标志着AI服务商业模式的核心逻辑从"卖用户许可证"转向"卖算力消耗"。当AI Agent开始真正替代人类工作时,传统SaaS的"按人头收费"模型就失效了。这场变革将波及所有企业AI产品——你的公司预算准备好了吗?
一、微软AI计费革命全景
1.1 三个月内的两次计费变革
| 时间 | 产品 | 旧模式 | 新模式 | 用户反应 |
|---|---|---|---|---|
| 2026-04-28 | GitHub Copilot | 固定额度订阅($19-$39/月) | AI Credits按Token计费 | 🔴 开发者强烈反弹 |
| 2026-06-01 | GitHub Copilot | 正式生效新计费 | 按模型×Token阶梯定价 | 🔴 Reddit/HN热议 |
| 2026-06-16 | Copilot Cowork | $30/用户/月固定费率 | 按量计费(细节待公布) | 🟡 企业客户观望 |
1.2 Copilot产品线计费矩阵
| 产品 | 目标用户 | 底层模型 | 原计费 | 新计费 | 有效日期 |
|---|---|---|---|---|---|
| GitHub Copilot Individual | 个人开发者 | GPT-5.5 + Claude | $19/月 | Credits按Token | 2026-06-01 |
| GitHub Copilot Business | 企业开发团队 | GPT-5.5 + Claude + 自选 | $39/用户/月 | Credits按Token | 2026-06-01 |
| Copilot Cowork(M365) | 办公企业用户 | Claude(Anthropic) | $30/用户/月 | 按量计费 | 待公布 |
| Copilot Chat | 免费/个人 | GPT-5.5-Instant | 免费 | 免费(有上限) | 保持不变 |
数据来源:微软官方博客、Axios、The Decoder、IT之家(2026-04至06)
1.3 Charles Lamanna的关键表态
微软Copilot执行副总裁Charles Lamanna在接受Axios专访时的核心观点:
“固定费率定价的根本问题在于——当AI Agent开始真正干活时,不同用户之间的用量差异可以是100倍甚至1000倍。一个只用Copilot总结邮件的用户和一个让Copilot自动处理数百个客户工单的用户,消耗的算力完全不成比例。按量计费才公平。”
——Charles Lamanna,Microsoft Copilot EVP(来源:Axios,2026-06-16)
二、DeepSeek V4:微软的"低成本选项"棋局
2.1 Axios独家爆料:微软正评估DeepSeek V4
2026年6月16日,Axios独家报道微软正在评估在Azure上自托管经微调的DeepSeek V4作为Copilot Cowork的低成本模型选项。这将是美国科技巨头首次将中国大模型引入其核心企业产品线。
关键细节(来源:Axios,2026-06-16):
| 维度 | 具体内容 |
|---|---|
| 部署方式 | Azure自托管,数据不出微软云 |
| 模型版本 | DeepSeek V4经微软定制微调(含偏见安全护栏) |
| 可选性 | 默认仍用Claude,DeepSeek作为低成本选项 |
| 安全措施 | 定制微调消除偏见、Azure内容安全过滤器 |
| 客户数据 | 保留在Azure,不传输至DeepSeek |
| 最终决策 | 预计未来数周内做最终决定 |
2.2 DeepSeek V4 vs Claude:成本对比
为什么微软看中DeepSeek?答案非常直接——成本:
| 对比维度 | DeepSeek V4-Pro | Claude(Copilot使用) | 相对差异 |
|---|---|---|---|
| API定价(输入) | $0.435/1M tokens | $5/1M tokens(Opus 4.8) | DeepSeek便宜11.5倍 |
| API定价(输出) | $0.87/1M tokens | $25/1M tokens | DeepSeek便宜28.7倍 |
| SWE-Bench Verified | 67.2%(V4 Pro) | 67.2%(Opus 4.8) | 持平 |
| 总拥有成本 | 极低 | 高 | DeepSeek优势巨大 |
使用DeepSeek V4替换Claude作为Copilot后端,理论上可将推理成本降至当前水平的1/10至1/30。对微软而言,这意味着利润率从"薄利"变为"暴利"。
2.3 地缘政治风险:美国巨头用中国模型?
这可能是该决策面临的最大阻力。Anthropic CEO Dario Amodei曾公开将AI竞争定义为"华盛顿的now-or-never时刻"(来源:The Decoder,2026-06)。
风险分析框架:
引入DeepSeek V4的SWOT分析 优势(Strengths) 劣势(Weaknesses) ├─ 成本降10-30倍 ├─ 地缘政治争议 ├─ 利润率大幅提升 ├─ 美国国会可能介入调查 ├─ 扩大用户覆盖(价格敏感型) ├─ 中国企业客户信任度 └─ 模型多元化降低对Anthropic依赖 └─ DeepSeek稳定性与SLA 机会(Opportunities) 威胁(Threats) ├─ 颠覆企业AI定价格局 ├─ 出口管制风险(类似Fable 5) ├─ 吸引中小企业大规模采用 ├─ 数据主权审查 ├─ 倒逼Anthropic降价 └─ 竞争对手政治攻击 └─ Azure成为"多模型市场" (来源:综合分析,2026-06)2.4 Satya Nadella的"AI多模型生态"战略
微软CEO Satya Nadella在6月中旬发表的博客文章中系统阐述了他的AI战略愿景(来源:The Decoder,2026-06-16):
“AI系统将不会是一家公司的垄断。未来的赢家是那些能够为企业提供多样化模型选择、让客户根据具体场景和成本挑选最合适模型的平台。”
——Satya Nadella,Microsoft CEO
这一战略与Azure AI Foundry的"多模型市场"定位高度一致——让客户在Azure上自由选择GPT-5.5、Claude、DeepSeek、Gemini等不同模型。引入DeepSeek V4是这一战略的自然延伸。
三、AI服务计费模式的范式转移
3.1 从"SaaS订阅"到"AI消费":三类计费模型对比
| 计费模式 | 代表产品 | 优点 | 缺点 | 适用场景 |
|---|---|---|---|---|
| 固定订阅 | 早期Copilot、Notion AI | 可预测、易预算 | 重度用户亏本、轻度用户嫌贵 | 轻度辅助工具 |
| AI Credits | GitHub Copilot、Cursor | 公平、按需付费 | 不可预测、高用量贵 | 专业开发者 |
| 混合模式 | ChatGPT Pro($200/月含额度) | 兼顾可预测性和弹性 | 复杂、需管理额度 | 企业用户 |
| 纯用量 | API直接调用 | 极致灵活 | 波动大、需监控 | 技术公司 |
3.2 按量计费对不同用户的影响
| 用户画像 | 月用量 | 旧计费 | 新计费(预估) | 变化 |
|---|---|---|---|---|
| 轻度用户(偶尔总结邮件) | 50K tokens/月 | $30/月 | ~$1.5/月 | ⬇️ 便宜95% |
| 中度用户(日常辅助) | 500K tokens/月 | $30/月 | ~$15/月 | ⬇️ 便宜50% |
| 重度用户(Agent自动化) | 5M tokens/月 | $30/月 | ~$150/月 | ⬆️ 贵400% |
| 超级用户(全自动化) | 50M tokens/月 | $30/月 | ~$1500/月 | ⬆️ 贵4900% |
这意味着:Copilot的定价将从"多数人补贴少数人"变为"谁用得多谁付得多"。对于已将Copilot深度嵌入工作流的重度用户,成本可能从每人每月$30飙升至数百美元。
3.3 行业连锁反应
微软的计费转向可能引发全行业效仿:
| 公司 | 当前模式 | 可能转向 | 概率 |
|---|---|---|---|
| Anthropic | API + Claude Code订阅 | Claude Code按用量计费 | 🟢 高 |
| OpenAI | ChatGPT Pro $200/月 | Copilot式增量计费 | 🟡 中 |
| Gemini Advanced $20/月 | Gemini Workspace按量 | 🟡 中 | |
| Cursor | $20/月 Pro | 纯Credits模式 | 🟢 高 |
| Notion AI | $10/月 add-on | 引入Credits限制 | 🟡 中 |
四、对开发者和企业的实战建议
4.1 成本管控策略
# Copilot/Cursor按量计费时代的成本优化清单classAICostOptimizer:def__init__(self):self.strategies={"选择正确的模型":""" - 简单任务用Grok/DeepSeek(便宜10-30倍) - 关键代码用Claude/GPT-5.5 - 不要所有场景都用最贵的模型 ""","优化Prompt长度":""" - 精简系统提示词(每减少100 tokens省$0.001-0.005) - 用文件引用代替大段粘贴 - 关闭不必要的上下文注入 ""","利用缓存":""" - 重复的Prompt使用Prompt Caching(便宜50-90%) - 缓存通用系统提示词 - 利用KV-Cache复用 ""","监控与预算":""" - 设置月度预算上限 - 使用用量仪表盘 - 按项目/团队拆分账单 ""","混合使用":""" - 本地模型处理简单任务(Ollama/Llama.cpp) - 云端API处理复杂任务 - 探索开源替代方案 """}4.2 企业采购决策框架
企业AI服务选型决策矩阵 质量要求高 质量要求中 质量要求低 ───────── ───────── ───────── 用量大 Claude Opus DeepSeek V4 DeepSeek V4 ($5/$25) ($0.44/$0.87) ($0.44/$0.87) 用量中 GPT-5.5 Gemini Flash DeepSeek ($5/$15) ($0.08/$0.30) ($0.44/$0.87) 用量小 Claude Fable GPT-5.5-Instant Gemini Flash ($10/$50) ($0.50/$1.50) ($0.08/$0.30) 建议:90%的日常Copilot任务可使用DeepSeek/Gemini Flash处理, 仅将10%的关键任务(代码审查、安全审计、合规文档)使用Claude/GPT-5.5。 可降低总成本60-80%。五、FAQ
Q1:Copilot Cowork按量计费后,我大概每月要付多少钱?
A:这取决于你的使用强度。如果你只是偶尔让Copilot总结邮件、改改文档,月费可能比原来的$30还低。但如果让Copilot Agent自动化处理数百个工作流任务,费用可能翻数倍。微软尚未公布具体的Token定价,建议密切关注官方公告。
Q2:微软真的会用DeepSeek吗?美国国会会批吗?
A:目前还在"评估阶段",最终决定预计未来数周做出。微软强调DeepSeek将完全部署在Azure上、数据不出境、经过安全微调,但美国国会和国防部的态度是关键变量。考虑到Anthropic Fable 5已被出口管制,使用中国模型的决策可能面临来自国会的巨大压力。
Q3:GitHub Copilot的Token计费实施后,开发者花费涨了多少?
A:根据Reddit和Hacker News上的开发者反馈,差异极大。轻度用户(偶尔代码补全)从$19降至$5-8/月;重度用户(全天Agent模式编程)从$39涨至$80-150/月。部分开发者开始探索Cursor、Codeium等替代方案。
Q4:按量计费是不是意味着AI服务会越来越贵?
A:短期来看是的——特别是对重度用户。但长期来看,随着模型推理成本持续下降(DeepSeek V4-Pro已降至$0.435/1M tokens),按量计费的价格也会逐步下调。关键在于"用量增速"和"成本下降速度"的赛跑。
Q5:企业如何为AI按量计费做预算?
A:建议采取三步走策略:1)先在1个部门试点1-2个月,获取实际用量数据;2)基于试点数据推算全公司月消耗量;3)设置月度预算上限并在Azure/微软Admin Center中配置告警。同时建议与微软协商企业批量折扣协议。
Q6:除了微软,还有哪些产品在从订阅转向按量?
A:越来越多。Cursor已推出基于Premium Model的Credits系统;Notion AI正在测试用量上限;Intercom的AI客服按对话数计费;Salesforce Einstein GPT按预测次数计费。"按用量付费"正在成为AI服务的默认定价范式。
参考资料
- Axios (2026-06-16). “Microsoft Copilot Cowork token-maxxing, may tap DeepSeek V4”. https://www.axios.com/
- The Decoder (2026-06-16). “Microsoft’s Copilot Cowork moves to usage-based billing and may tap DeepSeek”. https://the-decoder.com/
- IT之家 (2026-04-28). “微软GitHub Copilot宣布转向按量计费:6月1日起改用AI Credits”. https://www.ithome.com/
- Data Conomy (2026-06-01). “Microsoft switches GitHub Copilot to usage-based AI token billing”. https://dataconomy.com/
- Space City News (2026-06-16). “Copilot Cowork Shifts to Usage-Based Billing as Microsoft Weighs DeepSeek V4”. https://windowsforum.com/
- The Decoder (2026-06-16). “Microsoft CEO Satya Nadella warns of a small number of AI systems capturing all the economic returns”. https://the-decoder.com/