news 2026/4/18 9:47:52

谷歌发布Gemini 3 Flash:性能媲美顶级模型成本大幅降低

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
谷歌发布Gemini 3 Flash:性能媲美顶级模型成本大幅降低

大语言模型发布周期持续加速。在过去30天内,我们见证了谷歌Gemini 3 Pro、Anthropic的Opus 4.5以及OpenAI的GPT-5.2的相继发布。除此之外,A2AI、DeepSeek、Grok、Mistral、Nvidia等公司也推出了各自的模型。今天轮到谷歌再次出手,推出Gemini 3的更小更快版本:Gemini 3 Flash。

正如我们在谷歌和其他前沿模型开发商的小型模型中所见,Gemini 3 Flash在能力方面与其Pro版本相差不远。在开启思考模式的情况下,Gemini 3 Flash在大多数基准测试中接近Gemini 3 Pro、Anthropic的Sonnet 4.5和OpenAI的GPT-5.2的表现,有时甚至超越它们。与前代产品一样,它也提供100万Token的上下文窗口。

为了更好地理解Gemini 3 Flash的性能表现,仅在几周前,Flash 3还能在大多数前沿模型基准测试中位居榜首。

谷歌在今日的公告中写道:"长期以来,AI让我们面临一个选择:要么是缓慢昂贵的大型模型,要么是能力较弱的高速模型。Gemini 3 Flash结束了这种妥协。Gemini 3 Flash既提供了智能又保证了速度。"

与上一代Flash模型(Gemini 2.5 Flash)相比,Gemini 3 Flash实现了显著提升,这对开发者来说尤为重要,因为Flash长期以来一直被认为是性价比最佳的模型。

谷歌在多模态推理领域一直处于领先地位,其模型能够对文本、图像、音频文件和视频进行推理。最近,Gemini模型在即时构建可视化方面也变得相当出色,谷歌也为这个新模型强调了这一点。实际上,Gemini 3 Flash在多模态MMMU-Pro基准测试中甚至超越了Gemini 3 Pro,尽管仅高出0.2%。

谷歌模型最近取得进展的另一个领域是编程。在SWE-Bench Verified基准测试中,Gemini 3 Flash也超越了Gemini 3 Pro,甚至领先于Sonnet 4.5(尽管GPT-5.2在这里仍是最佳表现者)。

Warp公司创始人兼首席执行官扎克·劳埃德表示:"Gemini 3 Flash仍然是Warp建议代码差异功能的最佳选择,在这里低延迟和成本效率是硬性约束。通过这次发布,它能解决更广泛的常见命令行错误,同时保持快速和经济。在我们的内部评估中,我们看到修复准确性提升了8%。"

我们最近看到的一个趋势是,即使是这些较小的模型,开发者通过API使用的成本也在上升,Gemini 3 Flash现在每百万输入/输出Token的成本为0.5美元/3美元,高于之前的0.3美元/2.5美元。但这仍然比Anthropic的Claude Sonnet(3美元/5美元)或甚至更小且能力较弱的Claude Haiku(1美元/5美元)模型便宜得多。

不过,谷歌表示,平均而言,与Gemini 2.5 Flash相比,Gemini 3 Flash在生成答案时使用的Token减少了30%,同时速度也更快。谷歌只将这个新模型与较旧的2.5 Pro模型进行了比较,在这种比较下,它的速度快了3倍。

新模型现在可通过Google AI Studio和Vertex AI的API使用,也可在公司新的AI编程工具Antigravity、Gemini CLI和Android Studio中使用。当然,谷歌的合作伙伴也会将其集成到自己的工具中。

对于消费者来说,Gemini 3 Flash现在将为Google搜索的AI模式提供支持(Pro模型仍然是一个选项),以及Gemini应用中的"快速"和"思考"模式(Pro模式仍然可用)。

Q&A

Q1:Gemini 3 Flash相比前代产品有什么改进?

A:与Gemini 2.5 Flash相比,Gemini 3 Flash实现了显著性能提升,平均使用的Token减少了30%,速度更快。在能力方面接近顶级模型如Gemini 3 Pro、Sonnet 4.5和GPT-5.2的表现,有时甚至超越它们。同时保持100万Token的上下文窗口。

Q2:Gemini 3 Flash的定价如何?

A:Gemini 3 Flash每百万输入/输出Token的成本为0.5美元/3美元,虽然比前代的0.3美元/2.5美元有所上涨,但仍然比Anthropic的Claude Sonnet(3美元/5美元)或Claude Haiku(1美元/5美元)便宜得多,保持了最佳性价比。

Q3:开发者和普通用户如何使用Gemini 3 Flash?

A:开发者可以通过Google AI Studio和Vertex AI的API使用,也可在Antigravity、Gemini CLI和Android Studio等AI编程工具中使用。普通用户可以通过Google搜索的AI模式和Gemini应用中的"快速"和"思考"模式体验这项技术。


版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/18 7:23:16

漏洞扫描 VS 渗透测试:2026年企业安全防护的选择策略与实战指南

漏洞扫描与渗透测试的核心差异漏洞扫描:自动化工具快速识别已知漏洞(如CVE列表),覆盖范围广但深度有限,适合周期性批量检测。典型工具包括Nessus、OpenVAS、Qualys等。渗透测试:模拟黑客攻击的手动自动化测…

作者头像 李华
网站建设 2026/4/18 8:33:28

上海嵌入式开发哪家专业?实邦电子值得考虑吗?

上海嵌入式开发哪家专业?实邦电子值得考虑吗?一、实邦电子:十六载行业深耕上海实邦电子科技有限公司自 2009 年成立以来,已在行业中稳健发展了 16 年。这十六年的时光,见证了实邦电子从初出茅庐到行业佼佼者的蜕变。在…

作者头像 李华
网站建设 2026/4/18 9:44:06

特朗普:必须拥有整个格陵兰岛

据央视新闻消息,记者当地时间1月8日获悉,美国总统特朗普表示,美国必须“拥有”整个格陵兰,而不仅仅是依据现有条约在当地行使军事和防务权利。 特朗普称,所有权本身具有无法通过租赁或条约获得的战略价值。 据悉&…

作者头像 李华
网站建设 2026/4/17 22:25:19

高效的跨境电商广告优化系统:易营宝广告投放实操指南

跨境电商广告优化的核心挑战与AI破局之道 跨境电商广告优化难?易营宝广告投放系统以AI驱动,提供一站式智能营销解决方案,助力企业精准投放、降本增效,轻松实现全球化增长!在全球化竞争加剧的背景下,跨境电…

作者头像 李华
网站建设 2026/4/18 2:29:53

泛素连接酶STUB1调控干扰素γ受体稳定性及其在肿瘤免疫中的功能

干扰素γ(IFNγ)在肿瘤免疫应答中具有关键作用,其信号通路的强度受其受体复合体表达水平的直接影响。本文系统阐述了STUB1作为E3泛素连接酶,通过介导IFNγ受体复合体成分IFNGR1及JAK1的泛素化降解,负向调控IFNγ信号通…

作者头像 李华
网站建设 2026/4/18 2:33:14

ChatGPT新手入门指南:如何开始使用AI聊天机器人

ChatGPT于三年多前发布,这款AI聊天机器人已经成为一个重要的工具。它拥有约8亿周活跃用户——这意味着仍有大约70亿人需要了解如何使用它。如果您准备尝试ChatGPT,您将加入众多在工作中使用它的人群,但更多的是在个人生活中使用。根据ChatGPT…

作者头像 李华