谷歌甩出“价格屠夫”!Gemini 3 Flash超Pro,成本仅1/4,速度如“闪电”
创始人
2025-12-19 18:13:41
0

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!

(来源:智东西)

智东西

编译 陈骏达

编辑 李水青

智东西12月18日报道,昨晚,谷歌发布了Gemini 3 Flash,旨在用更低的成本提供前沿的智能水平。

具体来看,它输出每百万token的价格仅为Claude Sonnet 4.5的20%、GPT-5.2的21%,却能在基准测试上达到甚至超越这些旗舰级模型的水平。

即便是和Gemini 3 Pro相比,Gemini 3 Flash也极具性价比。Flash的价格仅为Pro的25%,却在MMMU-Pro、SWE-bench Verified这些核心基准测试上,超过了Pro版本的模型。

此前发布的Gemini 3系列模型在复杂推理、多模态和视觉理解、智能体及Vibe Coding任务方面都展现出优势,Gemini 3 Flash保留了这一基础,将Gemini 3 Pro级别的推理能力与Flash级别的延迟、效率和成本相结合。

谷歌首席科学家Jeff Dean称,Gemini 3 Flash不仅比2.5 Pro质量更高,速度也快3倍,而且价格仅为后者的几分之一。以下是并排演示:

(视频)

Gemini 3 Flash目前已经全面开放,开发者可通过Google AI Studio中的Gemini API、Gemini CLI以及智能体开发平台Google Antigravity使用。而普通用户能通过Gemini应用程序和谷歌搜索中的AI模式使用。

一、专为迭代式开发打造,还帮你用“嘴编程”

Gemini 3 Flash究竟能做什么?谷歌称,这是一款专为迭代式开发打造的模型,能够以低延迟提供接近Gemini 3 Pro级别的编程性能。

谷歌分享了多个案例。比如,Gemini 3 Flash可以在一个手部追踪的“弹球解谜游戏”中实现多模态推理,提供近乎实时的AI辅助。

它还可以近乎实时地构建和A/B测试新的加载动画设计,简化了从设计到代码的流程。

使用多模态推理,Gemini 3 Flash可快速分析带有上下文UI覆盖层的图像,并生成字幕,最终将静态图像转化为交互式体验。

凭借在推理、工具使用和多模态能力方面的出色表现,Gemini 3 Flash 特别适合希望进行更复杂视频分析、数据提取和视觉问答的开发者。

Gemini 3 Flash的多模态推理能力可用于帮助用户看、听和理解任何类型的信息。

用户可以要求Gemini理解视频和图像,并在几秒钟内将该内容转化为有帮助且可操作的计划。

Gemini应用程序中的Gemini 3 Flash可以分析短视频内容并给你一个计划,比如如何改进你的高尔夫挥杆。

由于Gemini 3 Flash针对速度进行了优化,它可以在你仍在绘图时就“看到”并猜出你画的是什么。

你可以上传一段录音,Gemini 3 Flash将识别你的知识盲点,创建一个自定义测验,并对答案给出详细解释。

或者,也可以尝试“用嘴编程”,仅用语音输入从零开始构建有趣、有用的应用程序。Gemini 3 Flash可以在几分钟内将非结构化的想法转化为一个功能正常的应用程序。

二、多领域性能超越Pro级模型,可自动调节思考量

Gemini 3 Flash在基准测试上表现如何?它在GPQA Diamond(90.4%)和Humanity’s Last Exam(不使用工具时为33.7%)等博士级推理和知识基准测试中,可与更大的前沿模型相媲美,并且在多项基准测试中显著优于Gemini 2.5 Pro。

在评估编码智能体能力的基准测试SWE-bench Verified中,Gemini 3 Flash取得78%的成绩,不仅超越了2.5系列,也超过了Gemini 3 Pro。

它还在MMMU Pro上达到了81.2%的分数,与Gemini 3 Pro相当,实现了最先进的性能。

在下图中展示的基准测试中,Gemini 3 Flash在几乎所有基准测试上都超过了Claude Sonnet 4.5、Gemini 2.5 Pro等模型。

除了前沿级别的推理和多模态能力外,Gemini 3 Flash的构建旨在实现高效率,推动了质量与成本、速度之间的帕累托边界。下方散点图显示了多个语言模型的LMArena Elo得分与每百万tokens价格的关系,其中一条线标出了穿过Gemini 3 Pro’、Gemini 3 Flash和Gemini 3 Flash Lite的帕累托边界。

在思考预算拉满时,Gemini 3 Flash能够调节其思考量。对于更复杂的用例,它可能会思考更长时间。但根据典型流量测量,在以更高的性能准确完成日常任务的前提下,它平均比2.5 Pro少使用30%的tokens。

结语:Gemini 3模型版图补全,有望深度嵌入日常应用

Gemini 3系列模型自发布以来就广受好评,不过其高昂的成本让不少用户望而却步。Gemini 3 Flash补全了Gemini 3家族在轻量化、高性价比方面的布局,回应了开发者在真实生产环境里的诉求。

从迭代式开发、Vibe Coding,到多模态应用、实时交互和智能体系统,Gemini 3 Flash所展现的更高性价比,有望帮助智能更广泛地嵌入日常应用和商业系统之中。

相关内容

战犯笔供还原侵华日军海拉尔...
(来源:长江日报)据央视新闻,在全民族抗战爆发89周年纪念日到来之...
2026-07-05 19:31:19
西藏文旅厅、财政厅承诺兑现...
(来源:湖北日报)6月7日,西藏文旅放了个“大招”,宣布拍视频宣传...
2026-07-05 19:30:53
中央和国家机关“两优一先”...
7月3日,中央和国家机关优秀共产党员、优秀党务工作者和先进基层党组...
2026-07-05 19:30:04
飞速创新:拟3.3亿元收购...
每经AI快讯,7月5日,飞速创新发布公告,于2026年7月4日,公...
2026-07-05 19:29:53
国银金租(01606.HK...
格隆汇7月5日丨国银金租(01606.HK)公布,公司作为买方与卖...
2026-07-05 19:29:43
关注肺功能,控制慢阻肺危险...
(来源:江苏疾控)有用的知识又增加了!点赞+分享~* 部分图片来源...
2026-07-05 19:29:35
张宏伟主持召开市防汛抗旱指...
(来源:信阳发布)7月5日,市委书记张宏伟主持召开市防汛抗旱指挥部...
2026-07-05 19:29:27
中山女飞人,出征亚运!
■ 时 政全市深入实施“百县千镇万村高质量发展工程”推进会召开6月...
2026-07-05 19:29:18
韧性为王,企业如何搭建供应...
当前世界形势复杂多变,产业链供应链碎片化风险增加,全球供应链已跨入...
2026-07-05 19:29:08

热门资讯

战犯笔供还原侵华日军海拉尔毒气... (来源:长江日报)据央视新闻,在全民族抗战爆发89周年纪念日到来之际,侵华日军第七三一部队罪证陈列馆...
西藏文旅厅、财政厅承诺兑现:一... (来源:湖北日报)6月7日,西藏文旅放了个“大招”,宣布拍视频宣传西藏,点赞500万以上、形成现象级...
中央和国家机关“两优一先”表彰... 7月3日,中央和国家机关优秀共产党员、优秀党务工作者和先进基层党组织表彰大会在北京召开。中共中央政治...
飞速创新:拟3.3亿元收购上海... 每经AI快讯,7月5日,飞速创新发布公告,于2026年7月4日,公司(作为买方)与陈群、汪革、陈志强...
国银金租(01606.HK):... 格隆汇7月5日丨国银金租(01606.HK)公布,公司作为买方与卖方上海域允信息技术有限公司于202...
关注肺功能,控制慢阻肺危险因素... (来源:江苏疾控)有用的知识又增加了!点赞+分享~* 部分图片来源网络,非商业用途,仅作为科普传播素...
张宏伟主持召开市防汛抗旱指挥部... (来源:信阳发布)7月5日,市委书记张宏伟主持召开市防汛抗旱指挥部专题调度会议,市委副书记、市长卢希...
中山女飞人,出征亚运! ■ 时 政全市深入实施“百县千镇万村高质量发展工程”推进会召开6月29日,全市深入实施“百县千镇万村...
韧性为王,企业如何搭建供应链“... 当前世界形势复杂多变,产业链供应链碎片化风险增加,全球供应链已跨入“韧性为王”时代文|《财经》记者 ...
迅策与格创东智达成战略合作 ... 7月5日,迅策(03317)发布公告,与格创东智(深圳)科技有限公司正式签署战略合作备忘录。此次合作...