谷歌深夜炸场：Gemini 3 全面碾压 GPT 5.1，大模型“谷歌时代”正式降临

导语谷歌于昨夜深夜突发震撼弹，正式发布最强模型 Gemini 3，以“静默上新”的姿态宣告王者归来。新模型在各项核心基准测试中全面超越 GPT 5.1 与 Claude 4.5，凭借惊人的 91.9% GPQA Diamond 得分及独创的“Deep Think”深度推理模式，重新定义了 AI 智能天花板。从一键生成 Game Boy 模拟器到重塑搜索体验，Gemini 3 标志着大模型正式进入谷歌统治时代。

谷歌深夜亮剑性能参数全线超越GPT 5.1

在没有任何预热发布会的情况下，谷歌选择在深夜直接上线了其年度杀手锏——Gemini 3。这一次，谷歌不再是追赶者，而是以绝对的性能优势俯视群雄。根据泄露的 Model Card 及早期评测数据，Gemini 3 Pro 在几乎所有关键基准测试中都取得了压倒性胜利。

最令人瞩目的是其在科学知识推理（GPQA Diamond）上斩获了 91.9% 的高分，不仅大幅领先 GPT 5.1 的 88.1%，更是将 Claude 4.5 甩在身后。在数学领域，其 AIME 2025 测试得分高达 95.0%，配合代码执行更是达到了完美的 100%，彻底解决了复杂逻辑推理的痛点。这一连串的数据表明，谷歌自研 TPU 算力集群与庞大的数据护城河终于展现出了恐怖的统治力。

深度思考模式Deep Think 让AI拥有慢思考能力

Gemini 3 不仅快，更懂得“慢”。新版本引入了备受期待的 Deep Think（深度思考）模式，这是谷歌针对复杂推理任务给出的终极答案。与以往模型急于给出表面答案不同，Deep Think 模式赋予了模型类似人类的“系统2”思维能力，能够抽丝剥茧地处理多层级难题。

在 Humanity's Last Exam（人类终极考试）测试中，开启深度思考模式的 Gemini 3 拿下了 41.0% 的分数，而 ARC-AGI-2 基准测试更是达到了 45.1%。无论是解析晦涩的学术论文，还是规划跨越数月的项目路径，Gemini 3 都能展现出令人咋舌的逻辑深度。OpenAI CEO 奥特曼甚至罕见地在社交媒体上点赞祝贺，侧面印证了此次更新的含金量。

Vibe Coding元年一句话生成可玩游戏

对于开发者和创作者而言，Gemini 3 的发布意味着“Vibe Coding”（氛围编码）时代的正式到来。借助谷歌新推出的 Google Antigravity 开发者平台，Gemini 3 展现了极其强悍的 Agent（智能体）能力。

在演示中，用户仅凭一句简单的提示词，Gemini 3 就从零构建了一个功能完备的 3D 乐高编辑器，不仅界面精美，物理碰撞逻辑也毫无破绽。更夸张的是，它甚至能直接通过 SVG 代码绘制并运行一个 Game Boy 模拟器，或者复刻经典的 iOS 游戏《Ridiculous Fishing》，连音效和背景音乐都一并生成。这种“所想即所得”的编程能力，让自然语言真正成为了最高级的编程语言。

图源备注：图片由AI生成

## 原生多模态交互重塑搜索与应用生态

Gemini 3 的强大不止于参数，更在于其原生多模态（Native Multimodality）的交互体验。它能同时处理文本、图像、音频和长视频，且不再是简单的拼接，而是深度的语义融合。在视频理解测试 Video-MMU 中，Gemini 3 取得了 87.6% 的成绩，用户可以上传一段长视频，让 AI 瞬间定位到某个微小的细节。

目前，Gemini 3 已全面接管谷歌生态。在 Google Search 中，AI Mode 能够生成动态的交互式图表；在 Gemini App 中，它能像私人助理一样精准管理你的生活杂务。尽管 Deep Think 模式带来了更高的推理成本，但谷歌显然已准备好用这款划时代的产品，彻底终结大模型市场的混战局面。

谷歌深夜炸场：Gemini 3 全面碾压 GPT 5.1，大模型“谷歌时代”正式降临

谷歌深夜亮剑性能参数全线超越GPT 5.1

深度思考模式Deep Think 让AI拥有慢思考能力

Vibe Coding元年一句话生成可玩游戏

相关推荐

谷歌Gemini 3深度思考版进化甚至通过了人类最后考试

每日AI资讯0712：新工具赋能创作，大模型驱动行业变革

智谱全面终结大模型价格战 GLM-5海外首发开启价值回归新周期

评论 (0)

2025 AI 技术峰会

AI 实战课程

热门工具

AI 助手

智能图像处理

AI 翻译

热门文章

字节跳动 - Trae 1.4 终结“白嫖”时代，它变好用了吗？

Google Gemini Pro 教育优惠白嫖指南

告别复杂字节跳动小云雀 AI 一键生成视频创作从未如此简单

谷歌深夜炸场：Gemini 3 全面碾压 GPT 5.1，大模型“谷歌时代”正式降临

谷歌深夜亮剑 性能参数全线超越GPT 5.1

深度思考模式Deep Think 让AI拥有慢思考能力

Vibe Coding元年 一句话生成可玩游戏

相关推荐

谷歌Gemini 3深度思考版进化 甚至通过了人类最后考试

每日AI资讯0712：新工具赋能创作，大模型驱动行业变革

智谱全面终结大模型价格战 GLM-5海外首发开启价值回归新周期

评论 (0)

2025 AI 技术峰会

AI 实战课程

热门工具

AI 助手

智能图像处理

AI 翻译

热门文章

字节跳动 - Trae 1.4 终结“白嫖”时代，它变好用了吗？

Google Gemini Pro 教育优惠白嫖指南

告别复杂 字节跳动小云雀 AI 一键生成 视频创作从未如此简单

谷歌深夜亮剑性能参数全线超越GPT 5.1

Vibe Coding元年一句话生成可玩游戏

谷歌Gemini 3深度思考版进化甚至通过了人类最后考试

告别复杂字节跳动小云雀 AI 一键生成视频创作从未如此简单