移至主要內容

台灣官方部落格

Gemini 3 開啟智慧新紀元

[]

Gemini 3 開啟智慧新紀元

2025/十一月/18

Gemini 3 是我們最聰明的模型，能協助你實現任何創意。

Sundar Pichai

Google 暨 Alphabet 執行長

Demis_headshot

Demis Hassabis

Google DeepMind 執行長

koray

Koray Kavukcuoglu

Google DeepMind 技術長暨首席 AI 架構師

將近兩年前，我們開啟了 Gemini 時代，這是我們公司有史以來規模最大的科學與產品計畫之一。從那時起，看到大家這麼的喜愛它，實在令人振奮。「AI 總覽」現在每月有 20 億的活躍使用者。Gemini 應用程式的每月活躍使用者超過 6.5 億，超過 70% 的雲端客戶正在使用我們的 AI，更有 1,300 萬名開發者利用我們的生成式模型進行開發——而這僅僅是我們所見影響力的一小部分。

歸功於我們在 AI 創新上獨特的完整技術堆疊 (full stack) 策略——從領先的基礎設施、世界級的研究、模型與工具，到觸及全球數十億人的產品——我們能比以往更快地把先進的功能帶給全世界。

每一代 Gemini 都建立在前一代的基礎之上，讓你能完成更多任務。Gemini 1 在原生多模態和長脈絡視窗上的突破，擴展了資訊處理的種類與數量。Gemini 2 為代理能力奠定了基礎，推展了推理與思考的疆界，協助處理更複雜的任務與想法，讓 Gemini 2.5 Pro 在 LMArena 榜首蟬聯超過六個月。

現在，我們隆重介紹 Gemini 3——我們最聰明的模型，它整合了 Gemini 的所有能力，讓你能實現任何創意。

它具備最頂尖的推理能力，專為掌握深度與細微差異而生——無論是察覺創意構想中的微妙線索，還是抽絲剝繭地解析難題的層層結構。Gemini 3 也更擅長釐清你請求背後的脈絡與意圖，讓你無須費力提示，就能獲得所需結果。令人驚嘆的是，短短兩年內，AI 已從單純地閱讀文字和圖像，進化到能「讀懂空氣」。

即日起，我們將以 Google 的規模全面推出 Gemini。這包括在搜尋的「AI 模式」中導入具備更複雜推理能力與全新動態體驗的 Gemini 3，這也是我們首次在模型發布首日就將 Gemini 同步導入搜尋功能。Gemini 3 今天也將登陸 Gemini 應用程式、提供給 AI Studio 和 Vertex AI 的開發者，以及我們全新的代理開發平台 Google Antigravity（詳情請見下方）。另外，台灣的大學生請注意！從今天開始起到 12 月 9 日，申請 Google AI Pro 學生方案即可享有整整一年的免費試用，讓你在學習與創作上能搶先運用 Gemini 3 等最先進的 AI 工具，希望在台灣的同學能夠把握機會。

如同過往的每一代，Gemini 3 再度推進了技術的最前沿。在這個新篇章中，我們將持續拓展智慧、代理人與個人化的疆界，讓 AI 對每個人都真正有所助益。

希望你會喜歡 Gemini 3，我們會持續改進，也期待看到你用它打造出什麼樣的作品。精彩可期，敬請拭目以待！

隆重介紹 Gemini 3：我們最聰明的模型，助你實現任何創意

Google DeepMind 執行長 Demis Hassabis 與 Google DeepMind 技術長暨 Google 首席 AI 架構師 Koray Kavukcuoglu 代表 Gemini 團隊

今天，我們在邁向通用人工智慧 (AGI) 的道路上邁出了另一大步，正式發布 Gemini 3。

它是全球最強大的多模態理解模型，也是我們迄今最強大的代理與 Vibe coding 模型，能提供更豐富的視覺化效果與更深度的互動性——這一切都建立在最先進的推理基礎之上。

我們將透過發布 Gemini 3 Pro 預覽版來開啟 Gemini 3 時代，並於今日起在一系列 Google 產品中開放使用，讓你能在日常生活中利用它來學習、建構和規劃任何事物。我們也推出了 Gemini 3 Deep Think——我們強化的推理模式，將 Gemini 3 的效能推向極致——目前先開放給安全測試人員使用，之後將提供給 Google AI Ultra 訂閱用戶。

前所未有的深度與細緻度：最先進的推理能力

Gemini 3 Pro 憑著最先進的推理與多模態能力，能讓任何創意成真。它在每一項主要的 AI 基準測試中，表現都顯著超越 2.5 Pro。

它以突破性的 1501 Elo 分數榮登 LMArena 排行榜榜首。在 Humanity’s Last Exam（未使用任何工具的情況下得分 37.5%）和 GPQA Diamond（91.9%）中取得高分，展現了博士級的推理能力。它也為前沿模型的數學能力樹立了新標準，在 MathArena Apex 上達到了 23.4% 的新高。

除了文字，Gemini 3 Pro 也重新定義了多模態推理，在 MMMU-Pro 獲得 81%，在 Video-MMMU 獲得 87.6% 。它還在 SimpleQA Verified 中取得了領先業界的 72.1%，展現了在事實準確性上的巨大進步。這意味著 Gemini 3 Pro 具備高度可靠性，能解決科學和數學等廣泛主題中的複雜問題。

Gemini 3 在多項關鍵 AI 基準測試中表現領先。請參閱我們的評估方法了解詳情。

Gemini 3 在不同排行榜上的得分

Gemini 3 Pro 也為每一次互動帶來了全新的深度與細緻度。它的回應聰明、簡潔且直接，摒棄了陳腔濫調與阿諛奉承，轉而提供真知灼見——告訴你需要聽到的，而不僅僅是你想聽到的。它是真正的思考夥伴，從透過生成高清晰度的視覺化程式碼來轉譯艱澀的科學概念，到創意的腦力激盪，它都能提供你理解資訊與表達自我的新方式。

Gemini 3 可以編寫托卡馬克 (Tokamak) 中電漿流動的視覺化程式碼，並創作一首捕捉核融合物理學的詩。

Gemini 3 Deep Think

Gemini 3 Deep Think 模式進一步突破了智慧的界限，在 Gemini 3 的推理和多模態理解能力上實現了階躍式的提升，協助你解決更複雜的問題。

在測試中，Gemini 3 Deep Think 在 Humanity’s Last Exam（未使用工具的情況下得分 41.0%）和 GPQA Diamond（93.8%）的表現，甚至超越了 Gemini 3 Pro 原本就令人印象深刻的成績。它還在 ARC-AGI（包含程式碼執行，ARC Prize Verified）上取得了前所未有的 45.1%，展現了解決新穎挑戰的能力。

Gemini 3 Deep Think 模式在最具有挑戰性的 AI 測試中都有優異的表現。參考我們的評估方法。

Evaluation chart for Gemini 3 Deep Think

Gemini 3 幫助你學習、建構並且規劃任何事物

學習任何事物

Gemini 從一開始就致力於無縫整合跨文字、圖像、影片、音訊和程式碼等多種模態的資訊。Gemini 3 推展了多模態推理的疆界，結合其最先進的推理、視覺與空間理解能力、領先的多語言效能以及 100 萬 Token 的脈絡長度，協助你以最適合自己的方式學習。

例如，如果你想學習家族傳承的烹飪方式，Gemini 3 可以解讀並翻譯不同語言的手寫食譜，將其轉化為可分享的家庭食譜書。或者，如果你想了解一個新主題，你可以提供學術論文、長篇講座影片或教學，它能生成互動式單字卡、視覺化圖表或其他格式的程式碼，幫助你掌握教材。它甚至可以分析你的匹克球 (Pickleball) 比賽影片，找出可改進之處，並生成改善整體姿勢的訓練計畫。

Gemini 3 可幫助你學習並保存家族烹飪傳統。立即在 Gemini Canvas 中試用。

Gemini 3 可以幫助你分析學術論文等複雜資訊，並生成互動式指南的程式碼。

針對您的匹克球比賽獲得專家級的運動分析，協助提升你的球技。

為了協助你更理解網路上的資訊，搜尋中的「AI 模式」現在使用 Gemini 3 來啟用全新的生成式介面的體驗，例如沉浸式的視覺化版面以及互動式工具和模擬情境，這一切都是根據你的查詢即時生成的。

在搜尋的 AI 模式中利用生成式使用者介面，學習像 RNA 聚合酶運作原理等複雜主題。

建構任何事物

延續 2.5 Pro 的成功，Gemini 3 達到了協助開發者實現任何創意的承諾。它在零樣本生成 (zero-shot generation) 方面表現卓越，並能處理複雜的提示詞與指令，渲染出更豐富、更具互動性的網頁使用者介面。

Gemini 3 是我們有史以來最強大的 Vibe coding 和代理編碼模型——讓我們的產品更具自主性，並提升開發者的生產力。它在 WebDev Arena 排行榜上以 1487 ELO 的驚人高分奪冠。在測試模型透過終端機操作電腦能力的 Terminal-Bench 2.0 中，它獲得了 54.2% 的分數；在衡量編碼代理能力的 SWE-bench Verified 中，它更以 76.2% 大幅超越 2.5 Pro。

現在，你可以在 Google AI Studio、Vertex AI、Gemini CLI 以及我們全新的代理開發平台 Google Antigravity 中使用 Gemini 3 進行建構。它也已經在 Cursor、GitHub、JetBrains、Manus、Replit 等第三方平台中上線。

編寫一款具備更豐富視覺效果和改進互動性的復古 3D 太空船遊戲。立即在 AI Studio 裡試用。

透過程式碼建構、解構和重組精細的 3D 體素 (Voxel) 藝術，讓你的想像力成真。在 AI Studio 裡試用。

使用 Gemini 3 建構一個具備著色器、可以玩的科幻世界。立即在 AI Studio 裡試用。

你可以使用 Gemini 3 透過 Vibe coding 打造更豐富、更具互動性的網頁 UI 和應用程式。

推出全新「代理優先」(agent-first) 的開發體驗

隨著 Gemini 3 帶來的模型智慧加速發展，我們有機會重新構想整體的開發者體驗。今天，我們發布了 Google Antigravity，這是我們全新的代理開發平台，讓開發者能在更高的「任務導向」層級上進行操作。

運用 Gemini 3 先進的推理、工具使用和代理編碼能力，Google Antigravity 將 AI 輔助從開發者工具箱中的一項工具，轉變為積極的合作夥伴。雖然 Google Antigravity 的核心是熟悉的 AI IDE 體驗，但其代理人已被提升至專屬介面，並能直接存取編輯器、終端機和瀏覽器。現在，代理人可以代表你自主規劃並同時執行複雜的端對端軟體任務，同時驗證自己的程式碼。

除了 Gemini 3 Pro，Google Antigravity 還緊密整合了我們最新的 Gemini 2.5 Computer Use 模型（用於瀏覽器控制）以及我們評價最高的圖像編輯模型 Nano Banana (Gemini 2.5 Image)。

Google Antigravity 運用 Gemini 3 驅動了一套端對端的代理工作流程，用來開發航班追蹤的應用程式。這個 AI 代理能自主完成規劃、撰寫程式碼，並透過實際操作瀏覽器來驗證執行結果。

規劃任何事物

自從 Gemini 2 開啟代理時代以來，我們取得了許多進展，不僅提升了 Gemini 的編碼代理能力，還改進了其在更長的時間跨度內可靠規劃的能力。Gemini 3 在 Vending-Bench 2 上的榜首表現證明了這一點，該測試透過管理模擬的自動販賣機業務來測試長期規劃能力。Gemini 3 Pro 在整整一年的模擬營運中，保持了一致的工具使用和決策能力，在不偏離任務的情況下帶來了更高的回報。

Gemini 3 Pro 展現了更好的長期規劃能力，與其他前沿模型相比產生了顯著更高的回報。

圖表顯示 Gemini 3 Pro 在長程規劃 (Long-horizon Planning) 的表現優於其他 AI 模型

這表示 Gemini 3 能更有效地協助你處理日常生活中的事務。透過結合更深度的推理與改進後更一致的工具使用，Gemini 3 可以代表你執行更複雜、多步驟的工作流程——例如規劃旅遊行程或是整理收件匣——且全程都在你的掌控與引導之下。

Google AI Ultra 訂閱用戶即日起可在 Gemini 應用程式中透過 Gemini Agent 試用這些代理功能。我們在改進 Gemini 的代理能力過程中學到了很多，隨著我們將其擴展到更多 Google 產品，我們很期待看到你如何使用它。

Gemini Agent 可以協助你整理 Gmail 收件匣。Google AI Ultra 訂閱用戶現在即可在 Gemini 應用程式中試用。

負責任地建構 Gemini 3

Gemini 3 是我們目前最安全的模型，並經歷了 Google AI 模型迄今為止最全面的安全評估。該模型顯示出減少了阿諛奉承的傾向，增強了對提示注入 (prompt injections) 的抵抗力，並改善了針對網路攻擊濫用的防護。

除了針對前沿安全框架 (Frontier Safety Framework) 中關鍵領域的內部測試外，我們還與世界領先的主題專家合作進行評估，提供英國人工智慧安全研究所 (UK AISI) 等機構早期存取權限，並獲得 Apollo、Vaultis、Dreadnode 等業界專家的獨立評估。如果需更多資訊，請參閱 Gemini 3 Model Card。

Gemini 的下一個時代

這只是 Gemini 3 時代的開始。即日起，你可以在以下管道體驗 Gemini 3：

一般大眾： Gemini 應用程式。
Google AI Pro 和 Ultra 訂閱用戶： 搜尋中的 AI 模式。
開發者： AI Studio 中的 Gemini API、我們全新的代理開發平台 Google Antigravity，以及 Gemini CLI。
企業用戶： Vertex AI 和 Gemini Enterprise。

針對 Gemini 3 Deep Think 模式，我們將花額外時間進行安全評估並聽取安全測試人員的意見，預計在接下來幾週內向 Google AI Ultra 訂閱用戶開放。

我們計畫很快發布 Gemini 3 系列的更多模型，讓你能利用 AI 完成更多任務。期待收到你的回饋，並看到你利用 Gemini 學習、建構和規劃的一切。

報導類別：