Gemini 3 開啟智慧新紀元
將近兩年前,我們開啟了 Gemini 時代,這是我們公司有史以來規模最大的科學與產品計畫之一。從那時起,看到大家這麼的喜愛它,實在令人振奮。「AI 總覽」現在每月有 20 億的活躍使用者。Gemini 應用程式的每月活躍使用者超過 6.5 億,超過 70% 的雲端客戶正在使用我們的 AI,更有 1,300 萬名開發者利用我們的生成式模型進行開發——而這僅僅是我們所見影響力的一小部分。
歸功於我們在 AI 創新上獨特的完整技術堆疊 (full stack) 策略——從領先的基礎設施、世界級的研究、模型與工具,到觸及全球數十億人的產品——我們能比以往更快地把先進的功能帶給全世界。
每一代 Gemini 都建立在前一代的基礎之上,讓你能完成更多任務。Gemini 1 在原生多模態和長脈絡視窗上的突破,擴展了資訊處理的種類與數量。Gemini 2 為代理能力奠定了基礎,推展了推理與思考的疆界,協助處理更複雜的任務與想法,讓 Gemini 2.5 Pro 在 LMArena 榜首蟬聯超過六個月。
現在,我們隆重介紹 Gemini 3——我們最聰明的模型,它整合了 Gemini 的所有能力,讓你能實現任何創意。
它具備最頂尖的推理能力,專為掌握深度與細微差異而生——無論是察覺創意構想中的微妙線索,還是抽絲剝繭地解析難題的層層結構。Gemini 3 也更擅長釐清你請求背後的脈絡與意圖,讓你無須費力提示,就能獲得所需結果。令人驚嘆的是,短短兩年內,AI 已從單純地閱讀文字和圖像,進化到能「讀懂空氣」。
即日起,我們將以 Google 的規模全面推出 Gemini。這包括在搜尋的「AI 模式」中導入具備更複雜推理能力與全新動態體驗的 Gemini 3,這也是我們首次在模型發布首日就將 Gemini 同步導入搜尋功能。Gemini 3 今天也將登陸 Gemini 應用程式、提供給 AI Studio 和 Vertex AI 的開發者,以及我們全新的代理開發平台 Google Antigravity(詳情請見下方)。
如同過往的每一代,Gemini 3 再度推進了技術的最前沿。在這個新篇章中,我們將持續拓展智慧、代理人與個人化的疆界,讓 AI 對每個人都真正有所助益。
希望你會喜歡 Gemini 3,我們會持續改進,也期待看到你用它打造出什麼樣的作品。精彩可期,敬請拭目以待!
隆重介紹 Gemini 3:我們最聰明的模型,助你實現任何創意
Google DeepMind 執行長 Demis Hassabis 與 Google DeepMind 技術長暨 Google 首席 AI 架構師 Koray Kavukcuoglu 代表 Gemini 團隊
今天,我們在邁向通用人工智慧 (AGI) 的道路上邁出了另一大步,正式發布 Gemini 3。
它是全球最強大的多模態理解模型,也是我們迄今最強大的代理與 Vibe coding 模型,能提供更豐富的視覺化效果與更深度的互動性——這一切都建立在最先進的推理基礎之上。
我們將透過發布 Gemini 3 Pro 預覽版來開啟 Gemini 3 時代,並於今日起在一系列 Google 產品中開放使用,讓你能在日常生活中利用它來學習、建構和規劃任何事物。我們也推出了 Gemini 3 Deep Think——我們強化的推理模式,將 Gemini 3 的效能推向極致——目前先開放給安全測試人員使用,之後將提供給 Google AI Ultra 訂閱用戶。
前所未有的深度與細緻度:最先進的推理能力
Gemini 3 Pro 憑著最先進的推理與多模態能力,能讓任何創意成真。它在每一項主要的 AI 基準測試中,表現都顯著超越 2.5 Pro。
它以突破性的 1501 Elo 分數榮登 LMArena 排行榜榜首。在 Humanity’s Last Exam(未使用任何工具的情況下得分 37.5%)和 GPQA Diamond(91.9%)中取得高分,展現了博士級的推理能力。它也為前沿模型的數學能力樹立了新標準,在 MathArena Apex 上達到了 23.4% 的新高。
除了文字,Gemini 3 Pro 也重新定義了多模態推理,在 MMMU-Pro 獲得 81%,在 Video-MMMU 獲得 87.6% 。它還在 SimpleQA Verified 中取得了領先業界的 72.1%,展現了在事實準確性上的巨大進步。這意味著 Gemini 3 Pro 具備高度可靠性,能解決科學和數學等廣泛主題中的複雜問題。
Gemini 3 在多項關鍵 AI 基準測試中表現領先。請參閱我們的評估方法了解詳情。
Gemini 3 Pro 也為每一次互動帶來了全新的深度與細緻度。它的回應聰明、簡潔且直接,摒棄了陳腔濫調與阿諛奉承,轉而提供真知灼見——告訴你需要聽到的,而不僅僅是你想聽到的。它是真正的思考夥伴,從透過生成高清晰度的視覺化程式碼來轉譯艱澀的科學概念,到創意的腦力激盪,它都能提供你理解資訊與表達自我的新方式。
Gemini 3 可以編寫托卡馬克 (Tokamak) 中電漿流動的視覺化程式碼,並創作一首捕捉核融合物理學的詩。
Gemini 3 Deep Think
Gemini 3 Deep Think 模式進一步突破了智慧的界限,在 Gemini 3 的推理和多模態理解能力上實現了階躍式的提升,協助你解決更複雜的問題。
在測試中,Gemini 3 Deep Think 在 Humanity’s Last Exam(未使用工具的情況下得分 41.0%)和 GPQA Diamond(93.8%)的表現,甚至超越了 Gemini 3 Pro 原本就令人印象深刻的成績。它還在 ARC-AGI(包含程式碼執行,ARC Prize Verified)上取得了前所未有的 45.1%,展現了解決新穎挑戰的能力。
Gemini 3 Deep Think 模式在最具有挑戰性的 AI 測試中都有優異的表現。參考我們的評估方法。
Gemini 3 幫助你學習、建構並且規劃任何事物
學習任何事物
Gemini 從一開始就致力於無縫整合跨文字、圖像、影片、音訊和程式碼等多種模態的資訊。Gemini 3 推展了多模態推理的疆界,結合其最先進的推理、視覺與空間理解能力、領先的多語言效能以及 100 萬 Token 的脈絡長度,協助你以最適合自己的方式學習。
例如,如果你想學習家族傳承的烹飪方式,Gemini 3 可以解讀並翻譯不同語言的手寫食譜,將其轉化為可分享的家庭食譜書。或者,如果你想了解一個新主題,你可以提供學術論文、長篇講座影片或教學,它能生成互動式單字卡、視覺化圖表或其他格式的程式碼,幫助你掌握教材。它甚至可以分析你的匹克球 (Pickleball) 比賽影片,找出可改進之處,並生成改善整體姿勢的訓練計畫。
Gemini 3 可幫助你學習並保存家族烹飪傳統。立即在 Gemini Canvas 中試用。
Gemini 3 可以幫助你分析學術論文等複雜資訊,並生成互動式指南的程式碼。
針對您的匹克球比賽獲得專家級的運動分析,協助提升你的球技。
為了協助你更理解網路上的資訊,搜尋中的「AI 模式」現在使用 Gemini 3 來啟用全新的生成式介面的體驗,例如沉浸式的視覺化版面以及互動式工具和模擬情境,這一切都是根據你的查詢即時生成的。
在搜尋的 AI 模式中利用生成式使用者介面,學習像 RNA 聚合酶運作原理等複雜主題。
建構任何事物
延續 2.5 Pro 的成功,Gemini 3 達到了協助開發者實現任何創意的承諾。它在零樣本生成 (zero-shot generation) 方面表現卓越,並能處理複雜的提示詞與指令,渲染出更豐富、更具互動性的網頁使用者介面。
Gemini 3 是我們有史以來最強大的 Vibe coding 和代理編碼模型——讓我們的產品更具自主性,並提升開發者的生產力。它在 WebDev Arena 排行榜上以 1487 ELO 的驚人高分奪冠。在測試模型透過終端機操作電腦能力的 Terminal-Bench 2.0 中,它獲得了 54.2% 的分數;在衡量編碼代理能力的 SWE-bench Verified 中,它更以 76.2% 大幅超越 2.5 Pro。
現在,你可以在 Google AI Studio、Vertex AI、Gemini CLI 以及我們全新的代理開發平台 Google Antigravity 中使用 Gemini 3 進行建構。它也已經在 Cursor、GitHub、JetBrains、Manus、Replit 等第三方平台中上線。
編寫一款具備更豐富視覺效果和改進互動性的復古 3D 太空船遊戲。立即在 AI Studio 裡試用。
透過程式碼建構、解構和重組精細的 3D 體素 (Voxel) 藝術,讓你的想像力成真。在 AI Studio 裡試用。
你可以使用 Gemini 3 透過 Vibe coding 打造更豐富、更具互動性的網頁 UI 和應用程式。
推出全新「代理優先」(agent-first) 的開發體驗
隨著 Gemini 3 帶來的模型智慧加速發展,我們有機會重新構想整體的開發者體驗。今天,我們發布了 Google Antigravity,這是我們全新的代理開發平台,讓開發者能在更高的「任務導向」層級上進行操作。
運用 Gemini 3 先進的推理、工具使用和代理編碼能力,Google Antigravity 將 AI 輔助從開發者工具箱中的一項工具,轉變為積極的合作夥伴。雖然 Google Antigravity 的核心是熟悉的 AI IDE 體驗,但其代理人已被提升至專屬介面,並能直接存取編輯器、終端機和瀏覽器。現在,代理人可以代表你自主規劃並同時執行複雜的端對端軟體任務,同時驗證自己的程式碼。
除了 Gemini 3 Pro,Google Antigravity 還緊密整合了我們最新的 Gemini 2.5 Computer Use 模型(用於瀏覽器控制)以及我們評價最高的圖像編輯模型 Nano Banana (Gemini 2.5 Image)。
Google Antigravity 運用 Gemini 3 驅動了一套端對端的代理工作流程,用來開發航班追蹤的應用程式。這個 AI 代理能自主完成規劃、撰寫程式碼,並透過實際操作瀏覽器來驗證執行結果。
規劃任何事物
自從 Gemini 2 開啟代理時代以來,我們取得了許多進展,不僅提升了 Gemini 的編碼代理能力,還改進了其在更長的時間跨度內可靠規劃的能力。Gemini 3 在 Vending-Bench 2 上的榜首表現證明了這一點,該測試透過管理模擬的自動販賣機業務來測試長期規劃能力。Gemini 3 Pro 在整整一年的模擬營運中,保持了一致的工具使用和決策能力,在不偏離任務的情況下帶來了更高的回報。
Gemini 3 Pro 展現了更好的長期規劃能力,與其他前沿模型相比產生了顯著更高的回報。
這表示 Gemini 3 能更有效地協助你處理日常生活中的事務。透過結合更深度的推理與改進後更一致的工具使用,Gemini 3 可以代表你執行更複雜、多步驟的工作流程——例如規劃旅遊行程或是整理收件匣——且全程都在你的掌控與引導之下。
Google AI Ultra 訂閱用戶即日起可在 Gemini 應用程式中透過 Gemini Agent 試用這些代理功能。我們在改進 Gemini 的代理能力過程中學到了很多,隨著我們將其擴展到更多 Google 產品,我們很期待看到你如何使用它。
Gemini Agent 可以協助你整理 Gmail 收件匣。Google AI Ultra 訂閱用戶現在即可在 Gemini 應用程式中試用。
負責任地建構 Gemini 3
Gemini 3 是我們目前最安全的模型,並經歷了 Google AI 模型迄今為止最全面的安全評估。該模型顯示出減少了阿諛奉承的傾向,增強了對提示注入 (prompt injections) 的抵抗力,並改善了針對網路攻擊濫用的防護。
除了針對前沿安全框架 (Frontier Safety Framework) 中關鍵領域的內部測試外,我們還與世界領先的主題專家合作進行評估,提供英國人工智慧安全研究所 (UK AISI) 等機構早期存取權限,並獲得 Apollo、Vaultis、Dreadnode 等業界專家的獨立評估。如果需更多資訊,請參閱 Gemini 3 Model Card。
Gemini 的下一個時代
這只是 Gemini 3 時代的開始。即日起,你可以在以下管道體驗 Gemini 3:
- 一般大眾: Gemini 應用程式。
- Google AI Pro 和 Ultra 訂閱用戶: 搜尋中的 AI 模式。
- 開發者: AI Studio 中的 Gemini API、我們全新的代理開發平台 Google Antigravity,以及 Gemini CLI。
- 企業用戶: Vertex AI 和 Gemini Enterprise。
針對 Gemini 3 Deep Think 模式,我們將花額外時間進行安全評估並聽取安全測試人員的意見,預計在接下來幾週內向 Google AI Ultra 訂閱用戶開放。
我們計畫很快發布 Gemini 3 系列的更多模型,讓你能利用 AI 完成更多任務。期待收到你的回饋,並看到你利用 Gemini 學習、建構和規劃的一切。