Gemini 3 Flash:兼具前瞻智慧與極致速度的新一代模型
今天,我們正式擴展 Gemini 3 模型家族,推出 Gemini 3 Flash。這款模型不僅具備前瞻性的智慧表現,更擁有極致的處理速度,且成本大幅降低。透過這次發布,我們將 Gemini 3 的新一代智慧體驗,帶給所有 Google 產品的使用者。
上個月,我們以 Gemini 3 Pro 與 Gemini 3 Deep Think 模式開啟了 Gemini 3 的新篇章,市場反應非常熱烈。自發布以來,我們的 API 每日處理量已突破 1 兆個詞元。我們看到使用者運用 Gemini 3 進行「直覺式程式開發(vibe coding)」模擬去學習複雜的課題、設計互動遊戲,並理解各種形式的多模態內容。
隨著 Gemini 3 的問世,我們在複雜的推理、多模態與視覺理解,以及代理式(agentic)與直覺式(vibe)程式開展現了前瞻的效能。Gemini 3 Flash 繼承了這樣的基礎,把 Gemini 3 Pro 等級的推理能力與 Flash 系列的低延遲、高效率與低成本完美結合,不但能提升日常任務的推理品質,更是我們目前處理代理式工作流程最出色的模型。
即日起,Gemini 3 Flash 將陸續推送到全球數百萬名使用者:
- 開發者: 可透過 Google AI Studio 中的 Gemini API、Gemini CLI,以及我們全新的代理式開發平台 Google Antigravity 使用。
- 一般使用者: 可透過 Gemini 應用程式,以及搜尋服務中的「AI 模式」使用。
- 企業客戶: 可透過 Vertex AI 與 Gemini Enterprise 使用。
Gemini 3 Flash:規模化的前瞻智慧
Gemini 3 Flash 證明了模型要達到速度與規模,不需要以犧牲智慧作為代價。它在 GPQA Diamond (90.4%) 和 Humanity’s Last Exam (在不使用工具下為 33.7%) 等博士級推理與知識基準測試中展現了領先效能,足以媲美更大型的前瞻模型,且在多項指標上顯著超越了前代最強的 2.5 模型 Gemini 2.5 Pro。此外,它在 MMMU Pro 測試中獲得了 81.2% 的優異成績,達到業界領先水準,表現與 Gemini 3 Pro 相當。
除了前瞻級的推理與多模態能力,Gemini 3 Flash 的設計核心在於極致效率,挑戰了「品質、成本與速度」三者權衡最佳狀態的帕雷托前沿(Pareto frontier)。在處理最高階的思考任務時,Gemini 3 Flash 能調節其思考量:針對複雜案例進行更長時間的思考,但在處理日常任務時,平均使用的詞元數比 2.5 Pro 減少了 30%,同時維持更高的效能與準確度。
Gemini 3 Flash 突破了效能、成本與速度的帕雷托前沿。
Gemini 3 Flash 的強項在於其原始速度,這延續了開發者與消費者喜愛的 Flash 系列特質。它的表現優於 2.5 Pro,速度提升 3 倍(根據 Artificial Analysis 基準測試),且只需要原來極小比例的成本。Gemini 3 Flash 的定價為每百萬輸入詞元 0.50 美元,每百萬輸出詞元 3 美元(音訊輸入維持在每百萬詞元 1 美元)。
Gemini 3 Flash 在速度與品質上的表現均優於 2.5 Pro。
為開發者而生:跟上節奏的智慧表現
Gemini 3 Flash 專為疊代開發(iterative development)設計,提供 Gemini 3 Pro 級別的程式設計效能與低延遲——它能在高頻率的工作流程中快速推理並解決任務。在評估程式設計代理能力的基準測試 SWE-bench Verified 中,Gemini 3 Flash 獲得 78% 的高分,不僅超越 2.5 系列,也超越了 Gemini 3 Pro。對於代理式程式設計、生產級系統以及高靈敏度的互動式應用程式而言,它達到了理想的平衡。
Gemini 3 Flash 在推理、工具呼叫與多模態能力方面的強大表現,非常適合希望進行複雜影片分析、數據擷取與視覺問答的開發者。這意味著它能實現更智慧的應用——例如遊戲內助手或 A/B 測試實驗——這些場景同時需要快速回應與深層推理。
Gemini 3 Flash 在手部追蹤的「拋球解謎遊戲」中實現了多模態推理,提供近乎即時的 AI 輔助。
Gemini 3 Flash 能幾乎即時地構建並進行新的載入狀態旋轉圖示的 A/B 測試,簡化從設計到程式設計的過程。
Gemini 3 Flash 幾乎同時運用多模態推理分析圖片,並加上具備上下文語境的使用者介面覆蓋層,將靜態圖片轉化為互動體驗。
僅需單一指令,Gemini 3 Flash 即可編寫出三種獨特設計變化版本的程式。
我們收到了來自企業端非常正向的回饋。包括 JetBrains、Bridgewater Associates 與 Figma 在內的企業,已開始運用 Gemini 3 Flash 轉型他們的業務,並表示其推論速度、效率與推理能力足以媲美更大型的模型。
人人共享:Gemini 3 Flash 全球陸續上線
Gemini 3 Flash 現在已成為 Gemini 應用程式中的預設模型,取代了 2.5 Flash。這表示全球所有 Gemini 使用者都能免費體驗 Gemini 3,讓日常任務獲得重大升級。
得益於 Gemini 3 Flash 強大的多模態推理能力,你可以用它更快速地看見、聆聽並理解各種類型的資訊。例如,你可以要求 Gemini 理解你的影片與圖片,並在短短幾秒鐘內將內容轉化為實用的行動計畫。
在 Gemini App 中分析短片並提供建議的計畫,例如如何改進你的門球揮桿動作。
由於針對速度進行了優化,當你還在構思草圖時,Gemini 3 Flash 就能看見並猜出你正在畫什麼。
你可以上傳錄音檔,Gemini 3 Flash 會找出你的知識盲點、建立客製化測驗,並提供詳細的答案解釋。
你甚至可以在完全沒有程式設計知識的情況下,僅憑語音就能從零開始構建有趣且實用的 App。只需隨時隨地對著 Gemini 口述想法,它就能在幾分鐘內將你凌亂的思緒轉化為可以運作的應用程式。
Gemini 3 Flash 也成為支援全球搜尋裡 AI 模式的預設模型。
基於 Gemini 3 Pro 的推理能力,搜尋中的 AI 模式搭配 Gemini 3 Flash 後,在解析問題細微差異方面變得更加強大。它能全面考慮搜尋查詢的各個面向,提供詳盡且易於閱讀的視覺化回覆,並整合來自網路的即時在地資訊與連結。這項成果有效地把「研究」與「立即行動」結合:你能在擁有 Google 搜尋速度的同時,獲得組織上有智慧的分析與特定建議。
當你處理具有多重考慮因素的複雜目標時(例如計畫一場說走就走的旅行,或快速學習複雜的教育概念),這項功能將會大放異彩。
立即體驗 Gemini 3 Flash
Gemini 3 Flash 目前已在 Google AI Studio 與 Google Antigravity 的 Gemini API 中提供預覽。你也可以透過 Gemini CLI 與 Android Studio 等開發者工具使用。同時,它也正陸續推送給 Gemini 應用程式與搜尋服務中 AI 模式的所有使用者,讓大眾能免費獲得新一代的快速智慧體驗。
我們非常期待看到你運用 Gemini 3 模型家族——Gemini 3 Pro、Gemini 3 Deep Think 以及現在的 Gemini 3 Flash——創造出精彩的作品。