Gemini 應用程式代理能力再升級,帶來全天候主動協助
過去這一年來,Gemini 應用程式展現了驚人的成長動能。在去年 I/O 大會,Gemini 每個月為超過 4 億使用者提供服務。現在,Gemini 已經在全球 230 個國家與地區推出、支援 70 多種語言,每個月有超過 9 億使用者透過 Gemini 取得協助。
隨著今年的 I/O 大會正式登場,我們很高興跟大家分享一系列的更新:
- Gemini 3.5 Flash:結合頂尖的前沿智慧與快速運算,是我們全新系列中首個推出的模型。
- Neural Expressive:專為 Gemini 量身打造,充滿活力跟動態的全新設計語言。
- Gemini Omni:我們全新推出的模型,能把文字、圖片甚至影片提示詞,轉化為像是電影般高品質的影片。
- 每日摘要:全新的 AI 代理功能,在每天早上為你量身打造專屬的重點摘要,幫助你掌握當天所需要的資訊。
- Gemini Spark:一個 24 小時運行的個人 AI 代理,能夠在使用者的指令與引導下,主動管理並執行不同任務,協助你輕鬆打理數位生活。
- macOS 應用程式:我們的桌上型電腦應用程式將在今年夏天整合 Gemini Spark,可以在電腦本機端運行,並將加入全新的語音功能。
Neural Expressive:為 AI 時代打造的全新設計語言
我們重新設計了整個 Gemini 的使用體驗,並推出一套我們稱為「Neural Expressive」的全新設計語言。現在,全新的操作介面將融入流暢的動畫、鮮豔的色彩、全新的字體排版跟觸覺回饋,帶來令人驚艷的使用體驗。
我們也將 Gemini Live 的對話體驗直接整合到 Gemini 中,讓你可以在輸入簡短問題與進入自由交談之間流暢切換,不再中斷自己的思緒。另外,我們也重新設計了麥克風的體驗,讓你能按照自己的節奏思考並說出想法,再也不用擔心話說到一半被打斷。未來,我們也將會陸續提供在地化的區域方言選項,讓使用者可以自由選擇能夠引起內心共鳴的親切聲音。
不只如此,我們也運用 Gemini 模型的強大能力,讓 AI 的回應變得更容易理解。Gemini 不再只是提供長篇大論的文字,而是會根據你的提問,即時設計出最適合的視覺呈現方式,將豐富的圖像、互動式時間軸、帶有語音旁白的影片或動態圖表融合在回應裡。
全新的 Neural Expressive 從今天開始在全球的網頁版、Android 和 iOS 平台上全面推出,並開放給所有人體驗。
Gemini Omni:將靈感轉化為高品質影片
為了全面釋放你的創作潛能,我們正式推出 Gemini Omni,這款全新模型可以將使用者的豐富想像力化為現實。Gemini Omni 可以透過組合文字、圖片和影片等多元類型的輸入素材,進一步生成令人驚豔的高畫質影片。
Gemini Omni 可以讓使用者透過流暢且自然的對話方式編輯影片。例如輸入簡單的指令,就能執行電影級的鏡頭縮放或更換背景;或是從你的相簿裡上傳素材,並套用內建範本,不需要額外購置昂貴的器材或使用專業術語,就能創作出質感細緻的影片內容。你甚至可以建立一個看起來、聽起來都像你的專屬虛擬化身,讓自己直接置身於影片場景中。
Gemini Omni 將從今天開始,陸續開放全球的 Google AI Pro 與 Ultra 方案訂閱用戶使用。
每日摘要:開啟美好的一天
我們也推出「每日摘要」,這是一款全新的智慧代理,能在每天早上為你量身打造個人專屬簡報,成為開啟美好一天的第一站。我們汲取 Google Labs 實驗計畫「CC」的成功經驗打造了這項功能,為使用者提供一個無縫、直覺而且可以輕鬆踏入 AI 代理世界的入口。
當你選擇啟用這項功能,Gemini 就會在背景默默為你跨應用程式工作。它會從你的 Gmail 收件匣整理出緊急的更新信件、追蹤日曆中即將到來的會議行程,並把後續的追蹤細節統整成一目了然的摘要。
每日摘要不僅能夠幫你總結資訊,還會主動根據你的具體目標來排定事情的優先順序,甚至能貼心地提出下一步的行動建議。你只需要簡單針對回應按下「答得好」或是「有待加強」就能幫助它隨著時間改進。
從今天開始,每日摘要將率先在美國市場推出,並開放 Google AI Plus、Pro 和 Ultra 訂閱用戶使用。
Gemini Spark:從獲取資訊到採取行動
我們也宣布推出全新 Gemini Spark,這是一款能 24 小時運行的個人 AI 代理,協助使用者輕鬆打理數位生活。Gemini Spark 代表 Gemini 發展歷程中的重大轉變,從一個只能回答問題的助手,進化為一個能在你的引導下,主動為你代勞的行動夥伴。
Gemini Spark 運行我們最新的 Gemini 3.5 模型,並採用 Antigravity 架構。同時,它也深度整合我們日常使用的 Workspace 工具,像是 Gmail、Google 文件、Google 簡報等。更方便的是, Spark 是一款在雲端運行的 AI 代理,即便是闔上筆電或鎖定手機螢幕,它依然會在背景持續運作,為你分擔繁瑣複雜的任務,讓你可以更專注當下跟生活中最重要的事情上。
透過 Gemini Spark,你可以:
- 設定週期性任務或條件:自動分析每月的信用卡帳單,主動幫你抓出全新或隱藏的訂閱服務費用。
- 教導它新技能:請它注意來自孩子學校的電子郵件、記得特定事項的截止日期,並自動彙整成一份每日摘要,同步寄給自己跟另一半。
- 建立完整工作流程:整合電子郵件與訊息中的會議筆記,把會議重點整理成精美的 Google 文件,甚至草擬一份宣布專案啟動的正式信件。
而這僅僅是個開始。我們已經規劃好一系列功能更新,並將於夏天陸續上線。同時,我們也持續擴展 Gemini 連結的應用程式清單,並宣布推出與 Canva、OpenTable 與 Instacart 的 MCP(Model Context Protocol),後續將有更多合作夥伴加入。在接下來的幾週內,Gemini Spark 就能運用這些 MCP 為你打理大小事。我們也將加入全新能力,像是讓你可以直接透過簡訊或電子郵件與 Spark 溝通、建立自訂的子代理(sub-agents),以及操作你的瀏覽器。
Spark 會在使用者的指引下運作。你可以自行選擇是否開啟此功能,以及要連結哪些應用程式。它在執行高風險或涉及關鍵決策的操作時,像是消費購物或正式寄出信件之前,會先詢問使用者。
Gemini Spark 將在本週先開放給受信任的測試人員,預計在下週向美國的 Google AI Ultra 訂閱用戶開放 Beta 測試版。
macOS 版 Gemini 應用程式:掌控你的桌面體驗
我們也持續進行 macOS 版 Gemini 應用程式的開發工作。今年夏天, Gemini Spark 將導入 Gemini 桌面版應用程式,協助使用者處理涉及電腦本機上檔案的相關任務,並自動執行桌面上的跨軟體工作流程。
我們同時也在 macOS 應用程式中思考如何帶來全新的語音體驗,概念類似於我們在 The Android Show 中分享的體驗。當你一邊對著電腦思考、一邊說出想法整理思緒時,不必擔心那些不自覺說出口的「呃」、「那個」等贅詞。透過你目前螢幕畫面所提供的脈絡,Gemini 能夠將你隨性流暢的口頭敘述,精準轉化為符合意圖的精簡文字草稿,並在你游標所在的位置即時重新調整文字格式,精準捕捉你的意圖。
macOS 版本的 Gemini 應用程式即日起開放所有使用者下載,而 Gemini Spark 以及全新的語音功能將在今年夏天稍晚正式推出。
今天所發表的所有更新,讓我們往「打造個人化、主動且強大的全方位助理」的願景更邁進了一步。不論你是課業繁忙的學生、辛苦打拚的家長,還是小型企業主,我們都非常期待看到 Gemini 成為你的得力助手,與你一起創造無限可能。