移至主要內容
台灣官方部落格

Android 給你更多元精采的 Google AI 體驗



我們正處於一個千載難逢的時刻,AI 的最新發展正在重新定義手機功能。Google AI 作為 Android 作業系統的核心,數十億的 Android 系統使用者,現在能用全新的方式跟自己的手機互動。

在今天的2024 I/O 開發者大會上,我們展示了能讓你在 Android 上體驗 Google AI 的各項功能更新。

畫圈搜尋現在可以幫助學生完成回家功課

「畫圈搜尋」直接內建在使用者體驗裡,讓你只要用簡單的手勢,就以搜尋在手機上看到的任何內容,而且不需要停止正在進行的操作,或切換到其他應用程式。自從在三星 Unpacked 發布以來,我們為畫圈搜尋新增了全螢幕翻譯等新功能,並且把這項功能擴大,支援更多 Pixel 和三星裝置。

從今天開始,學生可以直接用手機和平板電腦畫圈搜尋,輕鬆完成回家功課。當學生圈出他們遇到困難的部分時,不用離開數位資訊表或課程大綱,就可以獲得逐步的指引,解決許多物理和數學應用題。今年稍晚,畫圈搜尋還能更進一步解決與符號公式、圖表和圖形等相關更複雜的問題。這些都可以透過應用我們專門針對學習進行微調的新模型系列 LearnLM 來實現。

目前畫圈搜尋已經在超過1 億台裝置上使用,我們計劃為更多裝置提供這種便利的體驗,希望今年年底讓使用者人數翻倍。

Gemini 更能理解情境脈絡,協助你完成工作

Android 系統上的 Gemini 是一種新型助理,可以透過生成式 AI 來提高創造力和工作效率。這種整合到 Android 系統裡的體驗,能更準確地瞭解你螢幕畫面上內容的上下文,還有正在使用的應用程式。 

不久之後,你就可以在使用的應用程式上叫出 Gemini 的附加功能,用更輕鬆、更多元的方式來使用 Gemini。例如,把生成的圖片拖放到 Gmail、Google 訊息和其他地方,或在 YouTube 影片中點擊「詢問有關這部影片的問題」,獲取特定資訊。如果你擁有 Gemini Advanced,也可以透過「詢問有關這個 PDF 的問題」選項,不需要翻閱很多頁,就可以快速獲得答案。我們將在未來幾個月之內,向數億台裝置推出這項更新。

我們也將持續改進 Gemini,為你提供更多與螢幕畫面上內容相關的動態建議。 

Gemini Nano 將具備完整的多模態功能

Android 是首創裝置內建有基礎模型的行動作業系統。有了Gemini Nano,我們可以快速為你提供服務,並且完全保密你的資訊。今年稍晚,從 Pixel 開始,Gemini Nano 將具備全面的多模態功能,除了處理文字輸入外,手機還能理解更多與上下文相關的資訊,像是影像、聲音和口說對話等。

透過 TalkBack 獲得更清晰的描述內容

今年稍晚,Gemini Nano 的多模態功能將整合到 TalkBack 功能裡,幫助視障使用者獲得更豐富、更清晰的影像描述。TalkBack 使用者平均每天會遇到 90 張未標記的圖片。這項更新,將會幫助彌補影像資訊不全的問題,未來無論是家人朋友傳來照片中的更多細節,或是網路購物時要選擇的衣服款式和剪裁,都能輕鬆掌握資訊。由於 Gemini Nano 是直接在裝置上運作,因此能快速取得這些描述,而且即使沒有網路時也能正常運作。

在電話中接收可疑詐騙警報

根據 2023 年 10 月的一份報告,在報告發表當下的過去 12 個月中,人們因為詐騙造成的損失超過 1 兆美元。我們正在測試一項 Gemini Nano 的新功能,在通話過程中如果偵測到與詐騙有關的對話模式,就會立即發出警報。例如,如果有一個「銀行代表」提出不常見的銀行要求,要求你緊急轉帳、使用禮品卡付款,或是提供 PIN 碼或密碼這種個人資訊,你就會收到警報。這項保護可以直接在裝置上進行,因此對話能夠完全保密。我們將在今年稍晚與大家分享更多關於這項選用功能的資訊。 

更多精彩,盡在 Android

我們才剛開始瞭解裝置上的 AI 是如何改變手機功能,我們將繼續透過 Pixel、三星和更多產品,將 Google AI 融入智慧型手機體驗的各個層面。如果你是開發者,請查看Android 開發者部落格,瞭解如何使用我們最新的 AI 模型和工具,例如:Gemini Nano 和 Gemini 版 Android Studio 等,來打造創新的服務與應用程式。

明天請持續關注我們最新的 Android 15 和 Android 生態系最的新動態。