懶人包重點:
・Android 不再是主角的 Google I/O 主場,帶來各種強化 Gemini 主被動功能的進化與服務升級。
・AI 世代的「電影級」生成功能 Flow 來了
・Android XR 從 VR 邁向 AR,將與 Gentle Monster 與 Warby Parker 合力將帶有透視螢幕與相機的 Google Glass 的體驗全面升級。
・(嗯?我該提 Google Ai Ultra 嗎?)
本屆 Google I/O 可以說是相當特別。畢竟 Android 16 以及其他的宣布 都被排在了之前。
有意思的是,即便我們可以預期舞台的中心點絕對是 AI AI 與 AI - 雖然最後 Google 暨 Alphabet 執行長 Sundar Pichai 幽默的「關鍵字」統計,是由 Gemini 奪冠啦(XD)。
所以原本還預期大概就是各種「模型效能」的刷榜(眼神死)。想不到的是,Google 在模型之上,還帶來了讓人滿心期待的 AR 眼鏡原型機的驚喜。
從 VR「回到」AR,Android XR 智慧眼鏡
除了平行發展的 Samsung Project Moohan。Google 這次端出的震撼彈,是搭載相機、麥克風與喇叭,並且能與手機以及 AI 協作的智慧眼鏡。
有別於 Google Glass,「這次」Google 與 Gentle Monster 與 Warby Parker合作的版本,看起來就像是 Meta Ray-Ban 那樣相當自然(至少目前看起來是)。
再加上 AI 功能(即時字幕!)與身歷其境解放雙手的拍攝功能等。相信屆時如果 Android XR 智慧眼鏡推出的話,應該將會引發一陣購買的風潮吧?
Google Meet 消弭語言隔閡讓 Meet 更簡單
Google I/O 的一開始,他們先是宣布了幾個服務的進化升級。
像是 Google Meet 新增即時翻譯功能,可以接近即時並且模仿說話者語氣進行跨語言的對話。現階段此功能僅支援英語與西班牙語的交互溝通,並將在未來幾週支援其他語言。
Project Starline 3D 視訊技術化身為 Google Beam,精準度可達毫米等級,並且能以每秒 60 幀的速度進行即時運算。
VIDEO
Gemini Live 影像搜尋功能今天起陸續開放 iOS 使用者與所有 Android 使用者。
更讚的是,可能是許多人第一次切身體驗到 AI 震撼的影像生成部分。Google 也宣告圖像生成模型 Imagen 4 與影片模型 Veo 3 都已經整合至 Gemini 服務。
甚至還預告將進一步整合可以隨時喊停就停,將剪輯概念直接放進影片生成服務之中的「Flow」- 其實這個真的很猛,至少就底下影片的示範看來,很多片段都充滿創意甚至是彷彿電影一般的質感,超猛。
VIDEO
Gemini 在手機與電腦開始有「主控權」
Google 開始將 AI 代理的進程。簡單地講,就是在手機甚至是電腦上(目前確認將導入 Chrome、Google 搜尋以及 Gemini 應用程式中),都能依據個人的資訊脈絡來處理操作,甚至是藉由 「個人化情境」(personal context)所取得的各種資訊來貫通服務。
像是可以主動協助你尋找房產的來源,甚至透過 MCP(Model Context Protocol 模型脈絡協定)的方式,直接協助預約看房時間。
是說,所謂的 AI 代理控制功能在這次的 I/O 大會還進一步運用了過往 Google AI 的通話功能。在示範影片中,可以直接透過 Gemini Live 請 AI 詢問需要工具零件的庫存。
這顯示了,Gemini 未來不僅能透過「代理模式(Agent Mode)」貫通數位化的協定服務,更能透過傳統的途徑(如電話)來協助使用者的生活。可以觸及的層面可能超乎許多人的想像,也顯示了 Google 這些年來在行動與桌面等各方面的努力都對於生成式 AI 世代的體驗十分有助益。
Google 搜尋也將進化,從測試階段的 AI 摘要(AI Overviews)進化為 AI 模式(AI Mode)。宣稱將提供業界最快的回應速度,來回擊各方知識搜索型的生成式 AI 功能的節節進逼。此外 Google 也從這個新功能走出了一條新的廣告之路。例如在此功能之下 AI 不僅可以協助你加入不同的購買考量,篩選出最合適的產品並追蹤最佳的入手價格。
此外,Google AI Mode 還能省去過去虛擬試穿功能可能還需要拍照對位的麻煩。直接可以透過 AI 協助將衣裝產品快速合成到你現有的照片之中。讓你快速掌握穿上新衣的可能樣貌。
當然,一場 AI 先決的發表會免不了各種性能的刷榜。
針對 AI 模型的進展部分 Google Gemini 不僅刷榜,更宣告在硬體部分導入第 7 代 Ironwood TPU,帶來相較前代 10 倍效能 - 就官方的說法是「每個 Pod 的總運算能力可達4,250 萬兆次浮點運算。」服務的使用率更是節節攀升。
不僅有新一代的 Gemini 2.5 Flash,更有將要導入如平行思考技術(parallel thinking techniques)的深度思考(Deep Think)功能的 2.5 Pro 版本;還會改進 Deep Research 並推出可以輕鬆產生更易理解的圖表的 Canvas。甚至是更容易進行程式開發的功能。
由於這些要素的各種加速之下,在生成式 AI 方面的發展踩足了油門的 Google,還宣告在 Gemini 世代,將很可能會有更多發展突破的驚喜,隨時可能會發表給使用者。
更因為如此,還在 Google AI Pro 訂閱之上,帶來更快嚐鮮各種新功能的 Google AI Ultra 版本(嗯... 小編看到是真的笑了出來,大家都在 Ultra 了 XD)。
不過 Google 也確實在這一段 I/O 大會的發佈中,再次展現了自己對於 AI 的積極度與前沿技術。接下來就看看,什麼時候來到我們這邊了。
--
圖片/引用來源:Google
--
延伸閱讀:
MSI將AI用在最新QD-OLED顯示器,最新車聯新品進化登台
本文章最後由 rOsS.W 於 2025-5-21 19:36 編輯