找回密碼
 註冊

Google Gemini Live 視覺互動功能本月降臨,支援視訊與螢幕分享

来源: 新聞 rOsS.W 2025-3-4 14:50 只看這個作者 只看大圖 |閱讀模式
0 1829
隨著蘋果將 AI 體驗下放到了更入門的 iPhone 16e,甚至還開放透過 Action Button 動作按鈕,做為 Visual Intelligence 的快速啟動使用體驗;OpenAI ChatGPT 的 Live Vision 也已經逐步地導入,透過「視覺」+「語音」即可更直覺的與使用者互動並接受提問的使用方式。

Google Gemini Live 視覺互動功能本月降臨,支援視訊與螢幕分享6962

在生成式 AI 競爭始終不落人後的 Google,也選擇在今年的 MWC 世界行動通訊大會宣告,他們的生成式 AI 即時對應對話與搜尋的 Gemini Live AI,可支援直接在手機上以「視訊」或者是「螢幕畫面分享」使用的正式推出時間。

Google Gemini Live 視覺互動功能本月降臨,支援視訊與螢幕分享2047

Google 透過部落格發文確認將會在本月份稍晚,以 Google One AI Premium 計劃的一部分,開始向 Gemini Advanced 的付費訂閱者提供。透過這次 MWC 的預告,Google 也向大家展示了包括「Gemini Live with Video」與「Gemini Live with Screenshare」的示範影片。





基本上就如功能的名稱那樣,其中一個示範是透過 Gemini Live 介面底部的錄影按鈕開啟相機。接著就可以透過手機鏡頭搭配語音來詢問 AI 配色等問題;Gemini Live with Screenshare 的官方示範影片,則是在瀏覽購物頁面時啟動 Gemini Live。

Google Gemini Live 視覺互動功能本月降臨,支援視訊與螢幕分享352

接著就看到了「Share screen with Live」的彈出提示。點擊之後便會啟動類似通話的抽屜式畫面,讓使用者意識到自己已經啟動了語音交談(即使是收起來的時候,左上角也會有通話狀態)。示範中則是向 AI 詢問了穿搭方面的建議。

整體而言,這樣的 Demo 自然會有一些美化的成分在其中。但個人認為這種可讓人更直覺地與 AI 互動方式也是很不錯的!

Google Gemini Live 視覺互動功能本月降臨,支援視訊與螢幕分享7253

自己會比較好奇的是,當幾乎所有檯面上的 AI 體驗目前幾乎都已經從文字到語音再到視訊都可以對應的時候。一方面是會覺得他們彼此之間的表現,是否會在加入更複雜的多模態支援之後而有另一波的高下。更想要知道,未來 AI 還會有什麼樣的應用發展方向 - 難不成是可以「聞的到」味道了?

--

圖片/引用來源:Google
本文最後由 rOsS.W 於 2025-3-4 14:52 編輯

收藏
收藏0
Ross Wang 關關觀點