簡言之,Gemini 3 世代的模型不僅是 Google 有史以來最聰明的模型,同時也宣稱自己是至今最強大的代理與 Vibe coding 應用的模型。但我們更為關注的是,Google 針對 AI 服務帶來了什麼新鮮的功能與體驗改進。
Gemini 全面貫通生態系
不僅僅是追求單點的性能突破,Google 近期可以說是將 AI 推展到「線」與「面」甚至還建構起了更為立體的發展架構。
從 Bard 再到 Gemini 世代,Google 不只是針對聊天機器人服務、專用 App 並滲透旗下服務帶來 AI 功能,更全面擴展到招牌的搜尋服務乃至於 AI Studio 與 Vertex AI 等領域。近期甚至就連招牌的搜尋服務,也從 AI Overivews 進化到了 AI Mode。
來到 Gemini 3,Google 更是宣布他們達到了在模型發表首日就將 Gemini 同步導入搜尋功能的創舉 - 當然,也包含 Gemini App,並且已經提供給 AI Studio 和 Vertex AI 的開發者;更為進階增強推理能力的 Deep Think,則是會先開放給安全測試人員,並階段性提供給 Google AI Ultra 訂閱用戶使用。
這代表了,Google 似乎開始正視自己容易一直「打掉重練」App 或服務的問題,藉由技術堆疊(full stack)策略,搭配進化到能「讀懂空氣」的新世代 Gemini,讓可以輔助使用者學習、建構、規劃甚至是實現創意的 AI 服務第一時間就可以獲得最新最先進的能力。
Google 更進一步將這樣的代理功能延伸至開發者的工具上,帶來全新的代理開發平台 Google Antigravity。
Google 嘗試透過 AI Agent 貫通程式編輯器、終端機與現階段代理人的主戰場瀏覽器,提供更主動、更全面的整合開發環境(IDE)。可以說是從先前推出的 Gemini CLI 工具,進一步的讓 AI 跳脫過往 vibe coding 的概念流程,更主動的代理使用者執行整個程式開發流程。
關於 Google Antigravity 建議可以看看官方的影片示範,這個開發環境不僅可以同時啟用多個 AI 代理人平行運作。開發過程還會主動截圖/螢幕錄影執行的成果給使用者確認(驚),使用者也可以簡單地透過視覺化的截圖工具來「出一張嘴(誒... 是用鍵盤輸入啦)」給予後續的開發建議。
重點是,這個應用一開始就提供了 macOS、Windows 與 Linux 的平台支援(開放免費下載公開預覽版),還能整合支援 Claude 與 OpenAI 的開發用模型。一整個呈現出了全面攻佔開發者的野心。
就目前的鋪陳來看,當使用者可以更輕鬆開發應用時,Agent 也能更深入電腦系統之中,對於以往還是偏向於在雲端打造服務的 Google 而言,將會是一個重大的進展。
AI 教會 Google 重視效率,堆疊創造奇蹟
回想起 ChatGPT 所帶起的生成式 AI 浪潮,Google 曾一度被包括微軟等競爭對手打亂陣腳時。認真講,當時確實看到了 Google 很有可能被對手趁機超越的危機。
然而也許是這樣的發展確實激起了他們的危機感,變得不敢再繼續散漫,又或是過往 Google 在 AI 方面的累積真的是很難輕易被超越的高牆。總之,隨著 Gemini 的幾次進化,Google 不僅穩住了腳步,現在則是從 AI 模型的表現乃至於代理人模式的全面發展都拿出了領導者的氣勢。
根據官方的資訊,「AI 總覽」現在每月有 20 億的活躍使用者。Gemini 應用程式的每月活躍使用者超過 6.5 億,且有超過 70% 的雲端客戶正在使用他們的 AI 服務,更有 1,300 萬名開發者利用 Google 的生成式模型進行開發。
Google 令人驚嘆的不僅僅是在短短兩年內,Gemini AI 已從單純地閱讀文字和圖像,進化到能「讀懂空氣」。個人看到的,是他們更懂得利用善解人意的 AI 讓自己的服務可以更快速、更全面透過核心引擎的升級,透過猶如一鍵進化的方式,讓大眾漸漸建立起 Google 的生成式 AI 服務不僅創新、強大也夠可靠的優秀印象。
是說,雖然就目前來看 Google 針對代理人的發展還算是步步為營,將 AI 代替人執行的每一步都相當謹慎地告知與限制。不過隨著接下來其他競爭對手的進逼,Google 是否還是能穩定的在兼顧隱私與 AI 實力的前提下繼續領先群雄,將會是筆者關注的焦點。