懶人包重點:
・靠 AGI 更近一步,OpenAI 推出更整合電腦控制與深度研究功能的最新智慧體世代 ChatGPT Agent 代理人功能。
・ChatGPT Agent 將結合現有 AI 工具 Operator 和 Deep Research。跨電腦應用 GUI、API、程式碼深度利用電腦功能深度研究處理需求。
不是大家猜測的 ChatGPT 瀏覽器!OpenAI 正式發表 ChatGPT Agent 功能(官網的中文翻譯是「ChatGPT 智慧體」)。直接將現有 AI 工具 Operator 和 Deep Research 的功能合併,帶來可跨電腦應用、API、甚至是程式碼編寫深度利用電腦功能,並以深度研究來處理需求的整合使用體驗。
此功能將可協助你在工作時執行重複任務、更新財務試算表、將截圖資料製成簡報、安排會議或出訪行程。也可以在生活中用來規劃行程、預定晚餐等工作。
今天起(沒錯,今天就可以用了),ChatGPT 的 Pro、Plus 和 Team 方案用戶將可直接在 ChatGPT 對話框的工具列即可找到「Agent Mode」的按鈕,或是以「/agent」指令隨時在 AI 聊天視窗中啟用這個最新的整合功能。
透過這個「ChatGPT 智慧體」將可把電腦能做的事情全面整合。包括直接取用 Google 日曆、雲端硬碟等服務,甚至還整合了年初推出的 Operator 所能提供的電腦操作乃至於更深度的指令列功能。都能在搭配深度學習混合不特定模型的「思考」之下,為你達成包括製作簡報、報銷任務,或者只是簡單的為參加婚禮尋找穿搭的選項。
可用任務數的部分,據官方的說法 Pro 方案用戶每月任務數將會幾乎無上限;其他付費方案用戶每月可執行 50 項任務,還可彈性加購使用額度。並預告 7 月將開放 Enterprise 和 Education 方案用戶使用此功能。
AI 接管「整台電腦」=(幾乎)無所不能?
個人認為 ChatGPT Agent 代理人模式厲害在全面跨出瀏覽器等應用的範疇,搭配幾個品牌正在發展當中的指令列功能,幾乎是將「整台電腦」的功能與需要參考的資訊都能「一個 AI 掌握」,並能主動執行生成簡報(裡面還能生成製作插圖)甚至是直接幫忙使用者下訂單的能耐。
所以只要你點下「願意」的話,ChatGPT Agent 是可以完全無腦幫你搞定一切電腦能做到的事情的 - 基本上在現代來講,算是幾乎所有事情都能達到了。
看到這,大家應該會瞬間驚醒,覺得這樣一來 ChatGPT Agent 代理人模式是不是就會拿著自己的付款資訊亂刷亂買了嗎?
別擔心,雖然 OpenAI CEO Sam Altman 在宣布此功能的影片中是有語重心長地提到,當進入所謂的 Agent 智慧體時代的時候,將會需要更多的監控措施來對應。
但至少「目前」來說,ChatGPT Agent 代理人模式只要涉及到敏感或具影響力的操作(如:提交表單、預約、購物或與個人資料有關的網站操作)時,便會停下來等待使用者確認或是接管。
除此之外,OpenAI 還為這個極其強大的自動化整合功能導入了透過另一個 AI 來主動監督的機制。此外,其本身還有拒絕如金融交易或敏感法律事務的「高風險任務主動緩解風險」與防止濫用、防禦對抗性攻擊、完善的隱私控管機制與安全瀏覽器接管模式。
OpenAI 也強調,ChatGPT 不會查看或擷取您在這些工作階段中輸入的任何資料。
高度整合、更為透明好懂的 Agent 體驗
這些功能其實說穿了就是整合了 Operator 的自動化操作體驗操作。不過就體驗來說,個人覺得 OpenAI 做出了另一種新的層次。
他們會透過類似影片的介面,呈現目前 AI 正在進行的步驟 - 你可能可以看到它打開了瀏覽器或是試算表檔案;介面也會搭配簡單的「步驟」或是「(深度)思考」的說明。
在所有輸出完成之後(手機 App 也會通知提示)。你甚至還可以「回看」ChatGPT Agent 代理人模式所執行的所有步驟,確認一切沒有走歪 - 還可以看到它進行頁面截圖並開始研究的步驟,也會提示你為下一步進行安全登入等作業。
更棒的是,這個操作體驗更支援可以隨時透過指令中斷改變任務方向或打斷它的工作。甚至也能要 ChatGPT Agent 執行定期的排程工作。
Agent 之後...
從現在的角度來看,年初發表的 Operator 和 Deep Research 工具,基本上就是為了 ChatGPT Agent 代理人模式而生的階段性努力。事實上,官方也宣告 Operator 預覽版後續僅會繼續運作約 30 天便正式退場。OpenAI 也不諱言,現在的 Agent Mode 的輸出功能仍待完善 - 以簡報輸出功能為例,但也預告已著手訓練下一代 ChatGPT 的簡報製作能力。
個人認為,OpenAI 這次算是將心力全然灌注在希望能讓更多人接受所謂「代理人」這樣,更主動執行任務的使用體驗。才能在後續可能降臨的 AGI 時代前,想辦法讓使用者能更習慣將隱私資訊或重要任務的操作交給 ChatGPT 經手。
而當大家漸漸適應,另一方面 ChatGPT 也能在這個過程中逐步建立起更安全的防護機制與體驗之後。那麼,也許可以提早為人類完成一切瑣事的全能 AI 將會比想像中的更早降臨。
至少,個人覺得 OpenAI 從 Operator 與 Deep Research 再到兩者整合的 ChatGPT Agent 代理人模式的發展速度快到難以想像。所以只要 OpenAI 接下來能確實取得使用者的信任,應該就能以此為基礎獲得更為加速的進展。
VIDEO
--
圖片/引用來源:OpenAI
--
延伸閱讀:
Xperia 1 VII 意外關機無法開機問題,Sony 7/24 起提供免費換機
-- 本文章最後由 rOsS.W 於 2025-7-18 12:03 編輯