更多

    AI 時代│OpenAI 推出 AI 代理 Operator 能看懂網頁、可上網購物及訂枱

    Eric Chong
    Eric Chong
    商業・科技・創業・編輯

    OpenAI 發表專用於處理網頁任務的 AI 代理 Operator,例如代用戶於網上購物、訂枱、訂機票、訂酒店等。Operator 能夠看懂網頁,更會仿效滑鼠和鍵盤輸入,自行操作點擊、滾動、填寫表格等。用戶僅用簡單指令便可吩咐 AI 代理處理複雜的網頁任務。雖然 OpenAI 是眾多廠商之中最後一間推出 AI 代理服務,但能力卻最高。

    OpenAI 一如過往經 YouTube 影片發表產品。該公司行政總裁 Sam Altman 與團隊一同介紹和示範 Operator,例如在 OpenTable 尋找餐廳訂位,或建議 4.5 星以上的餐廳。Operator 會自動到 OpenTable 網站搜尋,列出符合相關要求的餐廳,甚至詢問用戶是否代為訂位。OpenAI 又示範,用戶可以手寫購物清單,交由 Operator 讀取,自動到雜貨代購平台 Instacart 訂購。

    Operator 背後的技術是電腦使用代理(Computer-Using Agent,CUA),結合 GPT-4o 模型的視覺分析和加強學習(Reinforcement Learning) 自我修正。OpenAI 稱,經訓練後可以像人一樣控制 GUI,不只讀懂網頁上的文字和圖像,還有按鈕、選單等都能操作,毋須經作業系統或網站 API 控制。

    當 Operator 遇上無法處理的情況,會運用推理功能和加強學習加以修正,直至真的無法處理時便會交由用戶接手。平台加入行為限制保障用戶私隱,如需要登入資料、信用卡號碼、解決 CAPTCHA 時,會讓用戶自行輸入。在處理重要任務時,包括傳送電郵或確認訂單前,先由用戶檢視內容再送出。

    OpenAI 正與多間平台合作,讓用戶一句指令就可要求 Operator 自動地完成任務,除了訂餐廳的 OpenTable,還有外賣平台 DoorDash、雜貨代購平台 Instacart、網約車平台 Uber、門票平台 StubHub 等。Operator 支援用戶個人化設定,例如在旅遊網站訂購時選定偏好的航空公司。

    OpenAI 貫徹以往做法戴上「頭盔」,強調 Operator 仍處於早期階段,功能有限制亦有可能出錯。雖然如此,Operator 在 WebArena 和 WebVoyager 的基準測試,表現超越 SOTA(state-of-the-art)評分。Operator 目前只開放給美國用戶預覽,亦只有每月 200 美元 Pro 方案訂戶可用,稍後才推展至 Plus、Teams 和 Enterprise 訂戶,以及其他地區訂戶,最終才整合至免費版 ChatGPT。

    最新影片

    您會感興趣的內容

    相關文章