隨著 AI 代理的熱潮,OpenAI 亦自行推出兩個 AI 代理,分別是 Operator 及 Deep Research,兩個各具特色,前者屬消費者產品,以私人助手身分幫用戶在網頁上代辦日常任務;後者精於撰寫研究報告,是研究人員的得力助手。
《火紅的 AI 代理》 甚麼是 AI 代理? AI 代理靠三大本領爆紅 AI 代理三個工作階段自動完成任務 掌握 AI 代理分類 有助尋求最佳解決方案 名牌廠商 AI 代理方案 一文盡錄! OpenAI 兩大 AI 代理 一個精於寫研究報告、一個是私人助理 |
Deep Research 如何使用?
OpenAI 表示 Deep Research 擅長於撰寫研究報告,幫助研究人員節省數十小時搜集資料及整理內容的時間,只要在 ChatGPT 的欄目輸入題目後,快至 5 分鐘至 30 分鐘之內得到詳細的報告,甚至具備文字和圖表並行視覺化數據。
Deep Research 由 OpenAI o3 模型開發的研究型 AI 代理,能夠計畫和執行複雜的研究任務。用戶在問題欄內輸入研究的主題或附上相關資料,Deep Research 便能夠自行分析及尋找額外資料完整研究內容,包括網上文章、學術期刊、研究報告等。在資料搜集期間,Deep Research 可能會向用戶提出問題以釐清研究的題目,至最後生成可比分析員深入程度的研究報告。
Deep Research 推出初期只限美國 ChatGPT Pro 訂戶可用,每月限制 100 次查詢研究,其他地區的同級別訂戶可經 VPN 使用。稍後會開放予 Plus 訂戶,以及企業的 Team 和 Enterprise,也會擴展至其他地區可用。
Deep Research 能力有多強?
Deep Research 運用 o3 模型的端到端加強學習(End-to-end Reinforcement Learning)技術,做到規劃和報行多個步驟(multi-step)搜尋資料,以至深入挖掘研究題目。根據 OpenAI 提供的評測數據,Deep Research 在「Humanity’s Last Exam」的準確度達到 26.6%,較其他模型,如同公司的 o1,以至 DeepSeek-R1 或 Gemini 2.0 Flash Thinking 等不足 10% ,表現更優勝。跟 o1 模型比較,在化學、人文和社會科學進步更大。這測試用上逾 100 個學術領域、超過 3,000 個專家級問題。
Deep Research 運作步驟
當用戶向 Deep Research 提出研究題目,背後的 AI 代理開始工作。
- 分析用戶的題目內容去定義應該搜尋範圍。
- 從網上搜尋資料,包括網站、圖片、影片、PDF 文件、學術期刊、研究報告、數據庫等。
- 整理所得的資料,篩走不相關資料,也初步驗證資料的可靠程度,以及分析資料
- 運用 o3 的推理能力,將所得的資料作深入分析,驗證內容的準確度。
- 如有需要,可能搜尋更多資料補充。
- Deep Research 把結果清晰地製成報告給用戶,可能用上 Python 製作圖表以視覺化呈現數據。
Deep Research 實際用途
根據 OpenAI 提供的示範,Deep Research 用於商業市場分析、醫療健康研究、用戶體驗設計。而個人用途則用作購買產品前的比較分析和建議,以至尋找看過的電視劇,僅提供三場情節,便能找出劇集名稱。有 OpenAI 用戶試用過 Deep Research,建議用於金融分析、市場調查、法律研究及學術研究。
使用 Deep Research 最大優勢是節省時間,將過往用上數日、以至星期計的研究,縮短至 30 分鐘內完成。而此 AI 代理提供深入的數據分析,提供更全面的研究結果。用上端到端加強學習為研究結果提供一定的準確度,令 AI 生成的內容較可信。
不過,OpenAI 仍然強調,Deep Research 在個別情況會產生虛構事實或報告的格式出現小錯誤。
Deep Research 與 Operator 分別
Deep Research 與 Operator 同屬 OpenAI 開發的 AI 代理,用法卻大不同。Operator 由 GPT-4o 驅動,定位消費者產品,幫助用戶在網頁運作代辦日常任務,如預訂服務、網購等。而 Deep Research 由 o3支援,所用範圍不限於網頁,更能分析任何網絡可存取的數據,成為研究事項的資料。
OpenAI 示範 Deep Research 的用途時,也以 GPT-4o 作比較。在針對特定範圍、需要多項資料互相比較時,Deep Resarch 的調查講求深度與細節,而且能夠更切合指示整合多項資料來源,並以表格形式呈現。
無論是 Deep Research 或是 Operator,AI 代理服務的出現反映 AI 競爭正在加快。正如 OpenAI 行政總裁 Sam Altman 所說:「2025 年可能見到第一批 AI 代理引入至工作流程,長遠目標實現『超級 AI』。」