更多

    AI  時代|OpenAI 兩大 AI 代理 一個精於研究報告、一個是私人助理

    Eric Chong
    Eric Chong
    商業・科技・創業・編輯

    隨著 AI 代理的熱潮,OpenAI 亦自行推出兩個 AI 代理,分別是 Operator 及 Deep Research,兩個各具特色,前者屬消費者產品,以私人助手身分幫用戶在網頁上代辦日常任務;後者精於撰寫研究報告,是研究人員的得力助手。

    《火紅的 AI 代理
    甚麼是 AI 代理?
    AI 代理靠三大本領爆紅
    AI 代理三個工作階段自動完成任務
    掌握 AI 代理分類 有助尋求最佳解決方案
    名牌廠商 AI 代理方案 一文盡錄!
    OpenAI 兩大 AI 代理 一個精於寫研究報告、一個是私人助理

    Deep Research 如何使用?

    OpenAI 表示 Deep Research 擅長於撰寫研究報告,幫助研究人員節省數十小時搜集資料及整理內容的時間,只要在 ChatGPT 的欄目輸入題目後,快至 5 分鐘至 30 分鐘之內得到詳細的報告,甚至具備文字和圖表並行視覺化數據。

    Deep Research 由 OpenAI o3 模型開發的研究型 AI 代理,能夠計畫和執行複雜的研究任務。用戶在問題欄內輸入研究的主題或附上相關資料,Deep Research 便能夠自行分析及尋找額外資料完整研究內容,包括網上文章、學術期刊、研究報告等。在資料搜集期間,Deep Research 可能會向用戶提出問題以釐清研究的題目,至最後生成可比分析員深入程度的研究報告。

    Deep Research 推出初期只限美國 ChatGPT Pro 訂戶可用,每月限制 100 次查詢研究,其他地區的同級別訂戶可經 VPN 使用。稍後會開放予 Plus 訂戶,以及企業的 Team 和 Enterprise,也會擴展至其他地區可用。

    Deep Research 能力有多強?

    Deep Research 運用 o3 模型的端到端加強學習(End-to-end Reinforcement Learning)技術,做到規劃和報行多個步驟(multi-step)搜尋資料,以至深入挖掘研究題目。根據 OpenAI 提供的評測數據,Deep Research 在「Humanity’s Last Exam」的準確度達到 26.6%,較其他模型,如同公司的 o1,以至 DeepSeek-R1 或 Gemini 2.0 Flash Thinking 等不足 10% ,表現更優勝。跟 o1 模型比較,在化學、人文和社會科學進步更大。這測試用上逾 100 個學術領域、超過 3,000 個專家級問題。

    Deep Research 運作步驟

    當用戶向 Deep Research 提出研究題目,背後的 AI 代理開始工作。

    1. 分析用戶的題目內容去定義應該搜尋範圍。
    2. 從網上搜尋資料,包括網站、圖片、影片、PDF 文件、學術期刊、研究報告、數據庫等。
    3. 整理所得的資料,篩走不相關資料,也初步驗證資料的可靠程度,以及分析資料
    4. 運用 o3 的推理能力,將所得的資料作深入分析,驗證內容的準確度。
    5. 如有需要,可能搜尋更多資料補充。
    6. Deep Research 把結果清晰地製成報告給用戶,可能用上 Python 製作圖表以視覺化呈現數據。

    Deep Research 實際用途

    根據 OpenAI 提供的示範,Deep Research 用於商業市場分析、醫療健康研究、用戶體驗設計。而個人用途則用作購買產品前的比較分析和建議,以至尋找看過的電視劇,僅提供三場情節,便能找出劇集名稱。有 OpenAI 用戶試用過 Deep Research,建議用於金融分析、市場調查、法律研究及學術研究。

    使用 Deep Research 最大優勢是節省時間,將過往用上數日、以至星期計的研究,縮短至 30 分鐘內完成。而此 AI 代理提供深入的數據分析,提供更全面的研究結果。用上端到端加強學習為研究結果提供一定的準確度,令 AI 生成的內容較可信。

    不過,OpenAI 仍然強調,Deep Research 在個別情況會產生虛構事實或報告的格式出現小錯誤。

    Deep Research 與 Operator 分別

    Deep Research 與 Operator 同屬 OpenAI 開發的 AI 代理,用法卻大不同。Operator 由 GPT-4o 驅動,定位消費者產品,幫助用戶在網頁運作代辦日常任務,如預訂服務、網購等。而 Deep Research 由 o3支援,所用範圍不限於網頁,更能分析任何網絡可存取的數據,成為研究事項的資料。

    OpenAI 示範 Deep Research 的用途時,也以 GPT-4o 作比較。在針對特定範圍、需要多項資料互相比較時,Deep Resarch 的調查講求深度與細節,而且能夠更切合指示整合多項資料來源,並以表格形式呈現。

    無論是 Deep Research 或是 Operator,AI 代理服務的出現反映 AI 競爭正在加快。正如 OpenAI 行政總裁 Sam Altman 所說:「2025 年可能見到第一批 AI 代理引入至工作流程,長遠目標實現『超級 AI』。」

    ZCOPE 最新影片

    您會感興趣的內容

    相關文章