八成答錯或虛假陳述　可信審查指 DeepSeek 準確度只有 17%

中國人工智能創業公司深度求索的聊天機械人 DeepSeek 在有關新聞和情報的 NewsGuard 審查中僅獲得 17% 的準確率，排名 11 家西方競爭對手中的第十。據路透社報道，DeepSeed 在評估中虛假陳述的重複率達 30%，而模糊或不實用的回答就佔 53%，顯示在新聞領域上可靠性存疑。

可信度評級服務 NewsGuard 在當地時間 1 月 29 日發表對 DeepSeek 的審查報告，他們向 DeepSeek 提出 300 條亦用於審查其他聊天機械人的提示句，其中包括 30 條基於在網路上流傳的 10 條假新聞來建立的提示。審查發現 DeepSeek 的錯誤率高達 83%，比西方對手的平均錯誤率 62% 高。

另外，報告又指 DeepSeek 即使在與中國無關的問題上，例如有關阿塞拜疆航空墜機事件，在 10 條提示句中有 3 條會回答中國政府對該問題的官方立場。

NewsGuard 補充說，與其他 AI 模型一樣，DeepSeek 在回應那些尋求使用 AI 來創建和傳播虛假訊息的人的提示句時，最容易重複虛假陳述。

雖然深度求索強調以低成本就能做出與 OpenAI 同等水平的大語言模型，不過外界就質疑他們的 AI 技術，Microsoft 與 OpenAI 就開始調查是否有與深度求索有密切關係的個人以不誠實手段透過 OpenAI API 竊取大量數據。

儘管 DeepSeek 應用在 Apple App Store 中迅速成為最受歡迎的應用，但這結果引發了對其技術的質疑，並加劇了美國在 AI 領域的競爭壓力。

八成答錯或虛假陳述　可信審查指 DeepSeek 準確度只有 17%

睇片都中招！Apple 多個 OS 同時發布更新修補重大漏洞

對華 104% 關稅啟動　iPhone 要賣 $2,300 美元起？

左手買起右手？X 收歸 xAI 旗下

ZCOPE 最新影片

您會感興趣的內容

相關文章

八成答錯或虛假陳述 可信審查指 DeepSeek 準確度只有 17%

ZCOPE 最新影片

您會感興趣的內容

相關文章

八成答錯或虛假陳述　可信審查指 DeepSeek 準確度只有 17%