中國人工智能創業公司深度求索的聊天機械人 DeepSeek 在 有關新聞和情報的 NewsGuard 審查中僅獲得 17% 的準確率,排名 11 家西方競爭對手中的第十。據路透社報道,DeepSeed 在評估中虛假陳述的重複率達 30%,而模糊或不實用的回答就佔 53%,顯示在新聞領域上可靠性存疑。
可信度評級服務 NewsGuard 在當地時間 1 月 29 日發表對 DeepSeek 的審查報告,他們向 DeepSeek 提出 300 條亦用於審查其他聊天機械人的提示句,其中包括 30 條基於在網路上流傳的 10 條假新聞來建立的提示。審查發現 DeepSeek 的錯誤率高達 83%,比西方對手的平均錯誤率 62% 低。
另外,報告又指 DeepSeek 即使在與中國無關的問題上,例如有關阿塞拜疆航空墜機事件,在 10 條提示句中有 3 條會回答中國政府對該問題的官方立場。
NewsGuard 補充說,與其他 AI 模型一樣,DeepSeek 在回應那些尋求使用 AI 來創建和傳播虛假訊息的人的提示句時,最容易重複虛假陳述。
雖然深度求索強調以低成本就能做出與 OpenAI 同等水平的大語言模型,不過外界就質疑他們的 AI 技術,Microsoft 與 OpenAI 就開始調查是否有與深度求索有密切關係的個人以不誠實手段透過 OpenAI API 竊取大量數據。
儘管 DeepSeek 應用在 Apple App Store 中迅速成為最受歡迎的應用,但這結果引發了對其技術的質疑,並加劇了美國在 AI 領域的競爭壓力。