更多

    八成答錯或虛假陳述 可信審查指 DeepSeek 準確度只有 17%

    Mickey Chan
    Mickey Chan
    愛模擬飛行、希望終有一日回到單車上的宅,眼鏡娘控。座右銘: 1.膽固醇跟美味是成正比的; 2.所有人都可以騙,但絕對不能騙自己; 3.賣掉的貨才是錢,不賣的收藏品不值一文; 4.踩單車,是為了吃更多美食! 5.正義的話語,不一定出自正義之人的口;

    中國人工智能創業公司深度求索的聊天機械人 DeepSeek 在 有關新聞和情報的 NewsGuard 審查中僅獲得 17% 的準確率,排名 11 家西方競爭對手中的第十。據路透社報道,DeepSeed 在評估中虛假陳述的重複率達 30%,而模糊或不實用的回答就佔 53%,顯示在新聞領域上可靠性存疑。

    可信度評級服務 NewsGuard 在當地時間 1 月 29 日發表對 DeepSeek 的審查報告,他們向 DeepSeek 提出 300 條亦用於審查其他聊天機械人的提示句,其中包括 30 條基於在網路上流傳的 10 條假新聞來建立的提示。審查發現 DeepSeek 的錯誤率高達 83%,比西方對手的平均錯誤率 62% 低。

    另外,報告又指 DeepSeek 即使在與中國無關的問題上,例如有關阿塞拜疆航空墜機事件,在 10 條提示句中有 3 條會回答中國政府對該問題的官方立場。

    NewsGuard 補充說,與其他 AI 模型一樣,DeepSeek 在回應那些尋求使用 AI 來創建和傳播虛假訊息的人的提示句時,最容易重複虛假陳述。

    雖然深度求索強調以低成本就能做出與 OpenAI 同等水平的大語言模型,不過外界就質疑他們的 AI 技術,Microsoft 與 OpenAI 就開始調查是否有與深度求索有密切關係的個人以不誠實手段透過 OpenAI API 竊取大量數據

    儘管 DeepSeek 應用在 Apple App Store 中迅速成為最受歡迎的應用,但這結果引發了對其技術的質疑,並加劇了美國在 AI 領域的競爭壓力。

    ZCOPE 最新影片

    您會感興趣的內容

    相關文章