更多

    DeepSeek 第 2 攻擊波 發放 Janus-Pro 文字生成圖像模型

    Lawrence
    Lawrence
    《PCM》創刊編輯, 見證電腦由 Monochrome 到 3D,9.6Kbps 撥號到 5G 無線上網年代,DIY、攝影、影音、手機樣樣啱玩。

    放下背後的開發秘密不說,DeepSeek AI 模型無論是效能表現,還是全球的的關注度,已經取得極大成功。但 DeepSeek 的攻擊還未停止。昨日 DeepSeek 就宣佈推出一款名為 Janus-Pro 的圖像生成模型,目標對手就是 DALL-E 3 和 Stable Diffusion。

    DeepSeek 於 1 月 27 日公佈推出 Janus-Pro-7B 模型,屬先進的多模態模型,能夠理解和生成各種數據格式,如文本、圖像和說明。根據 DeepSeek 發放的基準測試資料,Janus-Pro-7B,效能超過了以下模型:

    MMBench (多模態理解)
    .Janus-Pro-7B:79.2
    .Janus (Janus-Pro-7B 前身):69.4
    .TokenFlow : 68.9
    .MetaMorph : 75.2

    GenEval (文字轉換成圖像)
    .Janus-Pro-7B:0.80
    .DALL-E 3:0.67
    .Stable Diffusion 3 Medium : 0.74

    據 DeepSeek 發放的研究論文指出,Janus-Pro 系列現時有 1B(10億參數)和 7B (70億參數)兩個版本,測試數據上,兩個版本在模型對齊度,視覺美學評分,以及細部特徵還原我關鍵指標,都比主流產品為佳。DeepSeek 預備 1B 參數適用於羽量級但強大的多模理解任務,而 7B 參數則用於實現最先進的結果和高級指令跟蹤。

    同樣地,Janus-Pro-7B 也是以開源生態系統的方式提供,而現時 Janus-Pro-7B 的代碼和模型可以在官方的 GitHub 網頁 上公開。

    讚者可以到以下網址體驗試用示範: Chat With Janus-Pro-7B – a Hugging Face Space by deepseek-ai

    ZCOPE 最新影片


    您會感興趣的內容

    相關文章