DeepSeek 第 2 攻擊波發放 Janus-Pro 文字生成圖像模型

放下背後的開發秘密不說，DeepSeek AI 模型無論是效能表現，還是全球關注度最高，這已經取得極大成功。但 DeepSeek 的進取未停止，昨日就宣佈推出一款名為 Janus-Pro 的圖像生成模型，目標對手就是 DALL-E 3 和 Stable Diffusion。

DeepSeek 於 1 月 27 日公佈推出 Janus-Pro-7B 模型，屬先進的多模態模型，能夠理解和生成各種數據格式，如文本、圖像和說明。根據 DeepSeek 發放的基準測試資料，Janus-Pro-7B，效能超過了以下模型：

MMBench (多模態理解)
．Janus-Pro-7B：79.2
．Janus (Janus-Pro-7B 前身)：69.4
．TokenFlow : 68.9
．MetaMorph : 75.2

GenEval (文字轉換成圖像)
．Janus-Pro-7B：0.80
．DALL-E 3：0.67
．Stable Diffusion 3 Medium : 0.74

據 DeepSeek 發放的研究論文指出，Janus-Pro 系列現時有 1B（10億參數）和 7B （70億參數）兩個版本，測試數據上，兩個版本在模型對齊度，視覺美學評分，以及細部特徵還原我關鍵指標，都比主流產品為佳。DeepSeek 預備 1B 參數適用於羽量級但強大的多模理解任務，而 7B 參數則用於實現最先進的結果和高級指令跟蹤。

同樣地，Janus-Pro-7B 也是以開源生態系統的方式提供，而現時 Janus-Pro-7B 的代碼和模型可以在官方的 GitHub 網頁上公開。

讚者可以到以下網址體驗試用示範： Chat With Janus-Pro-7B – a Hugging Face Space by deepseek-ai

DeepSeek 第 2 攻擊波發放 Janus-Pro 文字生成圖像模型

原來 Google 眼鏡已進化到如此厲害・Android XR 首次在 TED 公開示範

旗艦對焦入門機全片幅 Nikon Z5 II 開價 $12,590

Apple Watch 十周年・教你點樣拎特別版襟章

ZCOPE 最新影片

您會感興趣的內容

相關文章

DeepSeek 第 2 攻擊波 發放 Janus-Pro 文字生成圖像模型

ZCOPE 最新影片

您會感興趣的內容

相關文章

DeepSeek 第 2 攻擊波發放 Janus-Pro 文字生成圖像模型