放下背後的開發秘密不說,DeepSeek AI 模型無論是效能表現,還是全球的的關注度,已經取得極大成功。但 DeepSeek 的攻擊還未停止。昨日 DeepSeek 就宣佈推出一款名為 Janus-Pro 的圖像生成模型,目標對手就是 DALL-E 3 和 Stable Diffusion。
DeepSeek 於 1 月 27 日公佈推出 Janus-Pro-7B 模型,屬先進的多模態模型,能夠理解和生成各種數據格式,如文本、圖像和說明。根據 DeepSeek 發放的基準測試資料,Janus-Pro-7B,效能超過了以下模型:
MMBench (多模態理解)
.Janus-Pro-7B:79.2
.Janus (Janus-Pro-7B 前身):69.4
.TokenFlow : 68.9
.MetaMorph : 75.2
GenEval (文字轉換成圖像)
.Janus-Pro-7B:0.80
.DALL-E 3:0.67
.Stable Diffusion 3 Medium : 0.74
據 DeepSeek 發放的研究論文指出,Janus-Pro 系列現時有 1B(10億參數)和 7B (70億參數)兩個版本,測試數據上,兩個版本在模型對齊度,視覺美學評分,以及細部特徵還原我關鍵指標,都比主流產品為佳。DeepSeek 預備 1B 參數適用於羽量級但強大的多模理解任務,而 7B 參數則用於實現最先進的結果和高級指令跟蹤。
同樣地,Janus-Pro-7B 也是以開源生態系統的方式提供,而現時 Janus-Pro-7B 的代碼和模型可以在官方的 GitHub 網頁 上公開。
讚者可以到以下網址體驗試用示範: Chat With Janus-Pro-7B – a Hugging Face Space by deepseek-ai