更多

    deepseek

    DeepSeek 第 2 攻擊波 發放 Janus-Pro 文字生成圖像模型

    放下背後的開發秘密不說,DeepSeek AI 模型無論是效能表現,還是全球的的關注度,已經取得極大成功。但 DeepSeek 的攻擊還未停止。昨日 DeepSeek 就宣佈推出一款名為 Janus-Pro 的圖像生成模型,目標對手就是 DALL-E 3 和 Stable Diffusion。 DeepSeek 於 1 月 27 日公佈推出 Janus-Pro-7B 模型,屬先進的多模態模型,能夠理解和生成各種數據格式,如文本、圖像和說明。根據 DeepSeek 發放的基準測試資料,Janus-Pro-7B,效能超過了以下模型: MMBench (多模態理解).Janus-Pro-7B:79.2.Janus (Janus-Pro-7B 前身):69.4.TokenFlow : 68.9.MetaMorph : 75.2GenEval (文字轉換成圖像).Janus-Pro-7B:0.80.DALL-E 3:0.67.Stable Diffusion 3 Medium : 0.74 據 DeepSeek...

    OpenAI 與 Microsoft 調查 DeepSeek 偷用數據進行訓練

    DeepSeek 一出現,全球 AI 聊天機械人開發商都腳震,認為低成本人工智能模型將會改寫歷史,更會改變由美國主導的AI生態。不過,隨著更多時間解拆 DeepSeek,更多疑團就慢慢產生,最新就有 OpenAI 指懷疑 DeepSeek 偷用了其模型來訓練自己的模型。

    NVIDIA 高 EQ 回應 DeepSeek 夠出色 將要更多 GPU 滿足服務需求 

    NVIDIA 以高情商回應 DeepSeek 的出現,讚揚其是 AI 技術的一項顯著進步,並認為這將為 NVIDIA 帶來更多機會。

    AI 時代│DeepSeek 平價訓練超強模型震驚矽谷 用人策略成突破關鍵

    中國 AI 創業公司深度求索的大型語言模型 DeepSeek,1 月 20 日發布 R1 版本,能力可比 OpenAI 的 GPT-4o。 DeepSeek 的前一版本 V3 亦比美國的大型語言模型能力略勝一籌。DeepSeek 的能力震驚業界不是焦點,重點是其超低的訓練成本,聲稱僅 558 萬美元完成,顛覆矽谷花上十億計美元重金訓練最新模型,甚至令美國 AI 界感到威脅。DeepSeek 突然冒起,成功之道或在於用人策略。

    Meta 投資 600 億美元建新 AI 數據中心 不敵 600 萬美元成本的 DeepSeek

    美國的 AI 投資一浪接一浪,繼 Stargate 四年投資 5,000 億美元之後,Facebook 母公司 Meta 也加注,計畫在今年內小注投資 600 億美元建立一個擁有 130 萬顆 GPU 的大型 AI 數據中心。不過,發出這消息卻不對時機,因為 DeepSeek 釋出的 DeepSeek- R1表現勝過 Llama,同時訓練成本只是約 600 萬美元,更把 Meta 團隊嚇壞,表明擔心快將發布的 Llama AI 版本可能無法比上 DeepSeek。

    最新文章

    蓓優妮塔 15 周年限定店 美魔女御姐登陸合和商場 Assemble

    遊戲《蓓優妮塔》系列 15 周年,於灣仔合和商場Assemble | Nintendo Switch商品專門店開設期間限定店,有特色打卡主題及30款期間限定精品,感受這位男女玩家都憧憬的美麗魔女。