更多

    Biz.IT

    不讓 DeepSeek 搶風頭 阿里雲宣稱新版通義千問更強勁

    1 月 29 日正值農曆年初一,也是中國新春假期,阿里巴巴旗下阿里雲一反常態選在假日於微信發布通義千問旗艦版模型 Qwen2.5-Max,並宣稱該模型版本性能超越 DeepSeek-V3。此舉顯示了 DeepSeek 的快速冒起不單震撼美國 AI 界,對中國的競爭對手也帶來極大壓力。

    DeepSeek 第 2 攻擊波 發放 Janus-Pro 文字生成圖像模型

    放下背後的開發秘密不說,DeepSeek AI 模型無論是效能表現,還是全球的的關注度,已經取得極大成功。但 DeepSeek 的攻擊還未停止。昨日 DeepSeek 就宣佈推出一款名為 Janus-Pro 的圖像生成模型,目標對手就是 DALL-E 3 和 Stable Diffusion。 DeepSeek 於 1 月 27 日公佈推出 Janus-Pro-7B 模型,屬先進的多模態模型,能夠理解和生成各種數據格式,如文本、圖像和說明。根據 DeepSeek 發放的基準測試資料,Janus-Pro-7B,效能超過了以下模型: MMBench...

    OpenAI 與 Microsoft 調查 DeepSeek 偷用數據進行訓練

    DeepSeek 一出現,全球 AI 聊天機械人開發商都腳震,認為低成本人工智能模型將會改寫歷史,更會改變由美國主導的AI生態。不過,隨著更多時間解拆 DeepSeek,更多疑團就慢慢產生,最新就有 OpenAI 指懷疑 DeepSeek 偷用了其模型來訓練自己的模型。

    資訊安全│破產管理署遺失備份磁帶 內存 76,000 名個人資料

    繼機電工程署及市區重建局接連被爆出有個人資料外洩後,又有政府部門遺失資料。破產管理署在 1 月 27 日發表聲明,指署方遺失內有 76,000 名人士個人資料的備份磁帶,並對此事非常重視及致歉。

    法國 AI 聊天機械人 亂講嘢被迫下架

    正當中國初創企業以低成本開發 DeepSeek 震驚全世界,法國政府支持的一個法語 AI 聊天機械人,卻因為亂給答案而被下架。

    NVIDIA 高 EQ 回應 DeepSeek 夠出色 將要更多 GPU 滿足服務需求 

    NVIDIA 以高情商回應 DeepSeek 的出現,讚揚其是 AI 技術的一項顯著進步,並認為這將為 NVIDIA 帶來更多機會。

    AI 時代│DeepSeek 平價訓練超強模型震驚矽谷 用人策略成突破關鍵

    中國 AI 創業公司深度求索的大型語言模型 DeepSeek,1 月 20 日發布 R1 版本,能力可比 OpenAI 的 GPT-4o。 DeepSeek 的前一版本 V3 亦比美國的大型語言模型能力略勝一籌。DeepSeek 的能力震驚業界不是焦點,重點是其超低的訓練成本,聲稱僅 558 萬美元完成,顛覆矽谷花上十億計美元重金訓練最新模型,甚至令美國 AI 界感到威脅。DeepSeek 突然冒起,成功之道或在於用人策略。

    Meta 投資 600 億美元建新 AI 數據中心 不敵 600 萬美元成本的 DeepSeek

    美國的 AI 投資一浪接一浪,繼 Stargate 四年投資 5,000 億美元之後,Facebook 母公司 Meta 也加注,計畫在今年內小注投資 600 億美元建立一個擁有 130 萬顆 GPU 的大型 AI 數據中心。不過,發出這消息卻不對時機,因為 DeepSeek 釋出的 DeepSeek- R1表現勝過 Llama,同時訓練成本只是約 600 萬美元,更把 Meta 團隊嚇壞,表明擔心快將發布的 Llama AI 版本可能無法比上 DeepSeek。

    網絡安全│錯誤資訊與虛假訊息 蟬聯十大風險之首

    世界經濟論壇(WEF)發表的《 2025 年全球風險報告》揭示,錯誤資訊和網絡間諜戰成為短期內十大風險中的領頭羊。其中,「錯誤資訊與假訊息」已連續兩年位列入短期十大風險之首。

    最新文章

    不讓 DeepSeek 搶風頭 阿里雲宣稱新版通義千問更強勁

    1 月 29 日正值農曆年初一,也是中國新春假期,阿里巴巴旗下阿里雲一反常態選在假日於微信發布通義千問旗艦版模型 Qwen2.5-Max,並宣稱該模型版本性能超越 DeepSeek-V3。此舉顯示了 DeepSeek 的快速冒起不單震撼美國 AI 界,對中國的競爭對手也帶來極大壓力。