LLM

AI 大戰│沒有最快只有更快　Inception Labs dLLM 擊倒 DeepSeek？

2025-02-28

Inception Labs 推出首個大規模擴散式語言模型（dLLM）Mercury Coder。跟傳統的順序生成式大型語言模型（LLMs）不同，Mercury Coder 使用擴散方法、由粗到細同時處理整個序列，類似人工智能圖像和視頻生成，所以 Inception Labs 聲稱該模型的運行速度達到現有模型的十倍，且成本顯著降低。

初創企業

中國 AI 六小虎│零一萬物最多是非

2025-01-15

由創新工場董事長兼 CEO 李開復創辦的 AI 2.0（零一萬物），在中國 AI 六小虎中引起許多爭議。成立初期，該公司遭指控抄襲，並在 2025 年初傳出將團隊出售給阿里巴巴的消息。面對這些傳言，李開復最終成功平息風波，他強調：「2025 年是中國大模型的考驗與應用爆發之年，也是商業化洗牌年，大家應該專注於真正重要的事情。」

產品及服務

Top 10 大型語言模型 Google 完勝　OpenAI 靠名聲排梗頸四

2024-08-08

Forrester 對全球頂級的 LLM 做了審查、評分及排名，早前發布了《 The Forrester Wave™: AI Foundation Models For Language, Q2 2024 》報告，按排位有點出乎意料之外，香港人熟識又是帶起 AI 熱潮的 OpenAI ChatGPT-4 只能拿下第四位，榜首由 Google Gemini 取得。

初創企業

Meta Llama 影響力研究獎金計劃　花 200 萬美元尋求創新應用　

2024-08-06

Facebook 母公司 Meta 擁有大型語言模型 Llama，最新版本已發展至 3.1 。不過，在研究機構 Forrester 的最新報告卻未能打進世界十大大型語言模型。為爭取更多應用、啟發更多基於 Llama 的創新方案，Meta 推出新一輪 Llama 3.1 影響力獎金計劃，獎金總值 200 萬美元，有關計劃已接受申請。

趨勢分析

商湯日日新有 4.0 新版本　辦公小浣熊分析數據一問即答

2024-02-02

商湯科技宣布「日日新 SenseNova」推出 4.0 新版本。官方指其知識更全面、推理能力更高，而且生成能力更強，同時支持跨模態互換。其中，該公司更基於新發布的商量大語言模型 Function call & Assistants API 開發了數據分析工具「辦公小浣熊」。

趨勢分析

商湯開源大型語言模型 InternLM2　一次可讀 30 萬中文字

2024-01-17

商湯科技（ SenseTime ）發布新一代大型語言模型 InternLM2 （書生·浦語 2.0），並繼續開源提供免費商用授權。 InternLM2 包含 7B 及 20B 兩種參數規格及基座、對話等版本，支援 20 萬 tokens 的上下文，能夠一次過接受及處理約 30 萬中文字。

微軟 GitHub 開源 DeepSpeed Chat　簡化訓練類似 ChatGPT 千億級模型

2023-04-15

訓練 GPT 般大型語言模型的時間和資金成本極高，並非一般人和企業可負擔。微軟在 GitHub 開源 DeepSpeed Chat，將千億級大型模型的訓練成本和花費時間驟降 15 倍。以 1,750 億參數模型為例，在 Azure 上 64x NVIDIA A100 GPU 可在 20 小時完成訓練，花費約 5,120 美元。

呼籲暫停 AI 開發卻大手購入 GPU　Elon Musk 據報在 Twitter 成立部門發展 LLM

2023-04-12

早前 Elon Musk 聯同其他科技界名人，一同聯署呼籲發展 AI 的科企應暫停開發 6 個月，商議如何規範 AI 開發。不過這位前首富似乎另有一份劇本。據 Business Insider 報道，Elon Musk 在控制 Twitter 的 X Corp 成立了個 AI 開發專案部門，並且大手購入約 10,000 張 GPU，準備發展大型語言模型。

科技新聞

LLM

AI 大戰│沒有最快只有更快　Inception Labs dLLM 擊倒 DeepSeek？

中國 AI 六小虎│零一萬物最多是非

Top 10 大型語言模型 Google 完勝　OpenAI 靠名聲排梗頸四

Meta Llama 影響力研究獎金計劃　花 200 萬美元尋求創新應用

商湯日日新有 4.0 新版本　辦公小浣熊分析數據一問即答

商湯開源大型語言模型 InternLM2　一次可讀 30 萬中文字

微軟 GitHub 開源 DeepSpeed Chat　簡化訓練類似 ChatGPT 千億級模型

呼籲暫停 AI 開發卻大手購入 GPU　Elon Musk 據報在 Twitter 成立部門發展 LLM

乘 AIGC 熱潮再出擊　Facebook 發表 LLaMA 大語言模型

最新文章

iOS 18.5 更新・iPhone 非官方電池更換會變「二手機」?

免費最貴？商場泊車優惠裝 App 前議員稱擾民　網民各有見解

現代淘金熱・WD 從廢棄硬碟回收稀土及貴金屬

原來 Google 眼鏡已進化到如此厲害・Android XR 首次在 TED 公開示範

【場料】再有 PCIe 5.0 SSD　Kingston 15,000 速 4TB 抵場