更多

    LLM

    Top 10 大型語言模型 Google 完勝 OpenAI 靠名聲排梗頸四

    Forrester 對全球頂級的 LLM 做了審查、評分及排名,早前發布了《 The Forrester Wave™: AI Foundation Models For Language, Q2 2024 》報告,按排位有點出乎意料之外,香港人熟識又是帶起 AI 熱潮的 OpenAI ChatGPT-4 只能拿下第四位,榜首由 Google Gemini 取得。

    Meta Llama 影響力研究獎金計劃 花 200 萬美元尋求創新應用 

    Facebook 母公司 Meta 擁有大型語言模型 Llama,最新版本已發展至 3.1 。不過,在研究機構 Forrester 的最新報告卻未能打進世界十大大型語言模型。為爭取更多應用、啟發更多基於 Llama 的創新方案,Meta 推出新一輪 Llama 3.1 影響力獎金計劃,獎金總值 200 萬美元,有關計劃已接受申請。

    商湯日日新有 4.0 新版本 辦公小浣熊分析數據一問即答

    商湯科技宣布「日日新 SenseNova」推出 4.0 新版本。官方指其知識更全面、推理能力更高,而且生成能力更強,同時支持跨模態互換。其中,該公司更基於新發布的商量大語言模型 Function call & Assistants API 開發了數據分析工具「辦公小浣熊」。

    商湯開源大型語言模型 InternLM2 一次可讀 30 萬中文字

    商湯科技( SenseTime )發布新一代大型語言模型 InternLM2 (書生·浦語 2.0),並繼續開源提供免費商用授權。 InternLM2 包含 7B 及 20B 兩種參數規格及基座、對話等版本,支援 20 萬 tokens 的上下文,能夠一次過接受及處理約 30 萬中文字。

    微軟 GitHub 開源 DeepSpeed Chat 簡化訓練類似 ChatGPT 千億級模型

    訓練 GPT 般大型語言模型的時間和資金成本極高,並非一般人和企業可負擔。微軟在 GitHub 開源 DeepSpeed Chat,將千億級大型模型的訓練成本和花費時間驟降 15 倍。以 1,750 億參數模型為例,在 Azure 上 64x NVIDIA A100 GPU 可在 20 小時完成訓練,花費約 5,120 美元。

    呼籲暫停 AI 開發卻大手購入 GPU Elon Musk 據報在 Twitter 成立部門發展 LLM

    早前 Elon Musk 聯同其他科技界名人,一同聯署呼籲發展 AI 的科企應暫停開發 6 個月,商議如何規範 AI 開發。不過這位前首富似乎另有一份劇本。據 Business Insider 報道,Elon Musk 在控制 Twitter 的 X Corp 成立了個 AI 開發專案部門,並且大手購入約 10,000 張 GPU,準備發展大型語言模型。

    乘 AIGC 熱潮再出擊 Facebook 發表 LLaMA 大語言模型

    Facebook 前年改名 Meta 發展元宇宙事業,投入大量資金還未見成果。但近日科技界轉軚,紛紛投資到人工智能生成內容 AIGC,Meta 也要展示他們也在那方面的能力,發表具備 650 億個參數的大語言模型 LLaMA。

    最新文章

    AFEELA 引入 Zoom 視像會議服務 或實現邊無人駕駛邊開會

    日本兩大巨頭 Sony 及 Honda 組成的 Sony Honda Mobility,其首款電動車 AFEELA 預計將於 2025 年上半年開始接受預訂,雖然仍未試到真車,但已有公司承諾合作,就是視像會議龍頭的 Zoom,究竟 AFEELA 電動車如何跟 Zoom 扯上關係呢?