商湯發表大型模型「日日新」　快速生成數碼人像影片

美國 OpenAI 的 ChatGPT 將人工智能技術炒熱，中國企業陸續發表同類核心技術的大型模型，如百度的文心一言、華為的盤古、阿里巴巴的通義千問等。最新有商湯公布的日日新（SenseNova），以此作核心發展多項 AI 生成技術，如對話機械人「商量」、圖像的「秒畫」、人像影片的「如影」，以及 3D 場景的「瓊宇」和 3D 物件的「格物」。

日日新的參數有 1,800 億個，規模跟 OpenAI 的 GPT-3 相若。商湯科技董事長、行政總裁徐立指出，大型模型的能力除了考慮參數，還有數據量，所用的運算能力由兩者分配。商湯目前有 27,000 張 GPU 卡，輸出共 5,000 PFLOPS 效能，是現時亞洲最大的智能運算平台之一。日日新為多模態（Multimodel）大型模型，取自《禮記·大學》的「苟日新、日日新、又日新」，希望在模型的迭代速度及處理問題的能力上可以日日更新，解鎖 AGI 更多可能。」

商湯同時發表多項 AI 生成服務，源自日日新技術，其中被喻為 ChatGPT 對手的對話機械人「商量」。這服務強調考慮中文語境，可做多輪對話，能理解和處理中文文本。在發布會現場的示範中，徐立指示「商量」生成技術日的邀請函，並對產生的內容作修改。「商量」又可閱讀大量文章回答問題，示範上載《中華人民共和國專利法》給「商量」分析，提取訊息、撮寫，然後回答關於專利的問題，並引用相關條文。

「商量」具有多輪對話能力，用醫療行業作示範。將「商量」化身醫生問診，能根據病人回答的初步病徵，追問幾次釐清病情，給出治療建議。

「商量」亦具有編程助手能力，可以生成程式碼、注解程式碼、修正除蟲、產生測試數據等。徐立指出，將來編程式是二八定律，大部分由 AI 生成，引用公司內部測試，編程效率提升 62% 。

由日日新模型支援多項 AI 生成服務，例如「秒畫」由關鍵字生成圖片，支援 6K 高清圖像，還可根據企業客的需要訓練生成風格。

另外，數碼人像影片生成平台「如影」先由用戶拍攝一段 5 分鐘的真人短片素材，給日日新學習，能夠產生聲音及動作自然、口型準確的數碼分身。然後利用分身製作影片，先輸入題目，由日日新生成讀稿，再選定語言。日日新可將文字翻譯成不同語言，再生成影片，由數碼人像生動地演譯文稿。然而，「如影」涉及主播等法例問題有待解決，預計 4 月內可在中國推出。

「如影」用 5 分鐘真人影片，生成動作、口型、聲音準確的數碼人像影片，模仿真人介紹產品，甚至轉換多種語言。

「瓊宇」和「格物」用於生成 3D 模型。前者以低成本生成大規模 3D 場景，而且模型細緻度高。後者建立物件的 3D 模型，能將結構複雜的物件、光照復刻，亦還原材料質。這兩項服務配搭使用，能建立出 3D 地圖、數碼分身、元宇宙等虛擬世界。

商湯還利用日日新和 AI 大裝置向企業提供 API 和模型即服務（Model-as-a-Service），加速運用數據和 AI ：

用大型預先訓練模型自動化標籤數據，較人手標籤提升百倍效率。
在大型預先訓練模型上自訂模型，加入個別行業獨特的數據和要求。
模型推理部署服務，將大型模型推理效率提高逾 100%，降低用模型提供服務的成本。
向行業開發人員開放預先訓練模型及 AI 開發工具，加速企業客戶開發效率。

商湯科技首席科學家王曉剛補充，大型模型有助推動各行業發展，同時也輔助模型進步，例如不同行業用更多數據訓練和互動，所產生不同的 AI 用途，形成迴圈。商湯亦會運用日日新推動自動駕駛，如標籤環境數據、生成難得一見的道路圖片供識別等。

商湯發表大型模型「日日新」　快速生成數碼人像影片

華為下月傳交付新 GPU 晶片　黐埋兩粒昇騰 910B 效能撼 NVIDIA H100

華府加辣 H20 GPU 限制出口 NVIDIA 或損 55 億美元股價再暴挫

睇大阪博覽要注意！東京大阪有假基站發送釣魚詐騙

您會感興趣的內容

相關文章

商湯發表大型模型「日日新」 快速生成數碼人像影片

您會感興趣的內容

相關文章

商湯發表大型模型「日日新」　快速生成數碼人像影片