更多

    商湯發表大型模型「日日新」 快速生成數碼人像影片

    Eric Chong
    Eric Chong
    商業・科技・創業・編輯

    美國 OpenAI 的 ChatGPT 將人工智能技術炒熱,中國企業陸續發表同類核心技術的大型模型,如百度的文心一言、華為的盤古、阿里巴巴的通義千問等。最新有商湯公布的日日新(SenseNova),以此作核心發展多項 AI 生成技術,如對話機械人「商量」、圖像的「秒畫」​​、人像影片的「如影」,以及 3D 場景的「瓊宇」​​和 3D 物件的「格物」。

    日日新的參數有 1,800 億個,規模跟 OpenAI 的 GPT-3 相若。商湯科技董事長、行政總裁徐立​​指出,大型模型的能力除了考慮參數,還有數據量,所用的運算能力由兩者分配。商湯目前有 27,000 張 GPU 卡,輸出共 5,000 PFLOPS 效能,是現時亞洲最大的智能運算平台之一。​​日日新為多模態(Multimodel)大型模型,取自《禮記·大學》的「苟日新、日日新、又日新」,希望在模型的迭代速度及處理問題的能力上可以日日更新,解鎖 AGI 更多可能。」

    商湯同時發表多項 AI 生成服務,源自日日新技術,其中被喻為 ChatGPT 對手的對話機械人「商量」。這服務強調考慮中文語境,可做多輪對話,能理解和處理中文文本。在發布會現場的示範中,徐立指示「商量」生成技術日的邀請函,並對產生的內容作修改。「商量」又可閱讀大量文章回答問題,示範上載《中華人民共和國專利法》給「商量」分析,提取訊息、撮寫,然後回答關於專利的問題,並引用相關條文。

    「商量」具有多輪對話能力,用醫療行業作示範。將「商量」化身醫生問診,能根據病人回答的初步病徵,追問幾次釐清病情,給出治療建議。

    「商量」亦具有編程助手能力,可以生成程式碼、注解程式碼、修正除蟲、產生測試數據等。徐立指出,將來編程式是二八定律,大部分由 AI 生成,引用公司內部測試,編程效率提升 62% 。

    由日日新模型支援多項 AI 生成服務,例如「秒畫」由關鍵字生成圖片,支援 6K 高清圖像,還可根據企業客的需要訓練生成風格。

    另外,數碼人像影片生成平台「如影」先由用戶拍攝一段 5 分鐘的真人短片素材,給日日新學習,能夠產生聲音及動作自然、口型準確的數碼分身。然後利用分身製作影片,先輸入題目,由日日新生成讀稿,再選定語言。日日新可將文字翻譯成不同語言,再生成影片,由數碼人像生動地演譯文稿。然而,「如影」涉及主播等法例問題有待解決,預計 4 月內可在中國推出。

    「如影」用 5 分鐘真人影片,生成動作、口型、聲音準確的數碼人像影片,模仿真人介紹產品,甚至轉換多種語言。

    「瓊宇」和「格物」用於生成 3D 模型。前者以低成本生成大規模 3D 場景,而且模型細緻度高。後者建立物件的 3D 模型,能將結構複雜的物件、光照復刻,亦還原材料質。這兩項服務配搭使用,能建立出 3D 地圖、數碼分身、元宇宙等虛擬世界。

    商湯還利用日日新和 AI 大裝置向企業提供 API 和模型即服務(Model-as-a-Service),加速運用數據和 AI :

    • 用大型預先訓練模型自動化標籤數據,較人手標籤提升百倍效率。
    • 在大型預先訓練模型上自訂模型,加入個別行業獨特的數據和要求。
    • 模型推理部署服務,將大型模型推理效率提高逾 100%,降低用模型提供服務的成本。
    • 向行業開發人員開放預先訓練模型及 AI 開發工具,加速企業客戶開發效率。

    商湯科技首席科學家王曉剛補充,大型模型有助推動各行業發展,同時也輔助模型進步,例如不同行業用更多數據訓練和互動,所產生不同的 AI 用途,形成迴圈。商湯亦會運用日日新推動自動駕駛,如標籤環境數據、生成難得一見的道路圖片供識別等。

    您會感興趣的內容

    相關文章