AI 成生圖像技術進步神速,成為考驗大型模型的指標之一。 Stable Diffusion 、 Midjourney 由 prompt 指示,不過要使用英文關鍵字。商湯由「日日新」支援的「秒畫」,讓用戶用中文關鍵字生成圖片,還可用少量圖片訓練風格。在商湯技術交流日測試「秒畫」,以百度「文心一言」出現過的蝦碌指令,「秒畫」卻能生成較情理之中的圖像。
「秒畫」展現光影真實、細節豐富、風格多變文字生成圖像能力,支援生成 6K 高清圖片。商湯科技行政總裁徐立稱,「秒畫」推理速度快,用單張 A100 GPU 執行可快至 2 秒生成 512K 解像度圖片。
客戶還可按需要訓練模型生成圖像。徐立指,僅用 20 張圖片可自訂模型,如用單張 A100 GPU 訓練,只需 5 分鐘便完成自訂的 LoRA 模型。在現場的示範,用 20 張 80 年代香港風格圖片即時訓練,再生成具有「港式風格」的圖像。而企業客戶亦可經 API 連接使用「秒畫」,產生所需要的圖片。
AI 成生圖像先要解讀文字,再按其理解語意生成。商湯技術人員示範時,用上大量關鍵字輔助形容,令圖像生成更準確。百度的「文心一言」生成的圖像被喻為災難級,而「秒畫」用同一指令,卻有意想不到的效果。