AI 改圖技術又有新突破,由馬克斯普朗克信息學研究所、薩爾布呂肯視覺計算、交互和人工智能研究中心、麻省理工、賓夕法尼亞大學和 Google AR/VR 組成的團隊剛發表了一項名為 DragGAN 的改圖新技術,用戶拖動圖片中任何一點到目標點,就可以改變圖中景物的姿態、形狀、表情和布局。
從官方提供的影片可見,任何人只要拉動圖中的一點(手柄點)並定出目標點及方向,就會根據用戶拉動點的動態和方向,驅動「手柄點」向目標方向移動。同時利用鑒別性的 GAN 特徵,不斷定位手柄點的位置。從而改變獅子頭的方向、令牠張開嘴巴、改變裙的長短、模特兒站立的姿態、車子的款式、甚至改變照片中日出日落位置、讓馬匹由站立變成跑步等,連圖中看不到的東西都可以生成出來,用戶同時可以以繪畫的方式指定改變的影響範圍,用法簡單又神奇。DragGAN 有不同的模型,以針對不同類型物件的變形。
研究人員表示會在 6 月在 GitHub 公開程式碼。AUTOMATIC1111 文生圖社群已經磨拳擦掌,期望這技術可整合到 Stable Diffusion WebUI 平台。