上傳一張照片,就可以擁有自己的動漫形象?
現在一個名為 “Toonify yourself”的 AI 工具就可以辦到,而且效果非常逼真。
秒變“迪士尼在逃公主”,這款一鍵切換“漫畫臉”AI,因效果太過逼真徹底火了!
最近,熱映的真人版《花木蘭》,在國外又掀起了一股動漫風!各種名人漫畫形象頻頻刷屏,比如這張宮崎駿老爺爺,可可愛愛的形象完全可以出演動漫電影了。
還有這張演員楊紫瓊的動漫形象,大眼、瘦臉完全具備了動漫角色的典型特征。
更重要的是幾乎復刻了真人的原始狀態,包括頭發、面部表情、神態,妥妥地定制化動漫形象。
這些動漫形象全部出自一個名為 “Toonify yourself”的 AI 工具。它不僅呈現出效果逼真,操作起來還非常簡單,只需在模型中上傳一張照片即可!
據了解,這款工具剛剛發布就完成了 25 萬次服務,非常受用戶歡迎,還有網友評論稱:研發者可以考慮考慮商業化的問題了。
那么,這款工具是如何實現的呢?
生成漫畫臉的技術原理
據它的創建者之一 Doron Adler 介紹稱,該工具主要利用了混合網絡(Blended Network),這是一個復雜的網絡機制,主要由于兩部分模型來完成:StyleGAN Model 和 Blended Model。
其中,StyleGAN Model 負責對初始照片進行預訓練,其目的是節省訓練的時間和成本,因為對于個人而言,并不是每個人都有足夠的 CPU 或者數周的時間進行數據訓練,這個過程也被成為 “轉移學習(Transfer learning)“。
重要的是,通過預訓練模型,可以得到更高質量的圖像。
Doron 介紹稱,為了達到更好的動漫效果,他們收集了迪士尼 / 皮克斯 / 夢工廠等大約 300 張動漫圖像作為數據集。
通過對數據集進行訓練來學習動漫角色的典型特征。從以下輸出結果來看,效果還是非常不錯的。
盡管對數據集進行了少量的訓練,但大眼、瘦臉等典型特征都能很好的捕捉到。其中部分圖像比較模糊,是因為原始圖像的分辨率比較低,而且有些是手繪圖像造成的。
接下來,經過人臉微調的圖像會進入 Blend Model 的處理階段。
在這里,由于 StyleGAN 的結構,模型中的不同層以不同的方式影響生成人物的外觀。低分辨率層決定頭部姿態和人臉形狀,高分辨率層則控制光線和紋理等細節。
Doron 使用的 Layer Swapping 腳本從原始模型中提取了高分辨率層,從 StyleGAN Model 微調模型中提取低分辨率層,因此,最終得到了具有卡通人臉結構且具備照片級逼真渲染效果的混合模型。
可以看到,使用原始的面孔模型和混合卡通模型生成圖像,兩者之間存在著明顯的聯系,保持了人物的原始面貌,同時也實現了動漫化。(需要強調的是,如果需要高分辨率的卡通形象,則需要輸入高像素的原始圖像,一般不得低于 1024x1024 像素)。
效果逼真,操作簡單,但因太火而下線
StyleGAN 模型可以產生大量人臉圖像,在其中可以找到任何一張人臉的圖像。比如通過該模型輸入一張需要處理的圖像示例,模型會通過 “代碼”(也稱為潛在向量),輸出一個與示例完全匹配的人臉圖像,如下圖左邊為原圖在左邊,右邊邊為生成圖。
然后將具有特定 “代碼”的人臉圖像輸入混合模型,結果就可以得到一個卡通化人臉。
這一過程,輸入示例大致經歷了三步處理過程:
提取面步特征,并自動對齊圖像。
找到潛在代碼,復制圖像。
使用卡通模型的潛在代碼 , 對圖像進行處理。
基于這一原理,用戶只需要在系統中上傳照片即可。不過可惜的是,由于用戶訪問量過大,考慮到服務器的運行成本,Doron 暫時關閉了這一系統的使用入口,并表示重新規劃成本效益后,會再次對外開放。
關于作者
Justin Pinkney 是該工具另一創建者。與 Doron 一樣,Justin 對生成藝術和機器學習非常感興趣。
從他的個人主頁上了解到,Justin 曾是一名物理學家,現在英國 MathWorks 擔任軟件顧問,負責算法開發、模型訓練以及組織軟件開發實踐。
Justin 利用 StyleGAN 模型做過多項研究。比如他通過 StyleGAN Network Blend 讓壁畫上的浮雕秒變人臉圖像。
該項研究同樣是基于 “圖層交換(Layer Swapping)”的概念,將基礎模型與使用轉移學習的模型(即微調模型)融合在一起達到最終的效果。
此外,還有利用神經網絡生成各類虛假蛋糕等。
關鍵詞: