奧丁科技希望基于自研的硬件、軟件、算法和AI等綜合能力,讓數字人更加逼真和智能,并通過仿生學和人類學研究不斷降低成本,增加產能,完成超寫實數字人的普及。
作者|黃澤正
這是新聲Pro「虛實之間」系列文章第8篇
在當前大熱的元宇宙話題下,數字人似乎也成為了焦點。究其原因,在過往的PC互聯網和移動互聯網時代,主要的信息載體是圖片、文字,因此交互方式以電腦鼠標和手機觸屏為主,但這種交互方式與人真實的交互習慣相去甚遠。
奧丁數字人歌手
而如果將數字人視作新一代交互載體,其以語言、聲音和動態的三維視頻圖像為主的交互方式,無疑更接近真人,也契合了元宇宙顛覆移動互聯網的設想。
但另一方面,顛覆性的想象意味著前所未有的難度。當前的數字人賽道看似風光無限,但從呈現效果、制作周期、制作成本等多個角度,數字人好看的皮囊,以及「智慧」程度都還遠未達到「元宇宙人」的級別。
「新聲Pro」找到了為某衛視綜藝節目虛擬藝人提供數字化服飾技術的團隊,面對尚處野蠻生長的市場和眾多概念公司,奧丁科技一直基于自研的硬件、軟件、算法和AI等綜合能力,讓數字人更加逼真和智能,并通過仿生學和人類學研究不斷降低成本,增加產能,完成超寫實數字人的普及。公司經過2年多的研發,正式推出了奧丁數字智慧人。
奧丁科技數字人Yola
奧丁科技業務負責人張玥說:「某種程度上奧丁科技算是個異類,因為我們不習慣按行業原有的方向前進,而更希望通過自身數字人底層技術的突破,成為整個行業的破局者,真正地為元宇宙造仿生學智慧人。」奧丁的名字也是借鑒了北歐神話中眾神之父奧丁賦予人類生命和靈魂之意。
不趕風口,只講需求
一方面,現在的數字人與元宇宙似乎呈現綁定關系,眾多從業者及投資人紛紛跑步入場,唯恐錯失良機。一時間做數字人不提元宇宙者,頗有與時代脫節之嫌。
但另一方面,需要明確的是,元宇宙代表的是對未來美好愿景的集合,其中所涉及到的VR&AR、AI、引擎、動作捕捉、3D仿真等諸多先進技術,即使沒有元宇宙的概念,也會穩步向前發展,數字人技術便是其中典型。
張玥表示,奧丁科技團隊已經在這個領域投入科研2年多,并不是盲目追逐元宇宙的風口,公司對數字人一直保持著底層技術的研究,已經掃描制作完成上百個數字人模型,其中還包含諸多明星。
數字藝人復原
根據奧丁科技的觀察,市場對數字人有很大需求,而且需求長期存在。
市場研究機構量子位發布的《虛擬數字人深度產業報告》指出,預測到2030年,中國虛擬數字人整體市場規模將達到2700億元。
首先在傳統的游戲領域,作為目前數字人應用最多的場景,在游戲中數字人可以作為游戲角色存在,或擔任游戲NPC,對玩家完成任務指引,提升玩家游戲體驗感。而跳脫出游戲范疇,在其他領域,數字人也有廣泛的應用場景。
以服務型數字人為例,大體可分為虛擬偶像,虛擬主播,虛擬導覽三大類。其中虛擬偶像可以服務于音樂、影視、MCN機構,生產優質內容;虛擬主播則可應用于電商、短視頻、游戲直播等領域,創造經濟效益;虛擬導覽則可用于政府代言,虛擬導覽,提供便民服務。
虛擬手語主播
但旺盛的市場需求背后,是貧瘠的數字人生產能力。
在加盟奧丁科技之前,張玥曾擔任文投控股(成龍耀萊文化)總經理,并主導并購了世界第三大特效公司Framestore。20年來對公司戰略,市場和運營管理的經驗,以及豐富的海外工作背景,讓張玥對影視特效、游戲以及AI的新動向非常敏感。
她發現如果以傳統的電影特效制作數字人,制作過程需要用CG技術一點點精雕,雖然呈現效果優質,但數字人的制作成本非常高昂,好萊塢有時一秒鏡頭可能耗資就在百萬美元,而且制作周期很長。
既然市場存在需求,且現有的技術方案無法解決,自然意味著更大的發展前景。
技術極客
在決定進入數字人市場后,奧丁科技很快確定了公司發展的方向:分階段「做表演級的數字智慧永生人。」
第一目標是數字人先能表演,不僅要在皮膚、頭發、衣著等外表上與真人形似,還應該能通過一顰一笑、傷心流淚等表情傳遞情緒,達到神似的效果。而且整個生產過程應該又好又快,最終達到可批量化生產超寫實數字人。
奧丁國風數字人表演
第二目標是整合多種技術實現數字人的智慧,由AI學習系統、腦科學和語言聲音系統共同完成。最終目標則是數字永生,也就是賦予未來的數字人「靈魂」,讓其擁有性格與思維,并可以自我進化。
在當前數字人市場上,以單點打爆做IP營銷者有之,也不乏批量化生產較為粗糙的二次元虛擬形象者。但如奧丁科技定位在生產超寫實數字人,同時要兼顧產能和效率的公司,其實并不多見。
奧丁科技首席技術官 Grissom介紹說:「我們做事方式很獨特,因為我們不會覺得行業都這么做,就應該如此。對奧丁科技來說,不僅要把數字人做好,還應該以技術極客的方式做好。」
奧丁科技技術極客的風格與其團隊構成有很大的關系。
奧丁科技身后有兩位參與創辦公司的天使投資人,一位是華文創投的創始人姜山,有20年互聯網科技和文娛產業經驗,堅持以科技與內容為核心,圍繞年輕人未來娛樂消費場景投資,孵化新物種新模式;另一位是智慧基石創始人雷鳴,是百度七劍客之一,北大人工智能創新中心主任,一直致力于AI領域研究。同時奧丁科技的產品負責人Grissom是做游戲出身,曾擔任過Gamebryo引擎的亞洲區技術支持,也做過硬件和驅動技術,擁有綜合的技術能力。
奧丁科技自研多款應用工具
據「新聲Pro」了解,目前奧丁科技的團隊規模在50人左右,其中研發人員占比在90%以上。
奧丁科技首席技術官 Grissom表示,公司在搭建團隊時,所挑選的都是各方面的尖端人才,所涉及的面也很廣泛。既有做電影特效出身,把握鏡頭和呈現效果的技術人員;還有一部分是IT人才,負責軟件和算法優化;還包括一些硬件公司的人才。「我們從硬件到軟件到算法都有團隊。」
扎實的研發團隊,讓奧丁科技科技可以通過技術革新,解決大量數字人市場上存在的困局。
在最直觀的靜態呈現方面,當前數字人的呈現效果并不理想,尤其是在對真人的還原上,大部分還是偏重于二次元風格的設計。
以數字人的面部效果為例,原本要達到影視級的皮膚、毛孔細節,需要藝術家花費大量時間進行雕刻。而奧丁科技則可以通過畫面捕捉、體感控制及畫面渲染技術,還原數字人面部的各個細節,讓數字人纖毫畢現。
奧丁數字人面部細節
在具體操作步驟上:奧丁技術團隊會使用自研的硬件設備,配合數據采集手段完成數據掃描,之后結合數據處理系統,和深度學習的算法,還原數字人皮膚和毛孔細節。保證生產的數字人模型在拉到近景特寫后,毛孔和皮膚紋理等細節都可以真實還原。據悉,奧丁科技的3D數字資產積累已經達到了十幾T,在行業內是極為少見的。
除了靜態呈現,數字人還面臨著另一個更高維度的技術難題:無法做到對真人表情的還原,從而傳遞情感。即便是由Epic出品的全球頂尖虛擬形象生成軟件Metahuman,其所制作的數字人也無法傳達微表情。
Grissom表示,在經過詳盡的市場調研后,他發現市場上主流做數字人表情的思路,都是「最終呈現」。也就是說觀眾看到的只是一個單純的笑容,或者流淚表情,而并不是一個從不笑到笑,從不哭到哭的動態過程。但在現實情況中,人的情感波動再由表情傳達,必定是一個動態變化的過程。
因此奧丁的思路是還原表情的變化過程。為此團隊推出了「表情方案+表情驅動」的解決方案。
通過自主研發的硬件設備,微表情級別的數字人面部捕捉系統,配合綁定系統以及面部驅動方案,奧丁科技可以讓數字人表情還原度超過90%,且具有一定的表演能力。
匹配應用場景
張玥表示,「數字人市場有很大的想象空間,在完成一定的技術積淀后,奧丁科技希望將成熟的技術匹配到更大的應用場景,同時研發新技術,去引領應用場景走向新階段,最終由TO B走向To C,這個戰略公司會長期堅持。」
在當前階段,奧丁科技技術的主要應用場景,還是在服務B端客戶。
據「新聲Pro」了解,目前奧丁科技已經與多位行業客戶進行合作,包含影視、電競、音樂、動畫、電商、短視頻、直播、綜藝、文旅、奢侈品等。比如為影星克拉拉打造了完整的面部、肢體、表情等全部數字人資產;為《前沿訪談》打造商業大佬們的數字分身;數字服裝潮牌;為NFT產品提供虛擬場景。
奧丁科技首席技術官 Grissom透露,在為某衛視綜藝節目虛擬人制作全套服裝時,由于需要配合節目的錄制檔期,同時還要在錄制現場虛擬人和眾多真人明星完成互動,對時間要求非常迫切。最終的結果來看,奧丁的數字化服裝和綁定的呈現效果收獲了眾多好評,傳統的虛擬人制作公司需要3月的時間,而奧丁利用自己的材質硬件設備開發周期僅在1周左右,并用于直播,完成了客戶緊急要求,這些都離不開奧丁科技在技術端的創新。
姜山、吳歷華數字替身出現在 EDG 電競節目中
當前階段,數字人在進行模型制作和數據采集時,主流方案還是大量采購單反相機組成3D矩陣,輔以人工大量修復,這樣的操作流程無疑需要更高的時間成本和人力成本。而奧丁科技通過自研的虛擬技術系統,讓數字內容在研究、制作、使用等各個環節變得更加規范,可以通過標準化操作提升效率。
Grissom表示,由于整個公司90%都是技術極客,因此做事的方式就是會把任何一個重復的勞動變成程序化操作,「只要是電腦能干的事我們就絕對不用人工。」同時內部有一套自己的工作流程,除了人工處理數據修復的部分,團隊在平時就會大量去做內部的工具,因此團隊的執行能力和生產效率都很高。
除此之外,奧丁團隊還對接了工業生產中服裝建模的流程,可以完成工業級別的服裝仿真結算。相比于傳統的3D建模軟件,對接工業設計模型既能讓數字人服裝的物理真實度更佳,也能使服裝生產效率得到提升。
服裝布料系統
張玥認為,盡管目前公司以服務行業客戶為主,但根據不斷升級的技術能力和奧丁對數字人四個階段的規劃,公司未來會進入更廣大的C端市場,真正完成數字人的普及和生長。當前公司擁有的多項硬件與軟件知識產權;可服務于AI深度學習的3D數字資產;影視級面部及身體動作捕捉系統等一系列技術優勢,都將繼續迭代,以數字人為入口,面向下一代高互動性的VR內容。
關鍵詞: 奧丁科技為元宇宙造智慧人|虛實之間