在今年的江蘇衛(wèi)視跨年晚會上,周深與數(shù)字人“鄧麗君”跨時空合唱《大魚》刷屏,展現(xiàn)出數(shù)字人的眾多可能性。日前,在以數(shù)字人為主題的百度科技沙龍“AI呀,我去!”
上,百度智能云AI人機交互實驗室負責人李士巖表示:“我們近兩年的奮斗目標是,通過百度智能云曦靈平臺的開放,讓每個人實現(xiàn)數(shù)字人自由。”
目前,數(shù)字人經(jīng)歷了以“紙片人”為代表的1.0階段、以Vtuber主播為代表的2.0時代,已進化至3.0階段,具備模型高精、人工智能驅(qū)動特點的數(shù)字人3.0成為行業(yè)主流。據(jù)李士巖介紹,
“百度智能云曦靈數(shù)字人平臺”具有全場景、一站式、平臺化的特點,能滿足從最初數(shù)字人形象定制、人設(shè)管理再到業(yè)務(wù)編排、內(nèi)容創(chuàng)作,最后到多種驅(qū)動模式下與用戶互動的全部需求,
這也意味著在一個平臺上即可實現(xiàn)數(shù)字人的全鏈路調(diào)優(yōu),從而使效果達到最好。
李士巖以數(shù)字人生成環(huán)節(jié)為例,演示了百度智能云曦靈平臺的功能。用戶在百度智能云曦靈平臺上傳一張照片,就能快速生成一個可被AI驅(qū)動的2D數(shù)字人像,
以前需要兩三個月時間做出來的3D數(shù)字人,現(xiàn)在可以壓縮到小時級,同時還可以通過一句話語音描述或簡單捏臉等多種形式快速生成數(shù)字人。數(shù)字人個性化功能開發(fā)也較之前更加完善,
以百度剛剛發(fā)布的3D寫實口語數(shù)字人為例,
其口型合成準確率高達98.5%。
在技術(shù)催生的數(shù)字人3.0階段,虛擬人可與不同行業(yè)產(chǎn)生更緊密的融合。基于市場使用場景,數(shù)字人可以分為演藝型數(shù)字人、服務(wù)型數(shù)字人兩類。演藝型數(shù)字人包括虛擬主播、
虛擬偶像以及數(shù)字孿生的虛擬品牌代言人。目前百度已經(jīng)打造了AI手語主播、央視網(wǎng)虛擬主持人小C、航天局火星車數(shù)字人祝融號、百度虛擬代言人希加加、百度APP代言人龔俊數(shù)字人。
服務(wù)型數(shù)字人包括數(shù)字員工、虛擬員工、虛擬業(yè)務(wù)員等,可以幫助金融、運營商、政府、零售等行業(yè)提供基于數(shù)字人的新一代客戶服務(wù)能力,解決排隊長、回應慢、人力成本高等問題。
目前,百度已經(jīng)和浦發(fā)銀行、光大銀行、中國聯(lián)通合作,推出了一對一服務(wù)型數(shù)字人。
李士巖表示,數(shù)字人產(chǎn)業(yè)有三大核心推動力,一是用戶需求與技術(shù)升級,二是政策支持與資本涌入,三是計算平臺的迭代。
百度在數(shù)字人技術(shù)上的突破也得益于其在行業(yè)內(nèi)的持續(xù)布局。早在2019年,百度就開始了“虛擬數(shù)字人戰(zhàn)略”。基于多年的AI技術(shù)沉淀,AI能力已成為百度智能云曦靈平臺的核心能力,
現(xiàn)在百度也在把這種能力開放給外界。