圖片來(lái)源@視覺(jué)中國(guó)

文|AI產(chǎn)業(yè)研究中心

在杭州舉辦的第19屆亞運(yùn)會(huì),剛剛拉下帷幕。如果說(shuō)與往屆亞運(yùn)會(huì)相比,本屆亞運(yùn)會(huì)最大的亮點(diǎn)是什么?那非是數(shù)字人技術(shù)在亞運(yùn)會(huì)期間的廣泛應(yīng)用莫屬。

先是在開(kāi)幕式上,首次出現(xiàn)了“數(shù)字人點(diǎn)火”,由全球超過(guò)1億位線上用戶參與,共同組成的一個(gè)巨大的“數(shù)字火炬手”,如蜻蜓點(diǎn)水般跑過(guò)錢塘江江面,奔進(jìn)主會(huì)場(chǎng),跟現(xiàn)場(chǎng)火炬手一同點(diǎn)燃主火炬,引發(fā)了廣大網(wǎng)友的贊嘆和好奇。

作為人工智能、裸眼3D和現(xiàn)實(shí)增強(qiáng)技術(shù)的完美合體,這一次“數(shù)字人點(diǎn)火”,不僅開(kāi)了大型運(yùn)動(dòng)會(huì)點(diǎn)火儀式數(shù)字化的先例,同時(shí)也讓數(shù)字人技術(shù)成為近期全球業(yè)內(nèi)外各界熱議的話題。

“數(shù)字人”并非新事物,降本增效是“老江湖”

雖說(shuō)近幾年,數(shù)字人才大量出現(xiàn)在人們生活中,但其本身并不是近幾年才出現(xiàn)的新事物。其實(shí),世界上第一個(gè)數(shù)字人問(wèn)世,距今已有近60年了,而且在這幾十年時(shí)間里,它們一直在為我們服務(wù)。

早在上世紀(jì)60年代,波音公司就在飛機(jī)設(shè)計(jì)領(lǐng)域,開(kāi)始使用一款名為“波音人”的數(shù)字人來(lái)充當(dāng)人體工程學(xué)研究的人體模型。“波音人”不僅擁有人類的外形和常見(jiàn)的行為舉止,而且還能在人類設(shè)計(jì)的場(chǎng)景中模擬人的動(dòng)作,甚至能跟外界進(jìn)行交互并生成數(shù)據(jù)?;谶@些數(shù)據(jù),設(shè)計(jì)師們可以對(duì)飛機(jī)駕駛艙設(shè)計(jì)做人體工程優(yōu)化,以便飛行員在駕駛飛機(jī)時(shí),能操縱得更加得心應(yīng)手。

此外,在汽車行業(yè),數(shù)字人也很早就得到了應(yīng)用。其中,很多車企就在汽車碰撞安全測(cè)試中引入了數(shù)字人技術(shù)。比如,豐田汽車就曾經(jīng)開(kāi)發(fā)過(guò)一款人體建模軟件“THUMS”。通過(guò)這款軟件,能夠構(gòu)建出非常接近人類外形、行為和反應(yīng),且具有不同性別、年齡、體型的“數(shù)字人”司機(jī)或乘客。用其做碰撞測(cè)試,不僅能收集到更加全面的信息,還能在確保測(cè)試效率和準(zhǔn)確性的同時(shí),最大限度降低測(cè)試成本。

可見(jiàn),對(duì)于產(chǎn)業(yè)界而言,數(shù)字人本身并不新鮮,真正新鮮的是隨著成熟人工智能技術(shù)的加持,數(shù)字人實(shí)現(xiàn)了智能化。而今天的數(shù)字人,也已經(jīng)從早期的對(duì)于人類外形和行為動(dòng)作的單向模仿,升級(jí)為對(duì)于人類思維模式的模仿、內(nèi)容生成和交互輸出。

今“數(shù)字人”非彼“數(shù)字人”

近兩年,隨著生成式AI技術(shù)的高速發(fā)展和應(yīng)用普及,我們已然走進(jìn)了與數(shù)字人共同生活的時(shí)代。從技術(shù)層面來(lái)講,今天的數(shù)字人跟早期的類似于“波音人”的數(shù)字人相比,還是有很大的區(qū)別的。

波音和豐田所開(kāi)發(fā)的數(shù)字人,基于應(yīng)用角度來(lái)看,只能算是用來(lái)做數(shù)據(jù)采集的模擬人體,頂多算是一種簡(jiǎn)單的人的數(shù)字孿生,說(shuō)是數(shù)字人就顯得有點(diǎn)牽強(qiáng)。

就定義而言,按照中國(guó)人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟發(fā)布的《2020虛擬數(shù)字人白皮書(shū)》中的描述,虛擬數(shù)字人必須要滿足以下三個(gè)標(biāo)準(zhǔn),即一要擁有2D或3D的人類外觀;二要擁有如語(yǔ)言、表情、動(dòng)作等的人類行為;三要擁有人類的思想,比如識(shí)別、交互等能力。

而按照這個(gè)標(biāo)準(zhǔn),像“波音人”、用豐田“THUMS”軟件打造的數(shù)字人,就不能算作數(shù)字人,因?yàn)樗鼈儾粌H沒(méi)有人的外觀和行為,也不能識(shí)別外部環(huán)境且與人交互。而今天的數(shù)字人,則能夠具備逼真人類形象和人工智能。

比如,利用AI語(yǔ)音生成技術(shù)和逼真的表情、動(dòng)作生成技術(shù),能讓數(shù)字人在交流、演講和播報(bào)中更富有表情和感染力,另外通過(guò)大語(yǔ)言模型的加持,也讓數(shù)字人具備了可以根據(jù)用戶留言而給予相應(yīng)回應(yīng)的能力,而“數(shù)字患者”、“數(shù)字健康顧問(wèn)”的出現(xiàn),也讓數(shù)字人能為用戶提供仿真的醫(yī)療場(chǎng)景。

自2022年起,國(guó)內(nèi)很多企業(yè)就已經(jīng)成為智能客服技術(shù)應(yīng)用的“弄潮兒”,開(kāi)始“雇傭”數(shù)字人員工了。當(dāng)你在線跟企業(yè)客服人員溝通,或者登錄企業(yè)線上營(yíng)業(yè)廳,辦理各項(xiàng)業(yè)務(wù)的時(shí)候,在另一邊跟你對(duì)話打交道的,就很有可能是一個(gè)數(shù)字人。

在今年7月舉辦的“2023世界人工智能大會(huì)”期間,上海市經(jīng)信委、上海市產(chǎn)業(yè)技術(shù)創(chuàng)新促進(jìn)會(huì)聯(lián)合深蘭科學(xué)院共同發(fā)布了國(guó)內(nèi)第一份《2023數(shù)字智能產(chǎn)業(yè)系列報(bào)告:個(gè)人數(shù)字化》白皮書(shū)。該白皮書(shū)就提出了數(shù)字人的發(fā)展分為內(nèi)容數(shù)字化、人的數(shù)字化和生命數(shù)字化三個(gè)階段,并從個(gè)人的數(shù)字交互、數(shù)字孿生、數(shù)字存儲(chǔ)這三個(gè)維度,展望了數(shù)字人產(chǎn)業(yè)發(fā)展的前景。

由此可見(jiàn),今天的數(shù)字人產(chǎn)業(yè),儼然已經(jīng)站在了數(shù)字經(jīng)濟(jì)產(chǎn)業(yè)舞臺(tái)的C位。

近階段爆火的“數(shù)字人”,你都知道哪些?

在AI科技迅速發(fā)展的大環(huán)境下,數(shù)字人作為典型代表產(chǎn)物,其商業(yè)化也進(jìn)入了快車道,眾多科技企業(yè)紛紛入局。根據(jù)企查查數(shù)據(jù)顯示,目前國(guó)內(nèi)與數(shù)字人產(chǎn)業(yè)相關(guān)的企業(yè),數(shù)以十萬(wàn)計(jì)。產(chǎn)品大致可以按應(yīng)用、技術(shù)、呈現(xiàn)方式三個(gè)層面劃分,總計(jì)七大類;如按屬性劃分,則可分為

從應(yīng)用層面,數(shù)字人主要分為服務(wù)型、表演型和身份型三大類。

其中服務(wù)型數(shù)字人強(qiáng)調(diào)的是功能屬性,主要是為大眾提供各種服務(wù),如虛擬客服、主播、導(dǎo)游等,也包括具有陪伴、關(guān)懷價(jià)值的虛擬助理、顧問(wèn)等,基本面向B端客戶,主要起降本增效、助力營(yíng)銷的作用。

如2022年,商湯科技為寧波銀行專門打造的數(shù)字員工“小寧”,就屬于這一類數(shù)字人。據(jù)介紹,“小寧“是基于商湯原創(chuàng)的“虛擬IP解決方案”及多種領(lǐng)先的AI技術(shù)打造的,可以自主從事直播、運(yùn)營(yíng)及互動(dòng),實(shí)現(xiàn)了全天候的“用戶觸達(dá)”。而深蘭科技為武漢江漢路步行街智慧化升級(jí)項(xiàng)目打造的數(shù)字主理人“江妮”也屬于這一類。

表演型數(shù)字人強(qiáng)調(diào)的是偶像屬性,當(dāng)前主要是被應(yīng)用在娛樂(lè)、社交、辦公場(chǎng)景中,如各類虛擬偶像、明星虛擬分身等,相較于服務(wù)型數(shù)字人,其更具流量吸引力和商業(yè)想象空間。

在今年大年初一《廣東衛(wèi)視春節(jié)晚會(huì)》上,與鐘鎮(zhèn)濤、炎明熹一同演唱歌曲《財(cái)神到》的陳水若,就是基于AI平臺(tái)“小冰框架”生成的一位擅長(zhǎng)中國(guó)風(fēng)曲目的AI數(shù)字歌手。

而身份型數(shù)字人則是強(qiáng)調(diào)身份屬性,即現(xiàn)實(shí)世界中的“真人”在虛擬空間、元宇宙中的ID,也被稱為個(gè)人數(shù)字分身。不同于前兩種數(shù)字人,身份型數(shù)字人主要面向個(gè)人用戶,其瞄準(zhǔn)的也是最具市場(chǎng)想象力的個(gè)人數(shù)字化產(chǎn)業(yè),當(dāng)前主要用于社交、辦公等場(chǎng)景,未來(lái)具有廣闊的應(yīng)用場(chǎng)景和發(fā)展前景。

在前不久召開(kāi)的“ 2023‘科創(chuàng)的力量‘無(wú)疆首屆高新科技產(chǎn)業(yè)資本峰會(huì)”上,宣布在全國(guó)范圍內(nèi)招募合伙人的“深蘭硅基大腦SaaS平臺(tái)”,就是深蘭科技基于硅基知識(shí)大模型開(kāi)發(fā)的一款服務(wù)于個(gè)人數(shù)字化的數(shù)字人生成產(chǎn)品,它可以記錄個(gè)人的日常數(shù)據(jù),并用于數(shù)字人的領(lǐng)域知識(shí)和個(gè)性化人設(shè)等高維定制化訓(xùn)練。用戶通過(guò)該平臺(tái)快速構(gòu)建的ChatGPT級(jí)別AI數(shù)字人,就屬于身份型數(shù)字人。

從技術(shù)層面,數(shù)字人則可以分為真人驅(qū)動(dòng)型和智能驅(qū)動(dòng)型兩大類。

真人驅(qū)動(dòng)型數(shù)字人是采用“CG建模+真人動(dòng)作捕捉”方式構(gòu)建,在完成建模和關(guān)鍵點(diǎn)綁定后,數(shù)字人可以通過(guò)設(shè)備捕捉真人的動(dòng)作、表情、語(yǔ)言等,并以此為驅(qū)動(dòng),完成相應(yīng)表演、互動(dòng)。其可以看作是傳統(tǒng)影視制作CG技術(shù)的延續(xù),強(qiáng)調(diào)“人機(jī)耦合”,技術(shù)相對(duì)成熟,尤其隨著近些年算法進(jìn)步以及高清動(dòng)作捕捉設(shè)備的使用,攻克了在穩(wěn)定流暢地捕捉和展示真人微表情、微動(dòng)作上的技術(shù)難點(diǎn),這使其成為當(dāng)前最常用數(shù)字人。如使用騰訊智影視頻生成平臺(tái)塑造的數(shù)字人,就是屬于這一類。

智能驅(qū)動(dòng)型數(shù)字人,則是依托多模態(tài)大模型技術(shù)來(lái)驅(qū)動(dòng)眼、眉、嘴等人體部位,以此讓數(shù)字人展現(xiàn)出比肩真人的動(dòng)作、表情乃至記憶、思想等,形成獨(dú)特“人設(shè)”和技能,自主完成內(nèi)容輸出以及與外界互動(dòng)。該類數(shù)字人主要基于知識(shí)圖譜進(jìn)行服務(wù),目前大都以“工具人”身份出現(xiàn),例如虛擬客服、虛擬助手、虛擬導(dǎo)游等。

單就技術(shù)而言,由于完全智能驅(qū)動(dòng)型數(shù)字人在人設(shè)、思想、記憶及主動(dòng)互動(dòng)與輸出等方面,有著很高的技術(shù)要求,因此開(kāi)發(fā)這一類數(shù)字人的平臺(tái),大都還處于技術(shù)攻堅(jiān)階段,只有少數(shù)企業(yè)取得了突破性進(jìn)展,而那些真正有部分認(rèn)知能力且可實(shí)現(xiàn)智能交互的數(shù)字人,也是最近才開(kāi)始商用的。前面提到的通過(guò)“深蘭硅基大腦SaaS平臺(tái)”打造的數(shù)字人,如果按技術(shù)層面來(lái)劃分,也可以劃歸這一類。

從呈現(xiàn)方式層面,虛擬數(shù)字人主要分為卡通型和超寫實(shí)兩類。

卡通型數(shù)字人突出的是虛擬屬性,其雖然具有語(yǔ)言、動(dòng)作、表情等人的行為模式,但它的一切皆為虛構(gòu),在現(xiàn)實(shí)世界中根本不存在。這一類數(shù)字人其實(shí)從動(dòng)畫(huà)影視出現(xiàn)那天,就已經(jīng)出現(xiàn)了,它的優(yōu)勢(shì)主要體現(xiàn)在易制作、產(chǎn)量大、成本低上。因此,目前這一類數(shù)字人主要還是出現(xiàn)在二次元、游戲、卡通動(dòng)畫(huà)中。

而超寫實(shí)數(shù)字人突出的則是數(shù)字資產(chǎn)屬性。作為當(dāng)前數(shù)字人主流發(fā)展方向和未來(lái)個(gè)人鏈接元宇宙場(chǎng)景的重要工具,其從一開(kāi)始就繞開(kāi)了“二維”和“卡通”,通過(guò)精細(xì)設(shè)計(jì)并由技術(shù)合成,且自帶高清人物建模以及專屬服飾和場(chǎng)景,為的就是盡可能貼合現(xiàn)實(shí)世界中的真人形象。

如在2月召開(kāi)的“2023全球人工智能開(kāi)發(fā)者先鋒大會(huì)”上,以AIGC首席架構(gòu)師身份發(fā)表演講的百度AI數(shù)字人希加加;使用商湯“如影”平臺(tái)打造的個(gè)人數(shù)字分身;用戶通過(guò)每經(jīng)科技自主研發(fā)的“雨燕智宣”平臺(tái)生成的數(shù)字主播等,都屬于超寫實(shí)數(shù)字人。

而如果按照產(chǎn)品屬性來(lái)劃分的話,則可以分為成品和工具平臺(tái)兩大類。像AI歌手陳水若、百度AI數(shù)字人希加加、寧波銀行數(shù)字員工“小寧”等屬于成品類產(chǎn)品,而像“商湯如影”、“深蘭硅基大腦SaaS平臺(tái)”、每經(jīng)“雨燕智宣”這樣的,則屬于是工具平臺(tái)類產(chǎn)品。

數(shù)字人和數(shù)字人生成平臺(tái)舉例

“數(shù)字人”脫胎換骨,“數(shù)智人”呼之欲出

總的來(lái)說(shuō),國(guó)內(nèi)數(shù)字人產(chǎn)業(yè)目前正處于加速發(fā)展期,越來(lái)越多的科技企業(yè)在這一領(lǐng)域布局,越來(lái)越多的數(shù)字人產(chǎn)品在各行各業(yè)落地,整個(gè)產(chǎn)業(yè)呈現(xiàn)出一片欣欣向榮的發(fā)展局面。據(jù)前瞻經(jīng)濟(jì)學(xué)人預(yù)計(jì),2027年市場(chǎng)體量或達(dá)到300億元,2022-2027年行業(yè)整體年復(fù)合增速或達(dá)到30%。

當(dāng)前,AI技術(shù)驅(qū)動(dòng)多模態(tài)輸入感知、多模態(tài)交互能力不斷完善,ASR、NLP、TTS、STA、情感計(jì)算等技術(shù)已經(jīng)取得突破,數(shù)字人已經(jīng)開(kāi)始擔(dān)負(fù)起連接人與AI的新型交互接口的角色,成為元宇宙中各類“人”與事物之間產(chǎn)生聯(lián)系或發(fā)生孿生關(guān)系的新介質(zhì)。

因此,像虛擬IP與虛擬化身這兩類身份型數(shù)字人,它們?cè)趦?nèi)容創(chuàng)新空間和應(yīng)用開(kāi)發(fā)潛力上的優(yōu)勢(shì)將更加明顯,有望在電商、直播、營(yíng)銷等領(lǐng)域得到廣泛應(yīng)用。

未來(lái),隨著數(shù)字人所具備的人的形象、性格、行為特征以及類人的互動(dòng)能力不斷提升,大模型技術(shù)的不斷加持,數(shù)字人將進(jìn)一步向具有人類意識(shí)的“數(shù)智人”方向發(fā)展。在不改變業(yè)務(wù)邏輯的情況下,“數(shù)智人”可以與更多的行業(yè)場(chǎng)景進(jìn)行深度結(jié)合,產(chǎn)生千行千面的數(shù)字人業(yè)態(tài),從而向用戶提供更好的陪伴。

總而言之,雖說(shuō)現(xiàn)階段數(shù)字人產(chǎn)業(yè)仍處于發(fā)展初期,但未來(lái)隨著技術(shù)的突破、應(yīng)用門檻的降低,市場(chǎng)體量的增大,數(shù)字人必將走進(jìn)我們的生活,走進(jìn)千家萬(wàn)戶。

正所謂:一切皆有可能,萬(wàn)事皆可期待。

本文系作者 AI產(chǎn)業(yè)研究中心 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請(qǐng)注明出處、作者和本文鏈接。
本內(nèi)容來(lái)源于鈦媒體鈦度號(hào),文章內(nèi)容僅供參考、交流、學(xué)習(xí),不構(gòu)成投資建議。
想和千萬(wàn)鈦媒體用戶分享你的新奇觀點(diǎn)和發(fā)現(xiàn),點(diǎn)擊這里投稿 。創(chuàng)業(yè)或融資尋求報(bào)道,點(diǎn)擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評(píng)論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論

請(qǐng) 登錄后輸入評(píng)論內(nèi)容
  • AI主播是數(shù)字人主播嗎,他倆的概念一樣嗎,如果不一樣怎么區(qū)分

    回復(fù) 2023.10.13 · via iphone
  • 數(shù)字人不是一個(gè)大的同質(zhì)群體。每個(gè)人都應(yīng)該擁有一個(gè)與眾不同的好看的數(shù)字人形象

    回復(fù) 2023.10.13 · via pc
  • AI科技發(fā)展會(huì)使21世紀(jì)的人們擁有更多的空閑時(shí)間,說(shuō)明科技的進(jìn)步,如自動(dòng)化,智能化等,可以提高工作效率

    回復(fù) 2023.10.13 · via pc
  • 作為一個(gè)communist,我樂(lè)見(jiàn)AI無(wú)人化大生產(chǎn)成型,這將為社會(huì)主義打下堅(jiān)實(shí)的基礎(chǔ)

    回復(fù) 2023.10.12 · via h5
  • 我覺(jué)得通用大模型后期可能也會(huì)發(fā)展到術(shù)業(yè)有專攻

    回復(fù) 2023.10.12 · via pc
  • 數(shù)字化時(shí)代是發(fā)展的必然趨勢(shì)

    回復(fù) 2023.10.12 · via h5
  • 在虛構(gòu)的數(shù)字世界里,我們可以實(shí)現(xiàn)“身份變換”和“角色扮演”

    回復(fù) 2023.10.12 · via h5
  • 沒(méi)有辦法實(shí)現(xiàn)智能交互的都是廣播員

    回復(fù) 2023.10.11 · via pc

快報(bào)

更多

07:32

A股限售股解禁一覽:237.72億元市值限售股今日解禁

07:29

華泰證券:關(guān)注低估值、低擁擠度的交集和高油價(jià)潛在受益行業(yè)

07:28

夏秋新航季航線網(wǎng)絡(luò)持續(xù)優(yōu)化,國(guó)際航線進(jìn)一步拓展完善

07:09

一季度業(yè)績(jī)預(yù)告加速披露,近九成公司預(yù)喜

07:08

港股IPO活力持續(xù)釋放,科技賽道成資本“新寵”

07:06

美聯(lián)儲(chǔ)4月維持利率不變的概率為97.9%

07:01

港股IPO動(dòng)態(tài):今日華沿機(jī)器人等5股上市

07:01

A股IPO動(dòng)態(tài):今日悅龍科技上市

2026-03-29 22:59

以色列一工業(yè)區(qū)遭襲,危險(xiǎn)物質(zhì)泄漏

2026-03-29 22:22

海南自由貿(mào)易港民營(yíng)企業(yè)座談會(huì)舉行

2026-03-29 22:12

中國(guó)科學(xué)院院士:全固態(tài)電池或至少再等5年

2026-03-29 22:11

今年以來(lái)逾1370萬(wàn)人次旅客訪港

2026-03-29 22:08

下周(3月30日-4月5日)市場(chǎng)大事預(yù)告

2026-03-29 22:06

民調(diào)顯示美國(guó)選民對(duì)特朗普“不滿意率”創(chuàng)新高

2026-03-29 21:43

納比勒·法赫米將擔(dān)任新一任阿盟秘書(shū)長(zhǎng)

2026-03-29 21:07

群核科技通過(guò)港交所聆訊:2025年實(shí)現(xiàn)盈利,沖刺“全球空間智能第一股”

2026-03-29 21:05

油價(jià)飆升埃及多措施節(jié)能,埃及上調(diào)公共交通票價(jià)

2026-03-29 21:05

英矽智能與禮來(lái)達(dá)成AI藥物研發(fā)合作,交易總值最高可達(dá)27.5億美元

2026-03-29 21:04

3月29日新聞聯(lián)播速覽20條

2026-03-29 21:01

中國(guó)銀河證券:中長(zhǎng)期仍看好科技板塊產(chǎn)業(yè)驅(qū)動(dòng)與周期板塊漲價(jià)線索的雙主線

8

掃描下載App