NEON人工智人在CES 2020
【鈦媒體作為CES2020 全球官方合作媒體,舉辦了首個(gè)中國媒體 Stage 舞臺(tái) Talk to China Stage,訂閱「鈦媒體直擊2020 CES 」專題報(bào)道,查看現(xiàn)場精彩報(bào)道?!?/strong>
科技公司從未停止“造人”的腳步。
正在火熱進(jìn)行的2020 CES 國際消費(fèi)電子展上,三星首次對外展示了其“人工智人”產(chǎn)品 NEON,由三星旗下創(chuàng)新實(shí)驗(yàn)室 STAR Labs 獨(dú)立開發(fā)。
STAR Labs官方介紹稱,NEON是一種由人工智能(AI)所驅(qū)動(dòng)的虛擬存在,擁有和真人一致的音容、笑貌和言談舉止,擁有表達(dá)情感和智慧的能力。![]()
STAR Labs總裁兼CEO:普拉納夫•米思特里(Pranav Mistry)
NEON的發(fā)明人,就是三星 STAR Labs 現(xiàn)任首席執(zhí)行官普拉納夫·米斯特里(Pranav Mistry,以“P博士”的稱號(hào)著稱人工智能學(xué)界)。
“NEON就像是一個(gè)全新的物種”,P博士在展臺(tái)對全球介紹 NEON 時(shí)說,“地球上現(xiàn)存有幾百萬種生物,我們希望NEON可以成為其中新的一員”。
鈦媒體作為今年 CES 的官方媒體合作伙伴在現(xiàn)場對發(fā)回了一線報(bào)道(鈦媒體App獨(dú)家視頻),鈦媒體編輯也親自體驗(yàn)了 NEON 的交互功能。

NEON“人工智人”在 2020 CES現(xiàn)場的展示,鈦媒體編輯曹天鵬拍攝
按照STAR Lab及其發(fā)明人的設(shè)想,NEON可以成為人類的朋友、合作者以及同伴,并且“會(huì)在與人類的互動(dòng)中,不斷地學(xué)習(xí)、發(fā)展、形成記憶。”
基于Core R3、SPECTRA兩大引擎,“NEON”虛擬人在對人物原始面部、聲音等數(shù)據(jù)進(jìn)行捕捉并學(xué)習(xí)之后,可以自主創(chuàng)建未錄入過的新表情、新動(dòng)作、新對話,甚至能說其他語言。
其中,CORE R3引擎、被描述為“行為神經(jīng)網(wǎng)絡(luò),進(jìn)化生成智能和計(jì)算現(xiàn)實(shí)領(lǐng)域”的一項(xiàng)進(jìn)步。R3代表三大特性——現(xiàn)實(shí)、實(shí)時(shí)、回應(yīng)(Real, Realtime, Responsive)。具體而言,“它使得NEON能夠生成栩栩如生的現(xiàn)實(shí), 并實(shí)時(shí)地做出回應(yīng)。甚至可以控制NEON眼睛睜開的大小。” P博士在現(xiàn)場介紹 Neon 時(shí)表示。
P博士在接受包括鈦媒體在內(nèi)的媒體采訪時(shí)表示,“CORE R3從自然的規(guī)律性和復(fù)雜性中受到啟發(fā),對人類的外觀、動(dòng)作和互動(dòng)的方式進(jìn)行了大量的模擬和訓(xùn)練,從而能夠生成肉眼無法辨別的、栩栩如生的真實(shí)。CORE R3系統(tǒng)的時(shí)延不足幾毫秒,確保了 NEON能夠?qū)崟r(shí)地動(dòng)作和回應(yīng)。”
鈦媒體獲悉,目前CORE R3引擎平臺(tái)還可以與其他的專業(yè)或增值服務(wù)的系統(tǒng)進(jìn)行連接。
SPECTRA平臺(tái)則負(fù)責(zé)提供情報(bào),學(xué)習(xí),情感和記憶,與CORE R3平臺(tái)互補(bǔ),給NEON 賦能,從而使NEON的體驗(yàn)達(dá)到“沉浸式”。
STAR Labs 戰(zhàn)略負(fù)責(zé)人 Bob Lian 作為嘉賓,在鈦媒體于 CES 2020 現(xiàn)場舉辦的 Talk to China Stage(點(diǎn)擊鏈接查看專題報(bào)道)上,向鈦媒體獨(dú)家分享了關(guān)于 NEON 的幕后故事,包括其技術(shù)亮點(diǎn)、未來的應(yīng)用場景以及如何面對爭議。
![]()
STAR Labs 戰(zhàn)略負(fù)責(zé)人 Bob Lian 在鈦媒體 CES Talk to China Stage 現(xiàn)場
Bob 在鈦媒體CES Talk to China Stage 對話中表示,與其他科技公司的數(shù)字人產(chǎn)品不同,NEON雖然基于真實(shí)的人進(jìn)行建模,但數(shù)字人所呈現(xiàn)在人們面前的行為都是完全原創(chuàng)的,能做到像人一樣,去笑,去哭,去表達(dá),是被創(chuàng)造出來的一個(gè)“數(shù)字人”。
此外,與之前的數(shù)字人技術(shù)不同,NEON的反應(yīng)是實(shí)時(shí)的。Bob這樣解釋 NEON 發(fā)明的初衷:
“我們也不想照搬你的特征,在數(shù)字世界打造一個(gè)同樣的‘你’。我們的目的不是去復(fù)制,而是創(chuàng)造一個(gè)新的‘人’。”
那么,NEON相關(guān)技術(shù),是否會(huì)帶來 Deepfake 一樣的關(guān)于數(shù)據(jù)安全等隱患?
關(guān)于上述問題,Bob告訴鈦媒體,“Deepfake是通過機(jī)器學(xué)習(xí),將圖片或視頻合并疊加到源圖片或視頻上,而NEON是完全原創(chuàng)的,NEON沒有對任何圖像、視頻進(jìn)行處理,不會(huì)拼接合成虛假內(nèi)容,這在應(yīng)用、技術(shù)上都與Deepfake是屬于完全不同的領(lǐng)域。”
在應(yīng)用行業(yè)上,Bob認(rèn)為,NEON將會(huì)在服務(wù)業(yè)與娛樂業(yè)大展拳腳。
在服務(wù)業(yè)上,NEON可以在保證給用戶極致體驗(yàn)下為企業(yè)節(jié)約勞動(dòng)力。而在娛樂業(yè),NEON可以被用在電影、短片甚至MV中,創(chuàng)造新內(nèi)容。“虛擬人可以一整天都在展臺(tái)展示新產(chǎn)品而不會(huì)疲憊倦怠,我們希望能用這項(xiàng)技術(shù)和服務(wù),提升客戶體驗(yàn)。”
Bob 還透露,目前公司還處于初創(chuàng)階段,仍在攻克尖端技術(shù)而未過多考慮商業(yè)化的問題,特別是為NEON提供情感、學(xué)習(xí)和記憶的SPECTRA引擎還在研發(fā)中心,Star labs希望能在年底的“NEON世界”活動(dòng)上公布更多進(jìn)展
2020,NEON將保持開放,歡迎更多合作伙伴來討論 NEON 數(shù)字人的更多可能。
鈦媒體:請先向觀眾介紹一下你自己?,F(xiàn)在大約有5萬名行業(yè)內(nèi)的中國觀眾正在通過直播實(shí)時(shí)觀看我們的鈦媒體CES Talk to China Stage,跟大家打個(gè)招呼。
Bob:大家好。我是Bob Lian,STAR Labs的戰(zhàn)略總監(jiān)。STAR Labs其實(shí)是一家非常新的公司,我在這邊也只有短短4個(gè)月的時(shí)間。在這之前,我曾在杜克商學(xué)院攻讀MBA,之后加入三星,任職于創(chuàng)新部門,負(fù)責(zé)開發(fā)創(chuàng)新項(xiàng)目、產(chǎn)品和技術(shù),供給未來的產(chǎn)品線。
鈦媒體:歡迎您。關(guān)于三星發(fā)布的新產(chǎn)品 NEON,聽說原計(jì)劃是在本次CES上正式發(fā)布,但在此之前,就已經(jīng)在YouTube上傳開了。我也是在YouTube上最先了解到這個(gè)產(chǎn)品。市場對它反應(yīng)非常熱烈。
Bob: 是的,在社交網(wǎng)絡(luò)和互聯(lián)網(wǎng)上,大家都在談?wù)撐覀兊漠a(chǎn)品。很多人對它感興趣,迫不及待地想要一探究竟。在過去的幾個(gè)月里,我們一直保持神秘,計(jì)劃在本次CES2020上正式揭開面紗。但不幸的是,還是有人提前找到了我們的視頻,并放到了網(wǎng)上。
鈦媒體:那現(xiàn)在既然已經(jīng)正式發(fā)布了,能否給我們詳細(xì)介紹一下這個(gè)新產(chǎn)品,它有哪些功能, STAR Labs的研發(fā)工作又花了多久?
Bob:當(dāng)然,我們叫它NEON,這是一家專注于“人造人”的公司,也就是數(shù)字虛擬人物,是通過計(jì)算產(chǎn)生的數(shù)字化人物。他們生活在虛擬世界里,既沒有身體,也不是機(jī)器人。但他們看起來與你我無異,真實(shí)感非常強(qiáng)。NEON虛擬人的有趣之處在于他們的反應(yīng)是實(shí)時(shí)的。
你可能會(huì)在電影里或者電子游戲里看到非常逼真的虛擬人物角色,但這些角色,其實(shí)需要多位數(shù)字藝術(shù)家多年的研發(fā)和努力,才能最終呈現(xiàn)在我們面前。而NEON卻能實(shí)現(xiàn)實(shí)時(shí)創(chuàng)造,100%真實(shí)。這些NEON人物會(huì)表達(dá),有情感,會(huì)像你我一樣做出行為反應(yīng),所以當(dāng)你跟他互動(dòng)時(shí),會(huì)不自覺地把他看作一個(gè)真實(shí)的人,而不是我們的幻想。
![]()
NEON虛擬人
鈦媒體:為了使NEON真實(shí)擬人,必然需要大量數(shù)據(jù),我很好奇,您是如何收集到這些信息的呢?
Bob: NEON實(shí)際上是模仿了真實(shí)人類,這些NEON人物都可以在現(xiàn)實(shí)生活中找到原型。就像AI助手,比如Siri,Alexa,是通過模仿真實(shí)的人的聲音,通過聲音采集和計(jì)算創(chuàng)造出來的。同樣地,我們的NEON虛擬人也是以現(xiàn)實(shí)世界的人物為原型。但這些真實(shí)人類數(shù)據(jù)僅用于建模,在那之后你看到的每一幀、每一幅圖像、每一個(gè)表達(dá)都是完全原創(chuàng)的。NEON的每一次微笑或大笑都是獨(dú)一無二,在此之前從未出現(xiàn)過的。我們通過模擬人類創(chuàng)造出NEON,但它卻又是一個(gè)新的角色、新的存在和新的現(xiàn)實(shí)。
鈦媒體:所以可以理解為,NEON是基于現(xiàn)實(shí)世界的真實(shí)人類創(chuàng)造出來的?
Bob:沒錯(cuò),我們基于真實(shí)的人對它進(jìn)行建模,但它所呈現(xiàn)在人們面前的行為都是完全原創(chuàng)的。不是說完美復(fù)刻了另一個(gè)人,只是通過借鑒一些特征,使NEON在外觀和表現(xiàn)上看上去更像人,能做到像人一樣,去笑,去哭,去表達(dá)。
鈦媒體: 坦白說,我仍然有一些顧慮。我可能比較“過時(shí)”,如果模擬我這樣的普通人來說,這可能沒什么;但如果模擬的是公眾人物呢?比如說美國隊(duì)長,我非常希望能和以他為原型的虛擬人進(jìn)行交流,但是從他的角度,他是否愿意呢?所以我想了解,在創(chuàng)造新人物之前,您如何得到現(xiàn)實(shí)中這些原型的許可?
Bob:再次重申,我們并沒有復(fù)刻任何人,我們也不想照搬你的特征,在數(shù)字世界打造一個(gè)同樣的“你”。我們的目的不是去復(fù)制,而是創(chuàng)造一個(gè)新的“人”,一個(gè)新的存在。通過模仿真實(shí)人類,NEON得以實(shí)現(xiàn)絕對的真實(shí)性,但模仿絕不是這項(xiàng)科技的終點(diǎn)。
我們希望創(chuàng)造一個(gè)有自己的表情、行為、情感、甚至感覺和記憶的新生命,這個(gè)虛擬人與現(xiàn)實(shí)世界中的任何人都截然不同。即使得到許可,我們也永遠(yuǎn)不會(huì)去復(fù)制別人,以此來保護(hù)人們的隱私和身份。
鈦媒體:在我看來,這是一項(xiàng)頗具爭議的新技術(shù)。那從NEON發(fā)布以來,您是否有聽到市場上一些不同的聲音呢?
Bob: 當(dāng)前一個(gè)很大的爭議點(diǎn)是圍繞 Deepfake 而產(chǎn)生的。這其實(shí)跟您剛剛的問題類似。Deepfake 通過機(jī)器學(xué)習(xí),將圖片或視頻合并疊加到源圖片或視頻上,這也是在未經(jīng)用戶許可的情況下進(jìn)行的。我們與此完全不同,我們沒有進(jìn)行任何圖像視頻處理,更不要說拼接合成虛假內(nèi)容了。事實(shí)上,就像我剛剛說的,每一個(gè)圖像,每一個(gè)Neon或虛擬人,每一個(gè)場景都是完全原創(chuàng)的,可以說甚至它臉上的每一個(gè)細(xì)節(jié)都是獨(dú)一無二,具有初創(chuàng)性的。我們與深度偽造屬于不同的領(lǐng)域,即使在技術(shù)上,這也是全然不同的。
鈦媒體:那您認(rèn)為NEON的問世會(huì)對未來的世界產(chǎn)生什么影響呢?
Bob:我們認(rèn)為NEON的影響力主要體現(xiàn)在兩個(gè)方面。一個(gè)是服務(wù)業(yè),這是企業(yè)與用戶聯(lián)系最密切的行業(yè),用戶體驗(yàn)至關(guān)重要。但有時(shí)公司實(shí)際沒有足夠的人力,提供完善的客戶服務(wù)。比如說,我今天一整天都在我們展臺(tái)上展示新產(chǎn)品,我非常疲憊,畢竟作為人,我們會(huì)因?yàn)橛星榫w而變得暴躁和不耐煩。但這在NEON身上就不會(huì)發(fā)生,它不會(huì)疲憊和倦怠,可以隨時(shí)保持和藹可親。希望未來能利用這項(xiàng)技術(shù)和服務(wù),真正提升客戶體驗(yàn)。
鈦媒體:服務(wù)業(yè)是其中一個(gè)方面,那另一方面體現(xiàn)在哪里呢?
Bob:另一個(gè)我認(rèn)為是娛樂業(yè)。NEON可以被用在電影、短片甚至MV中,創(chuàng)造新內(nèi)容。
舉個(gè)例子,假如你是一個(gè)歌手,你有著天籟之音,但也許你并不想站在鎂光燈下,或者不愿意跳舞,這時(shí)NEON將會(huì)是一個(gè)很好的選擇。你可以和NEON配合,由他跳舞或表演,制作出類似YouTube MV的新內(nèi)容,在網(wǎng)上發(fā)布。再比如說,如果你是一位美國的YouTube內(nèi)容創(chuàng)造者,你想拍攝世界另一端的景象,比如印度,但是你又無法親自去到那里,這時(shí)你也可以通過NEON的視角來創(chuàng)造內(nèi)容,最終呈現(xiàn)給觀眾真實(shí)且震撼的效果。
鈦媒體:這聽起來很有趣。接下來讓我們聊聊利潤,相信這也是大家關(guān)心的問題。想請問貴公司未來的商業(yè)定位和走向是怎樣的?您認(rèn)為這項(xiàng)新技術(shù)能被大眾廣泛接受嗎?
Bob:希望如此,關(guān)于您的第二個(gè)問題,我們當(dāng)然希望Neon能被大眾接受,同時(shí)我們也相信NEON能夠最終存在于我們生活當(dāng)中,并且?guī)椭覀冊谠S多方面改善生活。至于您關(guān)于商業(yè)模式的問題,老實(shí)說,我們還不確定。就像我說的,這是一家僅存在4個(gè)月的年輕公司,我們的團(tuán)隊(duì)主要由科學(xué)家和研究人員組成,所以到目前為止,我們的目標(biāo)是開發(fā)并完善這項(xiàng)我們稱之為Core R3的技術(shù)。
![]()
NEON基于兩大引擎:Core R3和Spectra
希望在本次CES上,能向全世界展示這項(xiàng)技術(shù)能做到的都是什么,讓人們真切地感受到未來的虛擬人能有多逼真,并對此充滿期待。至于具體商業(yè)模式或我們?nèi)绾斡瑫簳r(shí)還沒有考慮太多。
鈦媒體:我明白了,所以現(xiàn)在還停留在攻克尖端技術(shù)的層面?
Bob: 正是如此,所以現(xiàn)在我們想先劇透一下,希望在今年,也就是2020年,能找到合作伙伴,并在各種應(yīng)用場景中進(jìn)行試驗(yàn)。
鈦媒體:我了解到有些媒體稱NEON為“數(shù)字阿凡達(dá)”,那我也聽說Facebook實(shí)際上也有一些類似的產(chǎn)品,比如Codec Avatars。相信您對此也有一些了解,那么這些產(chǎn)品與NEON有什么相似之處,你認(rèn)為它們會(huì)成為NEON的競爭對手嗎?
Bob:我想我們所有人都有一個(gè)共同的愿景,希望把這些虛擬人物推向市場,真正進(jìn)入我們的世界。
但除此之外,背后的科學(xué)技術(shù)是截然不同的。我們的核心技術(shù)與其他組織或公司有很大的差異。我自己不是一個(gè)技術(shù)專家,我可能不知道它背后的準(zhǔn)確算法,但從我的研究和學(xué)習(xí),從我在實(shí)驗(yàn)室看到的和我們工程師所做的,我們事實(shí)上采用了完全不同于其他公司的方法。
我相信NEON所實(shí)現(xiàn)的100%真實(shí)感在現(xiàn)在的市場上是無可匹敵的。
鈦媒體:讓我們共同期待。接下來,請問您認(rèn)為NEON在未來所面臨的最大的機(jī)遇和挑戰(zhàn)分別是什么?
Bob: 機(jī)遇在于不斷豐富的應(yīng)用案例,正如我剛剛提到的服務(wù)業(yè)和娛樂業(yè)。而最大的挑戰(zhàn)可能還是如何讓公眾接受這一新事物,如何向大家介紹虛擬人,讓大家了解它以及它能帶來的便利。這是一個(gè)非常棘手的問題,在過去幾天的CES展覽上,我們也一直在為此努力。
鈦媒體:我可以想象這是一件很困難的事情。
Bob:是啊,現(xiàn)在有很多關(guān)于虛擬人的科幻小說和幻想,但距離真正讓公眾接受“虛擬人”,我們還有很長的路要走。希望人們能看到虛擬人背后的好處,為什么這對某些行業(yè)有益,以及它將如何改變我們的生活。也希望作為一項(xiàng)技術(shù),它能讓我們更人性化,也讓技術(shù)本身更人性化,當(dāng)然這需要時(shí)間。那我們也會(huì)盡全力,向世界展示它的好處,告訴大家它不是一件可怕的事,也不是不可思議的。
鈦媒體:請問如何實(shí)現(xiàn)讓NEON說話呢?
Bob:當(dāng)前在聲音方面,還是主要依靠第三方,通過接入第三方API端口,生成語音,畢竟音頻部分不是我們的重點(diǎn)。那我們更關(guān)注的領(lǐng)域還是在于如何打造虛擬人的真實(shí)感。另外在我們的一些演示中,您也會(huì)看到我們使用文本語音來生成各種語言。(本文首發(fā)鈦媒體,編輯/宇航)
快報(bào)
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請綁定手機(jī)號(hào)后發(fā)表評論
這是不是美麗新世界吧?