7月28日至7月31日第20屆中國國際數碼互動娛樂展覽會(ChinaJoy)在上海舉行。7月28日,由漢威信恒主辦,鈦媒體集團協辦的2023 ChinaJoy AIGC大會正式召開。大會聚焦時下熱議的AIGC行業(yè),邀請國內外AIGC領域的行業(yè)代表專家、學者、企業(yè)大咖重磅參會,從技術層面、應用層面、價值投資層面,全生態(tài)視角探討AIGC技術下的內容產業(yè)新業(yè)態(tài)。
![]()
出門問問副總裁李維發(fā)表了題為《AIGC 時代,數字人引領內容創(chuàng)作新范式》的演講。
李維表示,出門問問是一家以生成式AI和語音交互為核心的人工智能公司。目前著眼于大模型及大模型所能夠輻射到的多模態(tài)AIGC各個方向的探索和創(chuàng)新并自研了一個名為"序列猴子"的大模型,該模型具有通用能力。在配音方面擁有許多付費客戶,特別是魔音工坊。在多模態(tài)AIGC方面,他們的產品包括奇妙文、言之畫和奇妙元。奇妙文可以輔助用戶生成文案,寫小說和詩歌,并且可以調用言之畫生成相關圖片。魔音工坊是一個配音助理工具,可以幫助用戶進行配音編輯和混音。奇妙元是一個數字人制作平臺,支持2D、2.5D和3D形象生成。出門問問追求高質量的大腦,以生成有價值的內容。除了大腦,還注重聲音和外觀的表現,并且開發(fā)了智能手表等硬件產品。
以下是李維在2023 ChinaJoy AIGC大會上的演講全文(略經鈦媒體App整理):
很高興有機會跟大家分享出門問問在大模型、AIGC方面的工作。
出門問問是一家以生成式AI與語音交互為核心的人工智能公司。從語音助手開始,軟硬結合,現在著眼于大模型及大模型所能夠輻射到的多模態(tài)AIGC各個方向的探索和創(chuàng)新。自研大模型的名字叫做“序列猴子”,“序列猴子”怎么來的呢?法國數學家埃米爾·博雷曾提出一個“無限猴子”定理,如果時間沒有限制的話,讓一只猴子在打字機上打字,能打出一部莎士比亞出來。“序列猴子”的意思是如果把足夠的數據Feed給模型,最終模型能力一定會具有通用性。
“序列猴子”是GPT形式具有通用能力的大模型。
可以看到它已經具備一定的推理能力和計算能力,除了對話,大家都知道大模型人機對話的絲滑能力已經超過一般人類了,這是大模型的特點。
在大模型賦能下,我們是最早進入AIGC賽道,最早跟大模型接通的企業(yè)之一,在配音方面擁有最多付費客戶,特別是魔音工坊,魔音工坊做配音工作,我們在抖音里看到的配音很多都是出自魔音工坊。
在多模態(tài)方面的AGIC,奇妙文是用大模型來幫助生成內容、文案。言之畫可以文字生圖、圖生圖,魔音工坊是最早進入市場的,做得比較成功的一款產品。奇妙元是數字人制作平臺,現在處于爆發(fā)的前期,可以把奇妙元看成是魔音工坊的延伸。奇妙文是大模型長線,可以輔助用戶生成文案,寫小說、詩歌。在奇妙文當中,用戶可以調用言之畫生成圖片,跟文字相關的圖片,能夠自動生成。
魔音工坊是配音助理。
魔音工坊在國外的版本叫做DupDub,因為有用戶基礎,有很多反饋,做得比較絲滑,比較講究,有各種編輯,能夠使你的配音更加契合視頻的需要需求?;煲舻墓δ芊浅嵒荩懈鞣N組合的可能性,把一種情緒變成另外一種情緒。
奇妙元集中了各種模態(tài),現在處于爆發(fā)期。數字人分三種模式,一種是2D,一種是2.5D,一種是3D。
最簡單的是2D,2D是圖片一鍵生成,不過已經很逼近2.5D了,2.5D要做聲音克隆和形象克隆,還需要些時間。
像這個是2D,圖片一鍵生成,這是25年前的我。 這是2.5D,現在的我。
3D形象轉2D形象,在多模態(tài)方面有AIGC沉淀矩陣,最主要的是底座“序列猴子”,因為它是AIGC產品矩陣的大腦。
我們所追求的是要有高質量大腦,否則怎么生成有價值的內容,或者至少是輔助生成。在創(chuàng)作類型中,大模型起很大作用,在其他場景,大模型可能會有幻覺的問題需要人去把控。但不管怎么說,大腦很重要。其他的都涉及感知層面的,要有動聽的聲音,我們已經做到了,配音在業(yè)界做的是在前列的。要有好看的外表,我們公司也做硬件,比如說智能手表,通過軟件植入到硬件中跟客戶接觸。
以及還有在企業(yè)方面數字人的應用。
謝謝大家!
快報
根據《網絡安全法》實名制要求,請綁定手機號后發(fā)表評論