2月16日,OpenAI公司公布了其首個(gè)文生視頻大模型Sora,同時(shí)展示了多個(gè)由Sora生成的最長(zhǎng)時(shí)間達(dá)一分鐘的視頻,引起科技圈震動(dòng)。

鋼鐵俠馬斯克對(duì)其發(fā)出“人類(lèi)愿賭服輸”的感嘆,360董事長(zhǎng)周鴻祎也作出“Sora意味著AGI實(shí)現(xiàn)將從10年縮短到1年”的預(yù)判,Sora為什么能引起科技圈大佬的關(guān)注,其攻克了哪些AI技術(shù)的難點(diǎn)?

繼ChatGPT引發(fā)多個(gè)行業(yè)的就業(yè)焦慮后,OpenAI這次公布的Sora又將給哪些行業(yè)帶來(lái)沖擊?這些行業(yè)又該如何面對(duì)這些挑戰(zhàn)?

在ChatGPT帶來(lái)的關(guān)于AI的諸多爭(zhēng)議還未完全平靜下來(lái)的情況下,OpenAI又將AI的“觸手”升維,這將帶來(lái)哪些新的市場(chǎng)機(jī)遇又會(huì)制造哪些風(fēng)險(xiǎn)?

本期《鈦度熱評(píng)》特邀資深媒體人一起就話題:“Sora驚艷出世,AI能否給人類(lèi)帶來(lái)新的‘視界’?”進(jìn)行了討論,下面是部分觀點(diǎn)集錦。

關(guān)于Sora為什么能引起科技圈大佬的關(guān)注,其攻克了哪些AI技術(shù)的難點(diǎn)。

BT財(cái)經(jīng)聯(lián)合創(chuàng)始人&CEO張津京表示, 某種意義上,它根本不是一個(gè)模型,而是一系列實(shí)現(xiàn)用提示詞生成視頻的工具集合。 OpenAI研究了關(guān)文生視頻目前能查到最新的三四十篇論文,他們最牛的地方就是從中找到了一條看起來(lái)可行,并通過(guò)一年多時(shí)間逐漸推動(dòng)落實(shí)的技術(shù)路線。所以你才發(fā)現(xiàn)這一篇報(bào)道的最后,OpenAI的研究團(tuán)隊(duì)列舉了超過(guò)32篇被引用的論文。而整個(gè)過(guò)程他們分成5個(gè)部分,分別采用了不同的工具和原理。其中有創(chuàng)新思維的,是他們將視頻作為了提示詞可以理解的一個(gè)部分。

為了做到這一點(diǎn),他們首先將視頻的內(nèi)容降維,然后變成提示詞可以容納的內(nèi)容提交給搭建的小模型去分析,輸出的東西再通過(guò)提壓的工具,把它變成多維的格式,最終形成視頻。

當(dāng)然在這個(gè)過(guò)程中為了保證不失真,他們?cè)黾恿撕芏嗟乃惴ǎ罱K通過(guò)跟行業(yè)內(nèi)的交流,找到了一條可行的路徑。

Sora并不是一個(gè)現(xiàn)在可用的模型或者工具集。因?yàn)樵谶@篇文章的任何地方都沒(méi)有向外界提供可以進(jìn)行測(cè)試的鏈接,或者能重復(fù)進(jìn)行研究人員制作視頻的任何過(guò)程的頁(yè)面。

所以,這根本不是一個(gè)成熟的產(chǎn)品,甚至連毛坯房都算不上,只能算是技術(shù)前瞻。

也正因?yàn)镺penAI知道目前實(shí)現(xiàn)不了相關(guān)的研究成果,除了展示沒(méi)有其他任何的方式,所以他們并沒(méi)有將這篇文章做成論文,在各大專(zhuān)業(yè)的平臺(tái)或者媒體刊發(fā)。

畢竟論文驗(yàn)證最核心的一點(diǎn),就是結(jié)果可以重復(fù)。

這就是說(shuō),凡是發(fā)布的論文帶動(dòng)的學(xué)科研究結(jié)果,通過(guò)其公布的實(shí)驗(yàn)過(guò)程,其他科學(xué)家可以復(fù)現(xiàn),才能證明這個(gè)實(shí)驗(yàn)和結(jié)論的有效。這是在科學(xué)界的常識(shí)。

比如之前炒的沸沸揚(yáng)揚(yáng)的,韓國(guó)團(tuán)隊(duì)發(fā)現(xiàn)常溫超導(dǎo)的事件,國(guó)際各大團(tuán)隊(duì)紛紛做了相關(guān)的試驗(yàn),沒(méi)有幾個(gè)成功就對(duì)它的結(jié)果存疑。

而也因?yàn)楫?dāng)下Sora還不是一個(gè)完整的模型產(chǎn)品,其生成的所有視頻,為了保密不可能公開(kāi)相關(guān)的內(nèi)容和操作過(guò)程以及細(xì)節(jié)。這也就讓這件事在科技界的權(quán)威性要標(biāo)上一個(gè)問(wèn)號(hào)。

畢竟沒(méi)有可重復(fù)的過(guò)程,所有提供的視頻究竟是不是由動(dòng)態(tài)模型自主生成,還是一個(gè)人工輔助或者參與的結(jié)果,沒(méi)法證實(shí)或者證偽。

市值觀察主編盧詩(shī)洋表示,Sora簡(jiǎn)單來(lái)說(shuō)就是一個(gè)文字生成視頻的大模型。這似乎沒(méi)有什么大不了的,早在Open AI推出之前,相關(guān)大模型產(chǎn)品一個(gè)接一個(gè),應(yīng)有盡有。比如,PIKA、Runway、SVD、Genmo、Moonvalley。

但Sora足以降維吊打同行競(jìng)品。

首先,它將視頻時(shí)長(zhǎng)從目前主流的幾秒鐘提升至1分鐘,切入到了短視頻創(chuàng)作的時(shí)長(zhǎng)范圍。其次,單視頻多角度鏡頭,且具備一致性。再者,可生成具備多個(gè)角色、包含特定運(yùn)動(dòng)的復(fù)雜場(chǎng)景,能夠一定程度上理解物理世界。

它能取得如此震撼的效果,源于站在巨人的肩膀上,應(yīng)用市面上較為成熟的兩種技術(shù)(Transformer+擴(kuò)散模型)。且嵌入自家GPT模型范式,即用戶(hù)輸入的提示詞先通過(guò)GPT進(jìn)行詳盡擴(kuò)寫(xiě),再將擴(kuò)寫(xiě)后的內(nèi)容交給Sora,逐幀生成更精準(zhǔn)的視頻。這使其具備了獨(dú)一無(wú)二的優(yōu)勢(shì)特點(diǎn)。

Sora競(jìng)爭(zhēng)對(duì)手因沒(méi)有GPT底層擴(kuò)寫(xiě)處理模型,卡在文生文,文生圖上,與Sora有著無(wú)法逾越的鴻溝。

Sora橫空出世,標(biāo)志著一個(gè)里程碑式的進(jìn)步。未來(lái)將深刻改變短視頻、游戲、娛樂(lè)影視、動(dòng)漫、廣告營(yíng)銷(xiāo)、新聞社交等內(nèi)容制作領(lǐng)域。

諸如在電視或網(wǎng)絡(luò)上看到的品牌商一則短短幾分鐘的視頻,傳統(tǒng)廣告公司報(bào)價(jià)在百萬(wàn)元級(jí)別。后者也需要投入不菲的成本和時(shí)間才得以實(shí)現(xiàn)。未來(lái),利用Sora或?qū)⒋蟠髩航灯淦放粕讨С?。?duì)于廣告商而言,或許意味著商業(yè)模式的重新洗牌。

因此,外界對(duì)于Sora有著極高的贊譽(yù)。

即便如此,令人震撼的Sora也有不小缺陷。雖然Sora對(duì)于現(xiàn)實(shí)世界理解有相當(dāng)程度的提升,但本質(zhì)依舊是基于海量數(shù)據(jù)的訓(xùn)練與計(jì)算,而不是其本身就對(duì)世界有理解,更遠(yuǎn)沒(méi)有達(dá)到人類(lèi)大腦的想象力。

因此,Sora生成的視頻還有很多局限性,甚至包括一些事實(shí)性的錯(cuò)誤,更無(wú)法理解需要想象力的因果律。諸如,人咬了一口餅干沒(méi)有咬痕;人在跑步機(jī)跑步的方向錯(cuò)亂;玻璃杯摔在地上只是一方變形。

最近幾天,有擁簇者驚呼,Sora吊打Runway、Pika,已經(jīng)成為“通用世界模型”。很顯然,這過(guò)于神話Sora了,它離AGI(通用人工智能)、世界模型還有很遠(yuǎn)很遠(yuǎn)的路要走。

所謂“現(xiàn)實(shí)世界不存在了”,也絕不是現(xiàn)在。人工智能的浩瀚前景,誰(shuí)也沒(méi)法否認(rèn),但當(dāng)下需要保持頭腦清醒。

關(guān)于Sora將給哪些行業(yè)帶來(lái)沖擊?這些行業(yè)又該如何面對(duì)這些挑戰(zhàn)。

科技金融說(shuō)創(chuàng)始人邵萍表示,Sora大模型的出現(xiàn),從技術(shù)領(lǐng)域來(lái)看確實(shí)是一大亮點(diǎn), 它標(biāo)志著人工智能發(fā)展再度邁上一大臺(tái)階。對(duì)于各行各業(yè),特別是金融、教育、醫(yī)療、自動(dòng)駕駛等領(lǐng)域來(lái)說(shuō),無(wú)疑將帶來(lái)巨大的影響,但追捧的同時(shí)仍要理性看待。

作為一款人工智能視頻模型,Sora在于能夠通過(guò)簡(jiǎn)單的文本命令創(chuàng)建出高度逼真、包含復(fù)雜背景和多角度鏡頭的視頻。不可否認(rèn),這是繼文本、圖像之后, AI技術(shù)拓展到視頻領(lǐng)域的又一次重大突破。未來(lái)也有可能引領(lǐng)一場(chǎng)更具看點(diǎn)的科技革新,最為直觀的體現(xiàn)就是或?qū)Χ桃曨l制作、影視行業(yè)以及視覺(jué)交互界面應(yīng)用產(chǎn)生較為顯著的影響。但是若說(shuō)Sora的出現(xiàn),“一些行業(yè)將不復(fù)存在、現(xiàn)實(shí)世界將不存在”確實(shí)夸大其談了。此外,目前Sora還處于初期探索階段,后期對(duì)于安全性以及垃圾內(nèi)容的把控性等方面仍待考察。

盤(pán)古智庫(kù)高級(jí)研究員江瀚表示,隨著科技的飛速發(fā)展,人工智能(AI)已經(jīng)成為了當(dāng)今世界最為熱門(mén)的話題之一。其中,OpenAI的ChatGPT和Sora等模型的出現(xiàn),更是顛覆了人們的認(rèn)知。

首先,Sora的出現(xiàn)無(wú)疑是另一大里程碑。ChatGPT作為OpenAI研發(fā)的里程碑式語(yǔ)言模型,其強(qiáng)大的自然語(yǔ)言處理能力和對(duì)上下文理解的深度,在推出后迅速引發(fā)了全球范圍內(nèi)的廣泛關(guān)注和熱議。ChatGPT不僅能夠流暢對(duì)話、解答問(wèn)題,還能生成具有邏輯性和創(chuàng)造性的文本內(nèi)容,這一突破性進(jìn)展讓人們看到了人工智能在認(rèn)知智能領(lǐng)域取得的重大飛躍。

緊隨ChatGPT之后,OpenAI又推出了視頻生成模型Sora,該模型更是將AI技術(shù)推到了一個(gè)全新的視覺(jué)維度。Sora憑借其創(chuàng)新的文本到視頻轉(zhuǎn)換能力,使得AI從理解和生成文本躍升至創(chuàng)作高清視頻內(nèi)容的新高度。通過(guò)理解用戶(hù)輸入的文字描述,Sora可以自動(dòng)生成包括復(fù)雜場(chǎng)景、多角色動(dòng)態(tài)交互在內(nèi)的長(zhǎng)達(dá)一分鐘的流暢高清視頻,這標(biāo)志著OpenAI在跨模態(tài)學(xué)習(xí)與生成方面取得了重大突破。

其次,Sora的最大突破還是在于理解人類(lèi)語(yǔ)言并且通感成為視頻。Sora模型的核心優(yōu)勢(shì)體現(xiàn)在它能夠理解人類(lèi)語(yǔ)言輸入,并基于這種理解進(jìn)行視頻內(nèi)容的創(chuàng)造性生成。通過(guò)深度學(xué)習(xí)和跨模態(tài)技術(shù),Sora能夠?qū)⑽谋久枋鲋械某橄蟾拍睢⑶榫?、甚至是情感色彩映射到視覺(jué)表達(dá)上,生成與描述相匹配且具有一定連貫性的視頻片段。

盡管目前生成的視頻可能在細(xì)節(jié)處理、物理真實(shí)感或者復(fù)雜交互場(chǎng)景等方面還存在不完善之處,但其突破性在于首次實(shí)現(xiàn)了從文本到高質(zhì)量視頻內(nèi)容的有效轉(zhuǎn)化,這為內(nèi)容創(chuàng)作者提供了一種全新的工具,大大提升了創(chuàng)意表達(dá)的效率和可能性。此外,Sora的應(yīng)用價(jià)值也體現(xiàn)在教育、娛樂(lè)、廣告設(shè)計(jì)等眾多領(lǐng)域中,它有可能重塑這些行業(yè)的生產(chǎn)方式,并為未來(lái)更加智能化的內(nèi)容創(chuàng)作打下堅(jiān)實(shí)基礎(chǔ)。

第三,視頻的變革可能遠(yuǎn)超過(guò)文字的變革,而且速度會(huì)更快。在當(dāng)前的互聯(lián)網(wǎng)時(shí)代,視頻已經(jīng)成為人們獲取信息、娛樂(lè)休閑的主要方式之一。每天都有大量的視頻內(nèi)容被上傳到網(wǎng)絡(luò)上,涵蓋了新聞、教育、娛樂(lè)、廣告等各個(gè)領(lǐng)域。這些豐富的視頻資源為大模型的學(xué)習(xí)提供了寶貴的素材。

通過(guò)對(duì)這些視頻進(jìn)行深度學(xué)習(xí)和分析,大模型可以不斷地提取和總結(jié)視頻中的視覺(jué)元素、場(chǎng)景轉(zhuǎn)換、敘事結(jié)構(gòu)等規(guī)律,從而提高自身的生成能力。同時(shí),大模型還可以利用這些視頻資源進(jìn)行自我迭代和優(yōu)化,不斷提升自身的性能和效率。

唐辰同學(xué)主理人唐辰表示,Sora值得更多的贊譽(yù),但過(guò)度神話大可不必。販賣(mài)焦慮的不是Sora,喊出“現(xiàn)實(shí)不存在”,就兩類(lèi)人,一類(lèi)是AI門(mén)徒,一類(lèi)是正在賣(mài)課割韭菜。應(yīng)該向前者致敬,而后者典型如李一舟,正賣(mài)付費(fèi)課程從你口袋掏錢(qián)。

對(duì)于普通人,人工智能是一套輔助工具。想靠著買(mǎi)課聽(tīng)來(lái)的信息賺錢(qián),只會(huì)是竹籃打水一場(chǎng)空。真正帶來(lái)壓迫感的,或許是Sora不可思議的進(jìn)化速度。例如,Gen-2是2023年6月發(fā)布的產(chǎn)品,距離Sora的發(fā)布不過(guò)8個(gè)月。支撐OpenAI以如此速度迭代的是“瘋狂燒錢(qián)”,也是“大力出奇跡”的驅(qū)動(dòng)力。

首席商業(yè)評(píng)論創(chuàng)始人衛(wèi)明表示,Sora的目標(biāo)不僅是搞視頻,更是為了向AGI方向突破。

Sora生成的視頻為何可以那么逼真?因?yàn)镾ora不僅理解了語(yǔ)言指令,而且理解了語(yǔ)言中事物在真實(shí)世界中的物理規(guī)則。

譬如,出現(xiàn)的人,建筑,在不同角度觀看會(huì)呈現(xiàn)視線中應(yīng)該出現(xiàn)的部分。譬如,物體在真實(shí)世界中的重力,速度。還有比較關(guān)鍵的,不同物體在真實(shí)世界中的關(guān)系,如何互相影響。譬如一個(gè)騎車(chē)的人穿越樹(shù)林,光線穿透的不同情況等等。

這些原來(lái)在電腦動(dòng)畫(huà)中能實(shí)現(xiàn)是依靠人類(lèi)提供的算法,并且需要用人來(lái)調(diào)配,也不能簡(jiǎn)單復(fù)制。

而如今,Sora似乎已經(jīng)學(xué)會(huì)并理解了這些關(guān)系。當(dāng)ChatGPT,DALL-E,Sora等拼圖組合在一起,可以理解語(yǔ)言,理解世界的物理規(guī)律,并通過(guò)語(yǔ)言描述,能生成任何事物,如果再配上攝像頭不斷觀察世界,獲取真實(shí)世界的素材,是不是就已經(jīng)能生成一個(gè)全新的物種了?

如果再提升邏輯推理能力,那基本上就是AGI了。

AGI最終關(guān)乎的是權(quán)力分配。根據(jù)這次上海二中女教師事件的社媒傳播來(lái)看,AI實(shí)際上已經(jīng)在極大影響著事實(shí)和真相了。

這就會(huì)決定最終解釋權(quán),也會(huì)決定其他權(quán)力的分配。

目前的AI還沒(méi)到AGI的程度,如果未來(lái)有了AGI,它就可以像人一樣,但能力比人強(qiáng),隨意生成一段虛構(gòu)的故事,效果和真人一樣,那么大家該相信誰(shuí)?

所以,未來(lái)的AGI,或者超級(jí)AGI,可能會(huì)影響人類(lèi)的組織關(guān)系和權(quán)力分配,這是一件有風(fēng)險(xiǎn)的事情。

藍(lán)媒匯聯(lián)創(chuàng)兼運(yùn)營(yíng)總監(jiān)岳輕表示,實(shí)際上Sora的振奮人心,是從某種角度上,讓人認(rèn)知到AI的商業(yè)化/普適化落地的現(xiàn)實(shí)。

從區(qū)塊鏈到VRMR,實(shí)際上這兩年互聯(lián)網(wǎng)并不缺乏新技術(shù),但是所有的新技術(shù)都給人一種原本應(yīng)該存在于PPT上,但是用目前的硬件科技水平愣造出來(lái)的感覺(jué)——它的原理、應(yīng)用案例等都讓吃瓜群眾覺(jué)得不明覺(jué)厲,但實(shí)際上并沒(méi)有卵用。

實(shí)際上AI原本也應(yīng)該是這樣,但OpenAI走了一條不同尋常的“邪路”,它把傳統(tǒng)認(rèn)知中AI需要的“情感理解模塊”,轉(zhuǎn)用大數(shù)據(jù)和算法實(shí)現(xiàn)了一定標(biāo)準(zhǔn)上的完美替代,使得它在大幅度降低研發(fā)標(biāo)準(zhǔn)的同時(shí),更貼近人們的日常生活。

從搜索引擎、圖文替代創(chuàng)作等,走到當(dāng)下互聯(lián)網(wǎng)內(nèi)容向最大的板塊“視頻”,OpenAI的每一步突破,都是基于吃瓜群眾切身體會(huì)和應(yīng)用上的。這也使得吃瓜群眾更能理解OpenAI的原理、機(jī)制、成果以及它所能帶來(lái)的顛覆式的未來(lái)。

可以說(shuō)人工智能這個(gè)概念應(yīng)該感謝OpenAI,研究它的公司和機(jī)構(gòu)有很多,但只有OpenAI一家找到了一條最適合它的發(fā)展路徑。

IT知識(shí)局主理人焦云鵬表示,當(dāng)“文心一言”們還在考慮如何迭代升級(jí)時(shí),OpenAI再次引領(lǐng)了大模型的潮流。Sora的出現(xiàn),無(wú)疑讓人們看到了更多的可能性,但它肯定不是終點(diǎn),但卻可以稱(chēng)得上是一個(gè)里程碑。借用周鴻祎的話來(lái)說(shuō),Sora加速了AGI的實(shí)現(xiàn)。

Sora剛發(fā)布時(shí),大家都覺(jué)得這對(duì)于廣告及影視制作行業(yè)是極大的沖擊。但實(shí)際真的是這樣嗎?其實(shí)不然。從ChatGPT發(fā)布到國(guó)內(nèi)眾多大模型推出,似乎沒(méi)有多大的改變,因?yàn)檫@些應(yīng)用場(chǎng)景,更多的還是在消費(fèi)級(jí)領(lǐng)域,通過(guò)大模型輸出的成果也經(jīng)不起商業(yè)推敲。如果說(shuō)真的有影響,那可能真的是提高了一部分廣告創(chuàng)意從業(yè)者的效率,但依然沒(méi)有達(dá)到取而代之的程度。

另一方面,除了廣告創(chuàng)意類(lèi)的內(nèi)容外,比如新聞?lì)I(lǐng)域、時(shí)政民生領(lǐng)域等,諸如Sora這樣的工具要發(fā)揮作用似乎還要經(jīng)過(guò)漫長(zhǎng)的過(guò)程,比如法律法規(guī)的建立、不同國(guó)家制度的適配等等。最后要說(shuō)的一點(diǎn)是,大模型的潛力不應(yīng)該只存在于消費(fèi)級(jí),諸如在工業(yè)級(jí)、企業(yè)級(jí)場(chǎng)景中,還有更為廣闊的空間。

ICT觀察負(fù)責(zé)人葉丹丹表示,Sora的出現(xiàn)在AI領(lǐng)域可以說(shuō)是劃時(shí)代的標(biāo)志,將視頻制作方式注入了新的可能,但開(kāi)放之路還有很遠(yuǎn)。

Sora將文本和圖像生成工具的特點(diǎn)結(jié)合在一起,形成“diffusion transformer model”,通過(guò)從隨機(jī)噪點(diǎn)開(kāi)始,迭代到符合輸入關(guān)鍵詞的圖像,再將這樣的圖像組成視頻,而關(guān)鍵點(diǎn)就是視頻每幀的連貫性和一致性,通過(guò)Open AI 發(fā)布的樣片,Sora做到了。

如果在資源充足的情況下,Sora得以開(kāi)放且以合適的價(jià)格進(jìn)行行業(yè)應(yīng)用,那就可以更便捷地將人類(lèi)想法可視化。

但參考ChatGpt的發(fā)展路徑,無(wú)論是從本身所需數(shù)據(jù)、算力和算法還是潛在的社會(huì)及倫理風(fēng)險(xiǎn),Sora的行業(yè)應(yīng)用之路還有很遠(yuǎn)。訓(xùn)練數(shù)據(jù)的稀缺、算力供給不足以及算法不完善都將成為Sora迭代的關(guān)鍵問(wèn)題;而社會(huì)接受度、版權(quán)風(fēng)險(xiǎn)、及生成視頻的合規(guī)性也將影響Sora的應(yīng)用進(jìn)度。

Sora讓大眾看到了技術(shù)的新可能,新可能就會(huì)有新沖擊、新挑戰(zhàn),但技術(shù)發(fā)展一直在路上。

零態(tài)LT主筆吳狄表示,GPT3的問(wèn)世,讓人們將AGI的實(shí)現(xiàn)將從80年縮短到50年。2022年GPT4發(fā)布后,這個(gè)時(shí)間被進(jìn)一步縮短到8年。如今,甚至有人堅(jiān)信2025年將會(huì)是AGI元年。一位在1994年以神經(jīng)網(wǎng)絡(luò)作為碩士論文的研究人員表示,面對(duì)AI指數(shù)級(jí)進(jìn)化的速度,他只能勉強(qiáng)做到頭腦清醒。進(jìn)化來(lái)的太快,絕大部分人還沒(méi)來(lái)得及去消化它,包括OpenAI自己。

相比傳統(tǒng)技術(shù),AI擠占創(chuàng)業(yè)公司空間的威脅尤其明顯,典型的例子就是Jasper,一款GPT3套殼寫(xiě)作AI產(chǎn)品,最終死于ChatGPT之手。以至于OpenAI開(kāi)發(fā)者大會(huì)后,一個(gè)段子激發(fā)了很多人的共鳴:“奧特曼毀了我300萬(wàn)美元的初創(chuàng)公司,卻只給了我300點(diǎn)ChatGPT積分”。

沖擊來(lái)得太快,結(jié)論卻來(lái)得太早。但不管怎么說(shuō),在Sora沒(méi)有實(shí)裝之前,所有的猜測(cè)最終都有可能是錯(cuò)誤的,就像大家預(yù)測(cè)AGI實(shí)現(xiàn)的時(shí)間一樣。圖靈獎(jiǎng)獲得者Yan LeCun就表示,Sora的模式注定了它終將無(wú)法實(shí)現(xiàn)自己的野心。那么,Sora是否真的能夠成功?如果是,成功后的Sora將會(huì)是什么樣子?它又能帶來(lái)什么樣的新啟發(fā)、殺死多少“Jasper”?

大力財(cái)經(jīng)創(chuàng)始人魏力認(rèn)為, Sora的降臨無(wú)疑是一場(chǎng)革命。Sora 作為首個(gè)文生視頻大模型,可能攻克了自然語(yǔ)言處理、計(jì)算機(jī)視覺(jué)和深度學(xué)習(xí)等難點(diǎn),使視頻生成更真實(shí)、自然??萍既Υ罄袑?duì)其關(guān)注,因?yàn)樗赡芸s短 AGI 實(shí)現(xiàn)時(shí)間,對(duì)未來(lái)科技發(fā)展有深遠(yuǎn)影響,并將在影視制作,動(dòng)漫游戲和紀(jì)錄片,以及廣告營(yíng)銷(xiāo)等行業(yè)帶來(lái)變革。未來(lái)的這些行業(yè)人才,將要大規(guī)模淘汰和流失,會(huì)進(jìn)入到其他行業(yè)。這些行業(yè)需提升創(chuàng)意和技術(shù)水平,也可探索人機(jī)結(jié)合與 AI 合作。

Sora 帶來(lái)新機(jī)遇如智能視頻制作,但也引發(fā)風(fēng)險(xiǎn)如虛假內(nèi)容傳播,法律和版權(quán)問(wèn)題。

關(guān)于OpenAI將AI的“觸手”升維,這將帶來(lái)哪些新的市場(chǎng)機(jī)遇又會(huì)制造哪些風(fēng)險(xiǎn)。

壹DU財(cái)經(jīng)主編劉亦可表示,Sora是OpenAI發(fā)布的首個(gè)AI視頻生成模型,在視覺(jué)領(lǐng)域?qū)崿F(xiàn)了與大語(yǔ)言模型類(lèi)似的突破。

在技術(shù)上,Sora突破了5至15秒的限制,將這一時(shí)長(zhǎng)提升到60秒,并且場(chǎng)景切換、特寫(xiě)等均滿足文本需求。還支持視頻到視頻的編輯,拼接完全不同的視頻使之合二為一、前后連貫。

另外,Sora突破AI視頻單鏡頭限制,可以生成多個(gè)鏡頭,且各個(gè)鏡頭具有角色和視覺(jué)風(fēng)格的一致性。Sora是擴(kuò)散+Transformer的視覺(jué)大模型,并且產(chǎn)生了涌現(xiàn)現(xiàn)象。它通過(guò)收集、清洗數(shù)據(jù)對(duì)現(xiàn)實(shí)世界有更深刻的理解、互動(dòng)和模擬能力,生成的視頻更加逼真。

此外,Sora的運(yùn)行速度比之前的模型快30%,準(zhǔn)確率高達(dá)95%,并采用了全新的算法,實(shí)現(xiàn)了AI與人類(lèi)的無(wú)縫對(duì)接。

從目前Sora展現(xiàn)的能力來(lái)看,它對(duì)內(nèi)容創(chuàng)作、廣告娛樂(lè)和影視制作行業(yè)的沖擊是首當(dāng)其沖的。它讓非專(zhuān)業(yè)人員,都有可能成為短視頻創(chuàng)作者,這勢(shì)必會(huì)產(chǎn)生新業(yè)態(tài)。但對(duì)于帶有劇情的長(zhǎng)篇故事視頻,除了多鏡頭、連貫性等要求,還需要?jiǎng)?chuàng)新場(chǎng)景、準(zhǔn)確和具有節(jié)奏的敘事、鏡頭語(yǔ)言等等。

短時(shí)間來(lái)看Sora不可能徹底替代人或者說(shuō)讓專(zhuān)業(yè)人員失業(yè),反倒有可能讓影視人創(chuàng)造出更多元豐富的作品。Sora的出現(xiàn),更多是扮演輔助工具的角色,幫助人類(lèi)提高效率,提高生產(chǎn)力。

目前來(lái)看,Sora等AI文生視頻產(chǎn)品有望在電影、短視頻、游戲等領(lǐng)域較大改變創(chuàng)作者的工作方式,降低創(chuàng)作成本,提升生產(chǎn)效率。另一個(gè)角度來(lái)看,Sora爆火與使用也會(huì)引發(fā)對(duì)內(nèi)容真實(shí)性的驗(yàn)證、版權(quán)問(wèn)題、以及倫理等問(wèn)題。各行各業(yè)紛紛涌入,其中的不規(guī)范行為與炒作也是值得注意的。

盤(pán)古智庫(kù)高級(jí)研究員江瀚表示,隨著Sora等大模型的快速普及和應(yīng)用,可以預(yù)見(jiàn)一場(chǎng)行業(yè)變革正在醞釀之中。對(duì)于內(nèi)容創(chuàng)作者來(lái)說(shuō),大模型將極大地提高他們的創(chuàng)作效率和質(zhì)量,降低創(chuàng)作成本。他們只需輸入簡(jiǎn)短的文字描述或創(chuàng)意想法,就可以快速生成符合要求的視頻內(nèi)容,大大節(jié)省了時(shí)間和精力。

對(duì)于廣告公司、影視制作公司等企業(yè)來(lái)說(shuō),大模型將為他們帶來(lái)更多的商業(yè)機(jī)會(huì)和創(chuàng)新空間。他們可以利用大模型快速生成廣告宣傳片、宣傳片等視頻內(nèi)容,提高品牌曝光度和用戶(hù)黏性。同時(shí),大模型還可以幫助他們實(shí)現(xiàn)個(gè)性化定制服務(wù),滿足客戶(hù)的個(gè)性化需求。

第四,隨著人工智能技術(shù)的不斷發(fā)展和普及,嚴(yán)防死守來(lái)防止其應(yīng)用已經(jīng)變得不再現(xiàn)實(shí)。從長(zhǎng)遠(yuǎn)來(lái)看,更好的策略是積極地去理解和利用人工智能,而不是試圖阻止它的發(fā)展。

一方面,人工智能在很多領(lǐng)域已經(jīng)展現(xiàn)出了巨大的潛力和價(jià)值。例如,在醫(yī)療領(lǐng)域,人工智能可以幫助醫(yī)生進(jìn)行疾病診斷和治療方案制定;在交通領(lǐng)域,人工智能可以提高交通流量和安全性;在金融領(lǐng)域,人工智能可以幫助進(jìn)行風(fēng)險(xiǎn)評(píng)估和投資決策等。因此,通過(guò)積極利用人工智能,人類(lèi)可以創(chuàng)造更多的價(jià)值,提高生活質(zhì)量。

另一方面,理解和利用人工智能也需要人類(lèi)不斷地進(jìn)行探索和創(chuàng)新。隨著人工智能技術(shù)的不斷發(fā)展,新的應(yīng)用場(chǎng)景和商業(yè)模式也將不斷涌現(xiàn)。通過(guò)不斷學(xué)習(xí)和實(shí)踐,人類(lèi)可以更好地掌握人工智能的技術(shù)和應(yīng)用,推動(dòng)其與社會(huì)、經(jīng)濟(jì)、文化等各個(gè)領(lǐng)域的深度融合。

因此,與其盲目地抗拒人工智能,不如積極地去理解和利用它。通過(guò)不斷學(xué)習(xí)和創(chuàng)新,人類(lèi)可以更好地掌握人工智能的技術(shù)和應(yīng)用,推動(dòng)其與社會(huì)各個(gè)領(lǐng)域的深度融合,這樣才是人工智能時(shí)代真正的生存之道。

《鯨平臺(tái)》智庫(kù)專(zhuān)家郭施亮表示,從ChatGPT到Sora,再到未來(lái)可能出現(xiàn)的AGI,科技發(fā)展速度太快了,你不進(jìn)步努力,別人繼續(xù)進(jìn)步努力,稍有休息,卻與強(qiáng)者進(jìn)一步拉開(kāi)距離。Sora的成功意味著人類(lèi)距離AGI的時(shí)間大大縮短,Sora不僅僅是生成視頻的工具,而且是對(duì)AI、大模型等方方面面的綜合應(yīng)用,一旦得到場(chǎng)景化應(yīng)用以及商用,未來(lái)的發(fā)展前景也是非??捎^的,但目前來(lái)看,全面實(shí)現(xiàn)商用的難度依然不小,還是需要用時(shí)間觀察。但是,AI大熱,最直接的體現(xiàn)是以英偉達(dá)為代表的巨頭股價(jià)持續(xù)上漲,未來(lái)的競(jìng)爭(zhēng)還是要比拼人才儲(chǔ)備、比拼技術(shù)積累以及比拼研發(fā)投入,只有牢牢掌握核心技術(shù)、核心人才,才可以走得更高、更遠(yuǎn)。

比特財(cái)經(jīng)主編鄒震表示,和Sora生成的視頻內(nèi)容相比,此前的文生視頻顯得很幼稚低級(jí)。此前文生圖就經(jīng)常被用戶(hù)詬病結(jié)果不符合常識(shí),而從目前Sora的表現(xiàn)來(lái)看,它顯然已經(jīng)解決了這個(gè)難題。Sora的問(wèn)世,顯示出生成式AI進(jìn)化的速度太快了,大大超乎了人們的想象。OpenAI方面表示,Sora將成為實(shí)現(xiàn)AGI的重要里程碑。

按照Sora的發(fā)展速度,通過(guò)語(yǔ)言就能指揮AI創(chuàng)作電影級(jí)、廣告級(jí)視頻,這對(duì)很多行業(yè)確實(shí)會(huì)帶來(lái)巨大的顛覆。不少人都被Sora生成的內(nèi)容驚艷,認(rèn)為它將顛覆影視業(yè),廣告行業(yè)也要完。短期內(nèi)看,技術(shù)的進(jìn)步將帶來(lái)行業(yè)的變革是毋庸置疑的。在Sora時(shí)代,視頻制作方面將會(huì)崛起更多的個(gè)人IP。但AI至少在相當(dāng)長(zhǎng)的時(shí)間里,還只是一種輔助工具。涉及影視、廣告行業(yè)的創(chuàng)意還需要由人來(lái)完成。因此適應(yīng)這種轉(zhuǎn)變,才能活得更好,這同時(shí)也可能會(huì)讓一些中小型創(chuàng)業(yè)公司獲得發(fā)展機(jī)會(huì)。

產(chǎn)業(yè)家作者斗斗表示,在技術(shù)層面,Sora的誕生無(wú)疑令人矚目,甚至可能讓國(guó)內(nèi)部分人士感受到技術(shù)差距的“滾雪球”效應(yīng)。這一現(xiàn)象與其未來(lái)可能引發(fā)的一系列變革息息相關(guān)。隨著文生視頻應(yīng)用的實(shí)施,Sora有望改變影視制作、廣告設(shè)計(jì)等領(lǐng)域的創(chuàng)作方式,催生全新的藝術(shù)表現(xiàn)形式。此外,在教育、游戲、社交等眾多領(lǐng)域,Sora也將帶來(lái)前所未有的變革。

尤為值得關(guān)注的是,Sora的誕生從側(cè)面印證了AI發(fā)展的步伐,其速度和規(guī)模遠(yuǎn)超人們的想象。這意味著隨著算力和數(shù)據(jù)的持續(xù)積累,未來(lái)或許將涌現(xiàn)出更多可能性。

然而,從另一個(gè)角度來(lái)看,Sora目前并未帶來(lái)生產(chǎn)力的實(shí)質(zhì)性變革,未來(lái)也可能難以實(shí)現(xiàn)。換句話說(shuō),它尚未在提高生產(chǎn)效率和降低成本方面取得顯著成果。在美國(guó)等以服務(wù)業(yè)為主導(dǎo)的國(guó)家,技術(shù)應(yīng)用主要集中在服務(wù)業(yè)。

這與我國(guó)的情況截然不同。作為制造業(yè)大國(guó),我國(guó)工業(yè)制造始終占據(jù)主導(dǎo)地位,從而擁有豐富的應(yīng)用場(chǎng)景。而這些正是許多海外發(fā)達(dá)國(guó)家所欠缺的?;谶@些應(yīng)用場(chǎng)景,發(fā)展大模型技術(shù)落地,將有助于我國(guó)在技術(shù)領(lǐng)域?qū)崿F(xiàn)趕超。

總體而言,歐美國(guó)家和我國(guó)各有優(yōu)勢(shì)。面對(duì)市場(chǎng)變化和技術(shù)飛速發(fā)展,做好眼前的事、當(dāng)下的事,才是應(yīng)對(duì)技術(shù)焦慮的正確之道。因此,當(dāng)前階段,著力推動(dòng)大模型場(chǎng)景落地,成為我國(guó)趕超的關(guān)鍵。

大力財(cái)經(jīng)創(chuàng)始人魏力表示,Sora 可能使影視、游戲、教育、娛樂(lè)、廣告、新聞、社交媒體、醫(yī)療、旅游和科技等行業(yè)發(fā)生變革,如提供更真實(shí)生動(dòng)的視覺(jué)體驗(yàn)、降低成本、提高效率等。但發(fā)展中要考慮人類(lèi)利益和社會(huì)可持續(xù)發(fā)展,和真實(shí)度的問(wèn)題,實(shí)現(xiàn) AI 與人類(lèi)和諧共生。

《鈦度熱評(píng)》是由鈦媒體推出的熱點(diǎn)事件觀察欄目,主要邀請(qǐng)對(duì)不同行業(yè)發(fā)展、不同商業(yè)模式有著獨(dú)到見(jiàn)解、深度觀察的媒體人和行業(yè)從業(yè)者,通過(guò)多角度解讀全面展示事件的影響和意義。

如果你關(guān)心最新趨勢(shì)、有自己的獨(dú)特見(jiàn)解、想同更多志同道合的人分享交流觀點(diǎn),歡迎添加《鈦度熱評(píng)》社群小助手微信:taiduzhushou,加入《鈦度熱評(píng)》社群,跟我們一起打造一個(gè)思考者的社群,讓有價(jià)值的思考被更多的人看到!

本文系作者 鈦度君 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請(qǐng)注明出處、作者和本文鏈接。
本內(nèi)容來(lái)源于鈦媒體鈦度號(hào),文章內(nèi)容僅供參考、交流、學(xué)習(xí),不構(gòu)成投資建議。
想和千萬(wàn)鈦媒體用戶(hù)分享你的新奇觀點(diǎn)和發(fā)現(xiàn),點(diǎn)擊這里投稿 。創(chuàng)業(yè)或融資尋求報(bào)道,點(diǎn)擊這里

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評(píng)論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論

請(qǐng) 登錄后輸入評(píng)論內(nèi)容
  • 可以增強(qiáng)現(xiàn)實(shí)和虛擬世界的融合

    回復(fù) 2024.03.02 · via android
  • 距離人工智能還有一定差距

    回復(fù) 2024.03.02 · via pc
  • Sora橫空出世,標(biāo)志著一個(gè)里程碑的進(jìn)步

    回復(fù) 2024.03.01 · via h5
  • 可以引領(lǐng)視頻制作的新革命

    回復(fù) 2024.03.01 · via h5
  • Sora的出現(xiàn)改變了視頻制作的傳統(tǒng)模式

    回復(fù) 2024.03.01 · via iphone
  • 軟件的東西、還是沒(méi)有大腦的想象力

    回復(fù) 2024.02.29 · via pc

快報(bào)

更多

10:14

廣東省市場(chǎng)監(jiān)管局聯(lián)合廣州市市場(chǎng)監(jiān)管局召開(kāi)平臺(tái)企業(yè)座談會(huì)

10:10

貝殼啟動(dòng)戰(zhàn)略變革:管理者站上一線,經(jīng)紀(jì)人KPI減負(fù)

10:06

中東戰(zhàn)事致燃油短缺,越南多家航司將削減航班數(shù)量

10:06

新研究估計(jì)全球每年逾25萬(wàn)人死于腦膜炎

10:02

印尼16歲以下人群“社媒禁令”正式生效

10:01

調(diào)查顯示日本市場(chǎng)逾2500種食品4月份將漲價(jià)

10:01

西南首個(gè)商業(yè)衛(wèi)星遙感測(cè)運(yùn)控站啟用

09:25

美國(guó)全國(guó)范圍爆發(fā)反對(duì)特朗普政府集會(huì),預(yù)計(jì)超900萬(wàn)人參與,或?yàn)椤懊绹?guó)歷史上規(guī)模最大”抗議活動(dòng)

09:23

馬斯克旗下AI公司初創(chuàng)“11羅漢”全部離職

09:21

巴基斯坦稱(chēng)伊朗已同意再放行20艘巴船只通過(guò)霍爾木茲海峽

09:20

法國(guó)警方挫敗美資銀行門(mén)前爆炸企圖

09:18

美軍否認(rèn)其人員在迪拜遭襲

09:17

以軍稱(chēng)接近完成對(duì)伊朗約90%關(guān)鍵軍工設(shè)施的打擊

09:14

委內(nèi)瑞拉恢復(fù)啟用駐美國(guó)外交機(jī)構(gòu)

09:13

伊朗稱(chēng)襲擊阿聯(lián)酋巴林與美相關(guān)企業(yè)

09:11

全國(guó)民航今起執(zhí)行夏秋航季航班計(jì)劃

09:11

德國(guó)通過(guò)《2026氣候保護(hù)計(jì)劃》,多項(xiàng)措施推動(dòng)減排

09:08

萬(wàn)斯獲美共和黨保守派陣營(yíng)過(guò)半支持

09:08

古巴外長(zhǎng)指責(zé)美方就其燃料限制措施“厚顏無(wú)恥地撒謊”

09:07

智能網(wǎng)聯(lián)汽車(chē)等系列團(tuán)體標(biāo)準(zhǔn)發(fā)布,加速共性關(guān)鍵技術(shù)轉(zhuǎn)化與應(yīng)用

6

掃描下載App