6月14日上午,零一萬物CEO李開復(fù)和清華大學(xué)智能產(chǎn)業(yè)研究院院長、智源學(xué)術(shù)顧問委員張亞勤在2024年智源大會(huì)上就“通用人工智能的關(guān)鍵問題”展開討論,分享了各自對(duì)于大模型在產(chǎn)業(yè)中的應(yīng)用場(chǎng)景及AGI未來的看法,由智源研究院理事長 黃鐵軍進(jìn)行主持。
李開復(fù)表示,短期來看,to B方向原本是具備巨大商業(yè)價(jià)值,但可惜的是,由于大公司和傳統(tǒng)公司接納度低、大模型降本會(huì)搶奪公司員工“飯碗”,以及很多公司為軟件付費(fèi)意愿低等因素,B端市場(chǎng)面臨的挑戰(zhàn)很大。相較而言,在中國市場(chǎng)走to C模式更有機(jī)會(huì)。
“理論上,to B是可以馬上落地,但實(shí)際情況沒那么快。”李開復(fù)解釋說,許多大公司、傳統(tǒng)公司看不懂大模型技術(shù),不愿擁抱顛覆式的事物。
李開復(fù)還表示,在中國,很多企業(yè)沒有認(rèn)識(shí)到軟件的價(jià)值,不愿為軟件付費(fèi)。加之許多大模型公司參與競(jìng)標(biāo),價(jià)格越競(jìng)越低,極大地壓縮了利潤,做一單賠一單。“我們?cè)贏I1.0看到這個(gè)現(xiàn)象,很不幸又在AI2.0重現(xiàn)了。”
基于B端市場(chǎng)的殘酷現(xiàn)狀,李開復(fù)稱,零一萬物會(huì)更精挑細(xì)選那些上下級(jí)員工都接受大模型技術(shù)的公司。“零一萬物要堅(jiān)決地做to C,堅(jiān)決不做賠錢的to B。”
張亞勤則認(rèn)為,當(dāng)前,AI 大模型技術(shù)仍面臨三大問題:效率較低,特別是大模型的計(jì)算效率低下問題,與人類大腦的高效性形成了鮮明的對(duì)比;大模型目前還未能真正理解物理世界,相關(guān)的推理能力、透明性以及開復(fù)剛才提到的幻覺等問題都還在深入研究中;以及邊界問題,現(xiàn)在大模型無法知道“我不知道什么”,這是目前要解決的問題,是它的邊界效應(yīng)。
同時(shí),兩位專家對(duì)AGI的實(shí)現(xiàn)整體持樂觀態(tài)度,他們認(rèn)為,AGI的定義因人而異,但關(guān)鍵在于AI的能力要超越人類,并具有自我學(xué)習(xí)和進(jìn)化的能力。同時(shí)隨著AI能力的提升,失控的風(fēng)險(xiǎn)也在增加,需要現(xiàn)在就開始考慮如何管理這些風(fēng)險(xiǎn)。
而對(duì)于如何走C端市場(chǎng),李開復(fù)有一套自己的路線圖。沿著從生產(chǎn)力工具到社交產(chǎn)品的方向,他將大模型C端產(chǎn)品劃分為六個(gè)發(fā)展階段:第一階段是作為生產(chǎn)力工具,第二階段是娛樂、音樂、游戲,第三階段是搜索,第四階段是電商,第五階段為社交、短視頻,第六階段是O2O產(chǎn)品。
“從PC到移動(dòng)互聯(lián)網(wǎng)時(shí)代,再到AI時(shí)代,這是不變的定律。”李開復(fù)說,因?yàn)槠鸩诫A段產(chǎn)品要能夠賺錢,所以適合作為生產(chǎn)力工具來解決問題,但越往后難度越高,需要的用戶量也越來越多,“難度高,機(jī)會(huì)更大,回報(bào)也高。”但AI大模型時(shí)代與移動(dòng)互聯(lián)網(wǎng)時(shí)代不同之處在于,C端應(yīng)用不再單純由產(chǎn)品經(jīng)理一個(gè)角色做主,還離不開大模型專家和推理引擎專家等一起打磨。
黃鐵軍:我先提問,近期關(guān)于大模型的討論特別熱門,從剛才的報(bào)告大家也感受到了大模型的能量以及其在各領(lǐng)域的應(yīng)用潛力,可以說大模型是至今為止人工智能發(fā)展最成功的一個(gè)技術(shù)方向。想請(qǐng)問兩位,是什么原因使得大模型如此成功?還有哪些欠缺的地方需要進(jìn)一步發(fā)展?開復(fù)老師先。
李開復(fù):AI 2.0是有史以來最偉大的科技革命和平臺(tái)革命,大模型Scaling Law 的重要性在這個(gè)時(shí)代得以凸顯——人類能夠用更多計(jì)算和數(shù)據(jù)不斷增加大模型的智慧,這條被多方驗(yàn)證的路徑還在推進(jìn)中,還遠(yuǎn)沒有觸達(dá)天花板,這點(diǎn)也讓大家非常振奮。
第二,大模型的智慧來自于接近無損的壓縮,這點(diǎn)也非常重要。上世代的人工智能從業(yè)者很難想到今天會(huì)把壓縮和智能連接在一起。因?yàn)镾caling Law過程中不能盲目堆更多的GPU,所以需要有一個(gè)方法評(píng)估我們有沒有越做越好或者哪個(gè)方法做得更好。零一萬物內(nèi)部有嚴(yán)謹(jǐn)?shù)姆椒ㄕ?,用壓縮的理念去評(píng)估,讓以往漫無目的“煉丹”訓(xùn)模過程變得更系統(tǒng)也更有科學(xué)和數(shù)學(xué)根據(jù)。
![]()
大模型正面臨著一些挑戰(zhàn)。比方說,如果“僅僅用更多算力就能把它往前推動(dòng)”是主要方向的話,就會(huì)導(dǎo)致只有那些GPU資源豐富的公司和國家能夠在這方面勝出。但話說回來,我們已經(jīng)驗(yàn)證了,很多國內(nèi)大模型在部分案例里接近或者打平、或者偶爾超過美國的大模型。所以我認(rèn)為需要專注的是算法和工程創(chuàng)新一體化的推進(jìn),以及怎么以這種能力避免進(jìn)入“盲目堆算力推動(dòng)模型性能提升”的狀態(tài)。
當(dāng)然,目前大模型還直面許多挑戰(zhàn)。就像每個(gè)技術(shù)剛誕生都會(huì)有問題,起初大模型也不知道最近一年發(fā)生了什么。還有記憶的問題、窗口構(gòu)成的問題、幻覺問題等等,但我們可以看到的是,當(dāng)全球如此多聰明的大腦涌入這個(gè)領(lǐng)域后,大部分問題不能說被完美地解決,但是都在逐步被攻克的過程中,所以我對(duì)大模型的未來相當(dāng)樂觀。
張亞勤:我講“三個(gè)做對(duì)了”的和“三個(gè)需要改進(jìn)”的 。
一、三個(gè)做對(duì)了
首先,規(guī)模定律Scaling Law。規(guī)模定律的實(shí)現(xiàn),主要得益于對(duì)海量數(shù)據(jù)的利用以及算力的顯著提升。再加上現(xiàn)在的Diffusion和Transformer架構(gòu)能夠高效地利用算力和數(shù)據(jù),使得“飛輪效應(yīng)”得以正循環(huán)。盡管有人質(zhì)疑Scaling Law在2到3年后是否仍然有效,但我個(gè)人認(rèn)為至少在未來5年里,它仍將是產(chǎn)業(yè)發(fā)展的主要方向。
其次是“Token-Based”統(tǒng)一表述方式。在大模型中,“Token”是一個(gè)基本元素。無論是文本、語音、圖像、視頻,還是自動(dòng)駕駛中的激光雷達(dá)信號(hào),甚至是生物領(lǐng)域的蛋白質(zhì)和細(xì)胞,最終都可以抽象為一個(gè)Token。Token之間的訓(xùn)練、學(xué)習(xí)和生成是核心環(huán)節(jié),這與我們大腦中的神經(jīng)元工作原理相似,無論執(zhí)行何種任務(wù),其基礎(chǔ)機(jī)制都是相同的。
最后是通用性。這與Token緊密相關(guān)?,F(xiàn)在的通用性不僅體現(xiàn)在文本處理上,還擴(kuò)展到了多模態(tài)領(lǐng)域,甚至可以生成如蛋白質(zhì)等復(fù)雜結(jié)構(gòu)。此外,它在物理世界(如具身智能)和生物世界(如生物智能)中也有著廣泛的應(yīng)用前景。
以上這三個(gè)是大模型做對(duì)的。
二、現(xiàn)階段主要問題
第一個(gè),效率較低。特別是大模型的計(jì)算效率低下問題,與人類大腦的高效性形成了鮮明的對(duì)比。人類大腦擁有860億個(gè)神經(jīng)元,每個(gè)神經(jīng)元又有數(shù)千個(gè)突觸連接,卻只需要20瓦的能量,重量還不到三斤;而GPT4這個(gè)萬億參數(shù)模型則需要巨大的算力和能源,與人腦相比相差1,000倍之多。此外,人腦能夠根據(jù)不同的情境靈活調(diào)用不同區(qū)域的神經(jīng)元,而大模型卻每次輸入一個(gè)問題都要調(diào)用和激活幾乎大量參數(shù)。因此,如何借鑒人類大腦的計(jì)算方法,在降低計(jì)算耗能、提高效率方面進(jìn)行探索和創(chuàng)新,是一個(gè)值得關(guān)注的方向。
第二個(gè),大模型目前還未能真正理解物理世界,相關(guān)的推理能力、透明性以及開復(fù)剛才提到的幻覺等問題都還在深入研究中。有一個(gè)重要的問題是,即使我們的大模型做得再好,它在生成式表述與對(duì)真實(shí)世界的描繪之間仍存在矛盾。因此,我們需要探索如何將生成式的概率大模型與現(xiàn)有的“第一性原理”或真實(shí)模型、知識(shí)圖譜相結(jié)合。目前,雖然已經(jīng)有了一些嘗試,如采用RAG技術(shù)或進(jìn)行微調(diào),并取得了一定的進(jìn)展,但我認(rèn)為這些方法并非根本解決方案。我預(yù)測(cè),在未來五年內(nèi),將會(huì)有一個(gè)全新的架構(gòu)出現(xiàn),這個(gè)架構(gòu)有望取代目前的Transformer和Diffusion模型。
第三個(gè)欠缺的地方是邊界問題?,F(xiàn)在大模型無法知道“我不知道什么”,這是目前要解決的問題,是它的邊界效應(yīng)。
黃鐵軍:謝謝亞勤的“三個(gè)做對(duì)了”和“三個(gè)不足”。剛才開復(fù)老師沒講,我想再追加問一下,有些人認(rèn)為大模型是一個(gè)實(shí)踐、是一個(gè)工程,是經(jīng)驗(yàn)主義做的東西,沒有理論基礎(chǔ),說得不好聽叫“不靠譜”,不知道你怎么看這個(gè)問題?
李開復(fù):我覺得科學(xué)和工程缺一不可。如果只做工程,不了解“第一性原理”,沒有數(shù)學(xué)的根據(jù)、沒有辦法評(píng)估不同方法的效果,考慮到高昂的算力成本,這樣的摸索肯定是做不出一個(gè)好模型的。但是如果只是在實(shí)驗(yàn)室里雕花,然后寫一些不錯(cuò)的論文,期待有工程人才把論文做成產(chǎn)品,這肯定也是不行的。
零一萬物的經(jīng)驗(yàn)是,每個(gè)做AI、做模型的Researcher要懂Infrastructure、都要懂推理、都要知道成本的問題,所以當(dāng)你需要面對(duì)科研問題時(shí),就知道在產(chǎn)品里需要的反應(yīng)速度有多快,要怎么實(shí)現(xiàn),做完實(shí)驗(yàn)就可以確保模型可以得到令人滿意的工程結(jié)果。訓(xùn)練模型的過程中絕對(duì)不只是寫Paper,還要同時(shí)考慮怎樣系統(tǒng)化、工程化地做數(shù)據(jù)工程,因?yàn)閿?shù)據(jù)的訓(xùn)練、數(shù)據(jù)的篩選是非常重要的。還有底層的AI Infrastructure,GPU這么昂貴,如果把一張當(dāng)成兩張、三張使用,任何公司都會(huì)得到好處,所以科技和工程這兩方面缺一不可。
黃鐵軍:謝謝。大家關(guān)心AI2.0,大模型產(chǎn)業(yè)化最大的場(chǎng)景在哪里?移動(dòng)互聯(lián)網(wǎng)這么多年,To B、To C ,這兩個(gè)大賽道哪個(gè)更有機(jī)會(huì)?為什么?
李開復(fù):簡單來說,在中國To C 短期更有機(jī)會(huì),國外兩者(To C、To B)都有機(jī)會(huì)。To C方面,就像移動(dòng)互聯(lián)網(wǎng)、PC時(shí)代里,一個(gè)新技術(shù)、新平臺(tái)帶來新應(yīng)用,大模型同樣如此,這是巨大的機(jī)會(huì),但是這些應(yīng)用的出現(xiàn)一定是按部就班的。
我認(rèn)為AI 2.0 時(shí)代會(huì)和PC、移動(dòng)互聯(lián)網(wǎng)時(shí)代一樣,第一個(gè)階段應(yīng)該是生產(chǎn)力工具,包括信息獲??;第二個(gè)階段可能會(huì)是娛樂、音樂、游戲,第三個(gè)階段可能會(huì)是搜索;再下一個(gè)階段可能會(huì)是電商;然后可能會(huì)有社交、短視頻、O2O的應(yīng)用出現(xiàn)。
一個(gè)理由就是剛開始應(yīng)用要能夠賺錢、能夠解決問題,所以第一波潮流會(huì)是生產(chǎn)力工具,但越往后,難度越高——高用戶量的應(yīng)用商業(yè)模式往往是先堆積用戶再找變現(xiàn)模式,所以應(yīng)用成本一定要很低,試錯(cuò)難度很大、所需要的投資也更多。
我認(rèn)為遞進(jìn)的模式不會(huì)有特別大的改變,To C應(yīng)用會(huì)從生產(chǎn)力工具一步步走向短視頻類應(yīng)用。To C確實(shí)會(huì)產(chǎn)生大量的用戶,但這不是說不能用大模型來做產(chǎn)品,只是在普及順序上會(huì)按照這六個(gè)階段進(jìn)行。
當(dāng)然,這個(gè)過程中也有挑戰(zhàn),在大模型領(lǐng)域做應(yīng)用跟PC、互聯(lián)網(wǎng)時(shí)代不一樣,因?yàn)橥评沓杀具€太貴。最近零一萬物提出了TC-PMF概念(技術(shù)成本x產(chǎn)品市場(chǎng)契合度),這個(gè)概念是指,當(dāng)你考慮PMF時(shí),還要把技術(shù)的需求、實(shí)現(xiàn)難度和成本考慮進(jìn)去。
做應(yīng)用一定要考慮到剛才這六個(gè)階段誰先誰后、什么時(shí)候做、提早做。第二,做應(yīng)用的時(shí)候還要綜合考慮到當(dāng)時(shí)的技術(shù)夠不夠好,成本是否足夠低,所以大模型To C應(yīng)用不像過去移動(dòng)互聯(lián)網(wǎng)時(shí)代,產(chǎn)品經(jīng)理一個(gè)人就可以做主,它需要做Infrastructure、做推理引擎的人、一起打磨TC-PMF。這件事難度高,但是回報(bào)也高,機(jī)會(huì)也更大。
最后我想講,在To C方面,我不相信技術(shù)可以永久領(lǐng)先,事實(shí)上技術(shù)帶來的領(lǐng)先窗口非常短暫,一旦巨頭看到你驗(yàn)證了PMF,他們會(huì)有很多方法超越你。一旦你驗(yàn)證了TC-PMF,要把握時(shí)間窗口把品牌打出來,最終勝出的To C應(yīng)用不只是需要有技術(shù)優(yōu)勢(shì),還需要在時(shí)間窗口內(nèi)打造持續(xù)優(yōu)勢(shì),比如品牌優(yōu)勢(shì),比如社交鏈,比如用戶數(shù)據(jù),讓用戶不能離開你這個(gè)平臺(tái)。在微信強(qiáng)大的時(shí)代里抖音能被做出來,就是因?yàn)樗プ×诉@個(gè)時(shí)間窗口。
再講一下To B的應(yīng)用。大模型有可能在To B方向上帶來更大價(jià)值,而且能夠比To C更快實(shí)現(xiàn),但是To B這個(gè)領(lǐng)域有幾個(gè)挑戰(zhàn)。
第一個(gè)挑戰(zhàn)是大公司、傳統(tǒng)公司不是很敢采取顛覆式技術(shù),大公司會(huì)習(xí)慣每年增長5%預(yù)算,做和去年一樣的事情。
第二個(gè)挑戰(zhàn)在中國比較嚴(yán)重,許多大公司沒有認(rèn)識(shí)到軟件的價(jià)值,為軟件付費(fèi)意的意識(shí)有待進(jìn)一步提高?,F(xiàn)在有許多大模型公司在競(jìng)標(biāo)時(shí)越競(jìng)越低,做到最后做一單賠一單,都沒有利潤。我們?cè)贏I 1.0時(shí)代曾見過這個(gè)現(xiàn)象,現(xiàn)在它在AI 2.0時(shí)代又重現(xiàn)了。這種心態(tài)導(dǎo)致部分大公司只愿支付很低的價(jià)格,大模型公司也只能給出折中的方案,達(dá)到驚艷效果的寥寥無幾。
零一萬物堅(jiān)決做To C,不做賠錢的To B,而是做能賺錢的To B。所以零一萬物在To B方面精挑細(xì)選,找那種公司上下都愿意擁抱新概念的公司,也為它們?cè)O(shè)計(jì)了 RAG 知識(shí)檢索、專有云、微調(diào)等方案,在國內(nèi)國外都有嘗試。
無論To C還是To B,API都很重要,最近國內(nèi)很多模型降價(jià)了,零一萬物也推出了接入國際SOTA成績Yi-Large大模型的API,也希望有機(jī)會(huì)可以跟各位合作。這個(gè)API背后的模型能力接近GPT-4o,但是價(jià)格是GPT-4的四分之一,我相信這可以幫助更多公司或者創(chuàng)業(yè)者達(dá)到所謂的TC-PMF。
黃鐵軍:謝謝開復(fù)老師對(duì)To B、To C的分析,很透徹。亞勤,剛才關(guān)于To B的觀點(diǎn),大家還有一個(gè)非常關(guān)心的問題,大模型產(chǎn)業(yè)的最大場(chǎng)景會(huì)在哪里?To B、To C在什么地方能夠落地發(fā)揮作用?
張亞勤:在應(yīng)用和服務(wù)層面,先面向消費(fèi)者(To C)再面向企業(yè)(To B)。To B的周期相對(duì)較長,而To C的應(yīng)用產(chǎn)品則可以迅速推出,這與過去的PC互聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)的發(fā)展路徑基本一致。在基礎(chǔ)設(shè)施層,目前真正盈利的主要集中在To B領(lǐng)域,特別是在芯片、硬件、服務(wù)器等。像英偉達(dá)、AMD等芯片制造商,以及服務(wù)器、HBM存儲(chǔ)、InfiniBand和NVLink等相關(guān)技術(shù)的提供商,他們目前是盈利最多的。
![]()
關(guān)于AI路徑,我在過去十年中一直強(qiáng)調(diào)三個(gè)關(guān)鍵領(lǐng)域:首先是信息智能,其次是物理智能(現(xiàn)在流行的術(shù)語是具身智能),最后是生物智能。在具身智能階段,To B的應(yīng)用可能會(huì)比To C更快落地。然而,在生物智能階段,情況可能相反,To C的應(yīng)用可能會(huì)先于To B出現(xiàn)。盡管每個(gè)領(lǐng)域的具體情況可能有所不同,但總體來看,無論是To C還是To B,都將存在開源模型、商業(yè)閉源模型、基礎(chǔ)大模型,以及針對(duì)垂直行業(yè)模型和邊緣模型。
黃鐵軍:具身智能今年特別熱,關(guān)注度特別高。講到具身,通常像機(jī)器人,人形機(jī)器人、輪式機(jī)器人是一大類,第二大類是車,也是一個(gè)駕駛場(chǎng)景上的具身智能。還有無人機(jī),在空中飛將來也是一種形態(tài)。甚至于大家可以想象出更多的身體形態(tài),更多的具身智能可能性。我想請(qǐng)問,你們認(rèn)為,具身智能這么多可能性里面,到底是熱門的人形機(jī)器人會(huì)先有機(jī)會(huì),還是已經(jīng)有相當(dāng)多積累的自動(dòng)駕駛會(huì)有機(jī)會(huì)?
張亞勤:從百度Apollo開始有七年、八年時(shí)間我一直在從事無人駕駛研究,無人駕駛L4+是具身智能第一個(gè)、最大的應(yīng)用,也會(huì)是第一次實(shí)現(xiàn)新圖靈測(cè)試的應(yīng)用。無人駕駛它本身就是一個(gè)開車的特殊機(jī)器人。無人駕駛最近有很多好消息,它的安全性已經(jīng)比人類駕駛要高至少10倍,不管是Waymo在舊金山的結(jié)果,還是百度阿波羅在武漢大范圍的商業(yè)運(yùn)營。最早在Apollo開始的時(shí)候我就要求,自動(dòng)駕駛安全性一定要比人類駕駛高出10倍。
盡管安全性很好,當(dāng)前無人駕駛?cè)源嬖谝恍┨魬?zhàn),就是它雖然開得安全但不夠老練,不夠老司機(jī),駕駛太守規(guī)矩了,不會(huì)超速或壓線。無人駕駛要變成主流,要通過新圖靈測(cè)試的話,需要是好司機(jī),也需要是老司機(jī)。我認(rèn)為無人駕駛在明年會(huì)成為第一個(gè)真正實(shí)現(xiàn)具身智能或者物理智能的AGI。
另外再講一點(diǎn),大模型的推出,幫助無人駕駛解決了很多原來的問題。比如長尾問題、數(shù)據(jù)生成問題,百度已經(jīng)積累了1億公里的駕駛數(shù)據(jù),1億公里雖然已經(jīng)很多但數(shù)據(jù)仍然不夠,生成式人工智能可以生成很多數(shù)據(jù)。大模型的應(yīng)用使得無人駕駛系統(tǒng)能夠?qū)崿F(xiàn)端到端的智能化,同時(shí)也意味著無人駕駛會(huì)有更高的智能性,還將加速其在實(shí)際場(chǎng)景中的落地應(yīng)用。
李開復(fù):我同意亞勤的分析。在創(chuàng)新工場(chǎng),我們也投了大概6家左右的無人駕駛公司,發(fā)展都不錯(cuò)?,F(xiàn)在無人駕駛面臨的一個(gè)巨大機(jī)會(huì),就是終于可以落地了。在L2、L3階段,包含城市自動(dòng)小巴等等場(chǎng)景,無人駕駛都可以真正創(chuàng)造價(jià)值,這是很讓人欣慰的。到L4、L5階段,要無限制地開到開放場(chǎng)景,全球都面臨著挑戰(zhàn)。我在美國的時(shí)候看到了Waymo進(jìn)展是不錯(cuò)的,依然在往前推進(jìn)。特斯拉推出的FSD,雖然不是完全的大模型,但是是用了類似end to end(端到端)的概念。至于不用FSD方案能產(chǎn)生多少產(chǎn)業(yè)價(jià)值,我希望我們投的5、6家公司和亞勤的前公司都能夠證明,中國能做得很好,也許這就是很大的市場(chǎng)。
過去這一年我專注于零一萬物,我沒有做自動(dòng)駕駛的研究,但是我確定FSD會(huì)帶來新的機(jī)會(huì)。把大模型的概念放到無人駕駛里面,這是我非常期待能夠在下一階段看到的事。但是這需要巨大的投資,不見得適合初創(chuàng)公司來做。
講到具身智能,它跟亞勤說的一樣,是物理世界跟AI的結(jié)合,這是很重要的。但是我也必須說,大模型是非常適合虛擬世界的,在金融公司的后臺(tái)、客服等等場(chǎng)景,大模型很快就可以落地產(chǎn)生價(jià)值。如果你的需求是軟件,直接對(duì)接大模型就好了。一旦大模型接入物理世界,就需要面臨各種問題,有安全問題、機(jī)器問題、機(jī)械問題、故障問題等等,難度會(huì)大很多倍。
從創(chuàng)業(yè)者的角度來說,雖然現(xiàn)在具身智能一時(shí)比較熱,有一些創(chuàng)業(yè)者涌入了,但是對(duì)于大部分創(chuàng)業(yè)者來說,如果希望短期落地產(chǎn)生價(jià)值、能賺錢,肯定還是做虛擬世界要遠(yuǎn)遠(yuǎn)容易很多。具身智能是重要的,它可以很好地結(jié)合大模型多模態(tài)能力,而且一旦具身后就可以產(chǎn)生數(shù)據(jù),形成數(shù)據(jù)飛輪閉環(huán),有很大的想象空間。但是短期要做好,難度很大。
具身智能肯定要走很漫長的道路,而且對(duì)于人形機(jī)器人我有一些特別的看法。絕大多數(shù)應(yīng)用場(chǎng)景并不需要人形機(jī)器人,炒菜機(jī)器人應(yīng)該長得像鍋,吸塵器也長得并不像人,沒有必要。像是波士頓動(dòng)力那種很酷的、跳來跳去的機(jī)器人,真的會(huì)有很多應(yīng)用場(chǎng)景嗎?絕大多數(shù)場(chǎng)景幾個(gè)輪子不是更容易移動(dòng)嗎?很多科學(xué)家和創(chuàng)業(yè)者都是從小熱愛科技,希望能復(fù)制一個(gè)人,這無可厚非。但是如果你很簡單地問VC,VC給出的恐怕是更務(wù)實(shí)更理性的判斷。
黃鐵軍:最近經(jīng)常有人問我通用人工智能,到底什么時(shí)候可以實(shí)現(xiàn)?我比較樂觀,我講一下大致時(shí)間點(diǎn),跟開復(fù)講的很一致。信息智能、物理智能和生物智能。在信息智能方面,我認(rèn)為5年左右就可以實(shí)現(xiàn),現(xiàn)在在文本基本已經(jīng)可以實(shí)現(xiàn)了,圖靈測(cè)試已經(jīng)通過了。在視頻方面,可能還需要幾年。所以,5年之內(nèi)有可能達(dá)到在虛擬世界或者是信息世界。到具身智能或者物理的話,可能需要10年。在生物智能,可能還需要15-20年,比較長一些。要是三年前問我這個(gè)問題,我可能會(huì)放50年乘2,現(xiàn)在是除2。
張亞勤:我補(bǔ)充一點(diǎn),最近經(jīng)常有人問我,通用人工智能到底什么時(shí)候可以實(shí)現(xiàn)?我比較樂觀,我認(rèn)為15-20年內(nèi)可以實(shí)現(xiàn),并通過新圖靈測(cè)試。
0至5年內(nèi),在信息智能領(lǐng)域,對(duì)語言、圖像、聲音和視頻的理解、生成等方面通過新圖靈測(cè)試。
0至10年內(nèi),在物理智能領(lǐng)域,實(shí)現(xiàn)大模型在物理環(huán)境中的理解與操作能力,通過新圖靈測(cè)試。
0至20年內(nèi),在生物智能領(lǐng)域,聚焦人體、腦機(jī)接口、生物體、制藥和生命科學(xué),實(shí)現(xiàn)大模型與生物體連結(jié)的生物智能,通過圖靈測(cè)試。
要是三年前問我這個(gè)問題,我可能會(huì)說50年實(shí)現(xiàn)AGI,這幾年隨著大模型的發(fā)展,我認(rèn)為除以2,20年能實(shí)現(xiàn)。
黃鐵軍:這個(gè)通用人工智能,包括今天的大模型或者未來幾年能實(shí)現(xiàn)的,在信息空間里大模型的認(rèn)知能力通常的評(píng)測(cè)水平,比如說到了大學(xué)、到了博士、到了專家、到了學(xué)者,甚至于科學(xué)家,這是一個(gè)通用性,不管什么學(xué)科都可以做,這是一種理解。但是剛才亞勤講到,有了身體進(jìn)入物理世界,甚至進(jìn)入物理世界的具身智能,跟我們今天講的通用人工智能又有所不同。也就是大家講的AGI。GAI、具有通用性的人工智能和AI領(lǐng)域說了這么多年的AGI是不一樣的。AGI是要超越人類的,AGI是有自我意識(shí)的,AGI不僅僅是智能水平超過了人類,而且有自我意識(shí),要有自己的目標(biāo)、做出自己的判斷。你們剛才談到的是指這樣的AGI嗎,還是只是說前面一種?
李開復(fù):AGI的定義是因人而異的。如果把AGI定義為能做人所能做的一切事情,那么我今天沒有辦法定義,因?yàn)樗€有太多未知的東西還沒有被解。但是這種定義只把人當(dāng)作金標(biāo)準(zhǔn),似乎就是問車什么時(shí)候能跟人跑的一樣快,但是車在很多場(chǎng)景已經(jīng)比人跑得快很多了,只是有些場(chǎng)景沒法勝任。我個(gè)人會(huì)說:只要Scaling Law繼續(xù),只要AI一年比一年更聰明,它會(huì)多做比如5倍的事情,IQ會(huì)提升20個(gè)點(diǎn)。
但是,它聰明的方向,能做的事情也許是人從來都不能做的,不見要能做人做的每件事。因?yàn)槲沂亲鐾顿Y和創(chuàng)業(yè)的,我想看到的是巨大的商業(yè)價(jià)值。從這個(gè)角度來說,我們不會(huì)太糾結(jié)是不是能夠百分之一百做到人類能做的事。如果世界上有一萬件事情,AI在9000件上做得比人好,有1000件人做得比較好,這樣也挺好的,要給人留一點(diǎn)空間嘛。
談到虛擬跟物理世界,我還想再補(bǔ)充一點(diǎn)。在虛擬世界里,Agent還是非常重要的,因?yàn)槿说腎ntelligence不只是回答問題,是要知道“怎么把事情做出來”。而且如果是談創(chuàng)造商業(yè)價(jià)值,Agent幫你把東西買了,幫你把事情解決了,這個(gè)是有很大的商業(yè)價(jià)值,也是貼近AGI的重要一步。
張亞勤:我剛才講的20年實(shí)現(xiàn)AGI,不包括擁有意識(shí)或情感。我對(duì)AGI的定義有三點(diǎn),第一是要有巨大的能力,要能在大部分的任務(wù)要比人類強(qiáng),而不是所有任務(wù)均超越人類。第二,它是必須要是通用的,過去每個(gè)任務(wù)都要用不同的模型,但是AGI是要有一個(gè)通用的大底座,當(dāng)然可以有小的垂直模型,但它本身具有通用性。第三是不斷升級(jí)、學(xué)習(xí)、進(jìn)化,就像人類一樣。我不認(rèn)為現(xiàn)在的Scaling Law,或者我們現(xiàn)在做的研究會(huì)讓AI產(chǎn)生意識(shí),并且我也不認(rèn)為我們應(yīng)該從事這方面的研究。我們還是要解決真正的問題,把人工智能作為我們的工具、我們的延伸、我們的Agent,而不是另外一種物種。
黃鐵軍:從工程、從應(yīng)用、從商業(yè)、從所有的角度,可能沒人想去做一個(gè)超越人類的、有自我意識(shí)的AGI。但是最近OpenAI發(fā)生的事情,從去年底開始,IIya和Altman的爭論觀點(diǎn)就是兩點(diǎn):你不想做但是它們可能就要出來了,出來之后我們就面臨著失控的巨大風(fēng)險(xiǎn)。你們認(rèn)為這種風(fēng)險(xiǎn)存在還是不存在?
李開復(fù):我覺得存在的,但概率不會(huì)很高。如果我們?cè)絹碓揭蕾嘡eward model完全讓AI自己找路徑的話,發(fā)生的概率或許會(huì)增高。當(dāng)然,當(dāng)前大模型的訓(xùn)練方法還不至于讓大家擔(dān)憂過度。不管在哪個(gè)時(shí)代,我認(rèn)為技術(shù)是中性的,每個(gè)科技時(shí)代有技術(shù)帶來的“電車難題”,最后人類都用了有效的方法解決了。所以,我對(duì)此是持謹(jǐn)慎樂觀的態(tài)度,短期最擔(dān)憂是壞人用它去做壞事。中長期看,我仍然建議嘗試用“以子之矛攻子之盾”——用更好的技術(shù)解決技術(shù)帶來的挑戰(zhàn),讓“AI for Good”,真正造福全人類。
張亞勤:隨著AI的能力不斷擴(kuò)大,風(fēng)險(xiǎn)也在不斷擴(kuò)大,所以現(xiàn)在考慮到未來的風(fēng)險(xiǎn)是很重要的。我不擔(dān)心所謂的AGI會(huì)出現(xiàn)意識(shí),會(huì)掌控人類。我擔(dān)心的是如果現(xiàn)在不重視AI的治理,當(dāng)AGI達(dá)到一定的能力并被大規(guī)模部署,那么可能會(huì)有失控風(fēng)險(xiǎn)。目前AI仍存在可解釋性問題,未來機(jī)器人數(shù)量可能會(huì)比人要多,那么當(dāng)大模型被用到基礎(chǔ)物理設(shè)施、金融系統(tǒng),包括國家安全,軍事系統(tǒng)等方面,就可能會(huì)有失控的風(fēng)險(xiǎn)。因此我主張一定要現(xiàn)在開始把AI治理重視起來。對(duì)于技術(shù)發(fā)展我永遠(yuǎn)持樂觀態(tài)度,我認(rèn)為我們?nèi)祟愑袃煞N智慧,一種是發(fā)明技術(shù)的智慧,一種是引導(dǎo)技術(shù)走向的智慧。我認(rèn)為我們會(huì)達(dá)到平衡,但前提是現(xiàn)在要采取行動(dòng)。
黃鐵軍:謝謝兩位的高屋建瓴的真知灼見。謝謝!
(本文首發(fā)于鈦媒體 App,作者|林志佳,編輯|胡潤峰)
![]()
快報(bào)
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論