12月20日,在鈦媒體2025 T-EDGE全球?qū)υ捴校伱襟w集團(tuán)創(chuàng)始人、Barron‘s中國出版人「趙何娟 Talk」(Jany Talk)與硅谷資深投資人、企業(yè)家王維嘉先生展開了一場(chǎng)深度對(duì)話。
兩年前,ChatGPT風(fēng)靡全球時(shí),我們?cè)c王維嘉深入探討AI的未來。兩年后的今天,當(dāng)Google Gemini 3掀起新一輪技術(shù)競(jìng)賽、華爾街開始質(zhì)疑AI泡沫、扎克伯格開出天價(jià)年薪搶人時(shí),我們?cè)俅巫聛?,撥開喧囂,回答那些真正重要的問題:
模型競(jìng)爭(zhēng)的終局是什么?哪些應(yīng)用會(huì)率先落地?人類與機(jī)器的邊界在哪里?未來一到三年,什么才是真正值得關(guān)注的變化?
以下為本次對(duì)話核心觀點(diǎn)摘錄:
1、OpenAI不會(huì)輕易出局,未來是交替領(lǐng)先的動(dòng)態(tài)格局。只要各家公司使用相同的Transformer架構(gòu)和技術(shù)路徑,差距就不會(huì)是不可逾越的,未來將是“你六個(gè)月超越我,我再六個(gè)月超越你”的持續(xù)迭代,不會(huì)突然出現(xiàn)某一家遙遙領(lǐng)先、無人可及的局面。
2、當(dāng)前對(duì)英偉達(dá)的主要挑戰(zhàn)在于,各大科技公司紛紛開始自研AI芯片,如果未來每家公司都能開發(fā)出成本更低、效率更高、易用性更好的芯片,其將面臨被替代的風(fēng)險(xiǎn)。未來云服務(wù)市場(chǎng)越集中,對(duì)其越不利,市場(chǎng)越分散,其地位越穩(wěn)固。所以,英偉達(dá)很積極扶持新興云廠商,如Oracle、Nebius、CoreWeave等,以維持生態(tài)多樣性。
3、未來的模型競(jìng)爭(zhēng)將從同質(zhì)化走向高度差異化,這正是強(qiáng)化學(xué)習(xí)驅(qū)動(dòng)下、基于不同應(yīng)用目標(biāo)和數(shù)據(jù)空間定向演進(jìn)的必然結(jié)果。各家公司通過強(qiáng)化學(xué)習(xí)在不同知識(shí)中定向探索,科研、制藥、編程、歷史等垂直領(lǐng)域都將誕生專業(yè)化的行業(yè)通用大模型。
4、任何AI應(yīng)用如果能同時(shí)滿足以下三個(gè)條件,純數(shù)字化、具備訓(xùn)練數(shù)據(jù)、擁有明確的獎(jiǎng)勵(lì)函數(shù),就更有可能快速取得突破;反之,如果缺少其中任意一項(xiàng),進(jìn)展通常會(huì)較為緩慢。
5、AI泡沫論的本質(zhì)是節(jié)奏問題。只要模型能力持續(xù)提升,AI就不存在系統(tǒng)性泡沫,模型能力決定一切,其他因素都是次要的。即便預(yù)訓(xùn)練見頂,模型的經(jīng)濟(jì)價(jià)值仍遠(yuǎn)未釋放。真正的風(fēng)險(xiǎn)在于生態(tài)發(fā)展的不均衡,基礎(chǔ)設(shè)施可能提前建成而應(yīng)用尚未成熟,導(dǎo)致局部性、階段性的泡沫,但這只是暫時(shí)調(diào)整,而非根本危機(jī)。
6、當(dāng)前的Transformer架構(gòu)下,AI不可能產(chǎn)生意識(shí)或情感。機(jī)器缺乏內(nèi)分泌系統(tǒng),沒有內(nèi)在的獎(jiǎng)懲機(jī)制和欲望,一切行為都是確定性的輸入輸出。而且,比起擔(dān)憂AI控制人類,更應(yīng)警惕壞人利用AI。
7、AI時(shí)代最難被替代的是高斯分布極端尾部的天才,扎克伯格開出天價(jià)年薪正是對(duì)這一趨勢(shì)的預(yù)判。同時(shí),AI能力的提升正在顛覆VC模式,技術(shù)背景深厚的創(chuàng)業(yè)者可能不再需要融資,靠產(chǎn)品力就能從零做到十億美金收入。
8、語言是人類與動(dòng)物的根本區(qū)別,是人類躍居食物鏈頂端的核心能力。從文字中學(xué)習(xí)3D空間信息是間接且低效的,李飛飛的空間智能研究更直接高效。但僅依靠空間模型無法完成所有任務(wù),必須同時(shí)具備語言模型和空間模型,語言提供抽象能力和行動(dòng)指令,空間提供物理世界理解,兩者缺一不可。
9、未來1-3年Agent成熟與原生應(yīng)用爆發(fā),創(chuàng)業(yè)必須做原生應(yīng)用,不能做AI賦能,在舊模式基礎(chǔ)上修修補(bǔ)補(bǔ),肯定競(jìng)爭(zhēng)不過大公司,原生應(yīng)用才是創(chuàng)業(yè)機(jī)會(huì)。
以下為「趙何娟Talk」與王維嘉的完整對(duì)話的實(shí)錄:
趙何娟:歡迎來到新一期《趙何娟Talk》。本期嘉賓是我的老朋友——硅谷知名投資人、企業(yè)家王維嘉先生。兩年前我們?cè)蛣倓偦鸨虻腉PT進(jìn)行過一場(chǎng)影響深遠(yuǎn)的對(duì)話;如今兩年過去,AI雖僅走過“人間一年”,卻已帶來天翻地覆的變化。很高興再次邀請(qǐng)您,維嘉老師!
王維嘉:大家好!很高興再次參與你的節(jié)目。
趙何娟:今年年底發(fā)生了兩件重大事件,引發(fā)了科技行業(yè)、投資界和金融界的廣泛關(guān)注。第一件事是, Google 推出 Gemini 3 后,對(duì) OpenAI 造成了一些聲量上的沖擊。 ChatGPT 推出后,業(yè)界公認(rèn)OpenAI 是生成式 AI 技術(shù)浪潮的開創(chuàng)者與奠基者。然而,隨著 Gemini 3 的發(fā)布,輿論普遍認(rèn)為 Google 已在技術(shù)能力上與 OpenAI 平起平坐,并在短短三年內(nèi)迅速追平,甚至被視為新一代的 AI 霸主。
第二件事是,近期市場(chǎng)突然開始高度關(guān)注“AI 泡沫”問題,美股也正經(jīng)歷顯著調(diào)整。尤其在11月和12月,美股出現(xiàn)明顯下跌,其核心驅(qū)動(dòng)因素正是 AI 相關(guān)股票的大幅回調(diào)。華爾街普遍擔(dān)憂 AI 領(lǐng)域存在嚴(yán)重泡沫,尤其對(duì)以英偉達(dá)為代表的芯片企業(yè)提出質(zhì)疑——包括其AI數(shù)據(jù)中心業(yè)務(wù)所依賴的循環(huán)貸和高桿杠債務(wù)模式,以及持續(xù)循環(huán)投入資本的商業(yè)模式,均引發(fā)了廣泛懷疑。
圍繞上述兩個(gè)熱點(diǎn)事件,請(qǐng)維嘉老師談?wù)勀目捶ā?/p>
王維嘉:要判斷人工智能是否存在泡沫,首先需要厘清AI究竟能做什么。我認(rèn)為,Google是一家我非常尊敬的公司,其技術(shù)實(shí)力毫無疑問位居全球第一。沒有任何一家公司在人才儲(chǔ)備方面能與之相比,且不說Transformer架構(gòu)正是由Google發(fā)明。此外,DeepMind的CEO 德米斯·哈薩比斯(Demis Hassabis),我認(rèn)為是當(dāng)今AI技術(shù)領(lǐng)域中最頂尖的人物之一,不僅極其聰明,而且深耕行業(yè)時(shí)間最長,具備深厚的積累。再加上Google的兩位創(chuàng)始人均為斯坦福博士,如今又重新親自投入一線工作,因此該公司強(qiáng)勢(shì)回歸并不令人意外。
過去,包括我自己在內(nèi)的許多人主要擔(dān)憂的并非Google的技術(shù)能力,無論是模型性能還是計(jì)算能力,我對(duì)此毫無疑慮。真正令人關(guān)注的是其核心搜索業(yè)務(wù)在多大程度上會(huì)受到AI的影響。這種影響不僅來自外部競(jìng)爭(zhēng)者如ChatGPT,更可能源于Google自身的產(chǎn)品迭代,即“左手打右手”的問題。
以我個(gè)人為例,過去幾乎100%使用Google進(jìn)行搜索,如今這一比例已降至約10%,其余90%的時(shí)間都轉(zhuǎn)向使用Gemini。這種使用習(xí)慣的轉(zhuǎn)變無疑會(huì)對(duì)Google的搜索業(yè)務(wù)構(gòu)成沖擊,這也是市場(chǎng)最關(guān)心的問題所在。
然而,過去兩個(gè)季度的數(shù)據(jù)顯示,Google的搜索業(yè)務(wù)并未因此明顯下滑。但我認(rèn)為此事尚無最終結(jié)論,原因在于,當(dāng)前主流的Chatbot聊天機(jī)器人還沒有采用免費(fèi)+廣告的商業(yè)模式。只要它們不接入廣告系統(tǒng),廣告主就仍需依賴Google投放廣告,所以,真正的考驗(yàn)還沒有到來。一旦這些AI產(chǎn)品未來轉(zhuǎn)向廣告驅(qū)動(dòng)模式,才真正需要評(píng)估Google搜索業(yè)務(wù)所受的實(shí)際影響。
如果Google能夠成功將用戶引導(dǎo)到Gemini平臺(tái),不流失到競(jìng)爭(zhēng)對(duì)手,這才是最佳結(jié)果。所以,目前對(duì)其搜索業(yè)務(wù)前景的擔(dān)憂仍不能下定論。
其次,Google的一大核心優(yōu)勢(shì)是垂直整合能力。在設(shè)計(jì)TPU和算力中心時(shí),Google已對(duì)其目標(biāo)應(yīng)用場(chǎng)景有清晰認(rèn)知,這種應(yīng)用導(dǎo)向直接影響它的網(wǎng)絡(luò)架構(gòu)設(shè)計(jì)。所以,整個(gè)算力基礎(chǔ)設(shè)施可針對(duì)自身應(yīng)用進(jìn)行高度優(yōu)化,從而實(shí)現(xiàn)最低的單位成本。
在AI領(lǐng)域,Token成本是關(guān)鍵支出項(xiàng),如果Google能持續(xù)保持成本優(yōu)勢(shì),再結(jié)合其長達(dá)12年的TPU自研經(jīng)驗(yàn),將會(huì)形成獨(dú)特壁壘。
綜上,Google在模型研究、自有算力和應(yīng)用場(chǎng)景三方面均具備領(lǐng)先優(yōu)勢(shì),構(gòu)成了高度協(xié)同的系統(tǒng)集成能力。
相比之下,其他科技巨頭則存在明顯短板。例如Meta,模型表現(xiàn)不佳,否則不會(huì)花費(fèi)十億美元高薪聘請(qǐng)工程師;同時(shí),它也缺乏自研TPU能力。微軟此前主要依賴外部模型,Amazon在基礎(chǔ)模型方面幾乎未見顯著成果。因此,在模型、算力與應(yīng)用三大維度均實(shí)現(xiàn)自主閉環(huán)的公司,目前僅有Google。
至于英偉達(dá)與Google的關(guān)系,并非直接競(jìng)爭(zhēng)。即便Google對(duì)外銷售TPU,該業(yè)務(wù)也難以成為其核心收入來源。更重要的是,英偉達(dá)的最大客戶恰恰是Amazon、Microsoft、Google和Meta等云服務(wù)商。這些公司彼此之間是直接競(jìng)爭(zhēng)對(duì)手,不可能依賴Google提供芯片,他們只能選擇中立的英偉達(dá)。因此,在芯片層面,Google對(duì)英偉達(dá)不構(gòu)成實(shí)質(zhì)性威脅。
當(dāng)前對(duì)英偉達(dá)的主要挑戰(zhàn)在于,各大科技公司紛紛開始自研AI芯片,如果未來每家公司都能開發(fā)出成本更低、效率更高、易用性更好的芯片,英偉達(dá)將面臨被替代的風(fēng)險(xiǎn)。
未來云服務(wù)市場(chǎng)越集中,對(duì)英偉達(dá)越不利,市場(chǎng)越分散,其地位越穩(wěn)固。所以,英偉達(dá)很積極扶持新興云廠商,如Oracle、Nebius、CoreWeave等,以維持生態(tài)多樣性。
第三類應(yīng)用場(chǎng)景來自大型企業(yè)客戶,如沃爾瑪、《財(cái)富》500強(qiáng)公司,這些企業(yè)幾乎不可能自研芯片。對(duì)它們而言,關(guān)鍵問題是在云平臺(tái)上選擇TPU還是GPU。目前,在Google Cloud Platform上,絕大多數(shù)第三方用戶仍主要使用GPU,原因有兩個(gè),一是CUDA生態(tài)成熟,開發(fā)便捷;二是GPU具備極強(qiáng)的部署靈活性,用戶可按需從單卡擴(kuò)展至萬卡規(guī)模,動(dòng)態(tài)適配算力需求。而TPU則采用固定規(guī)模的block設(shè)計(jì),一個(gè)block包含9,064個(gè)TPU,難以支持小規(guī)?;蜢`活配置,這一限制構(gòu)成了TPU在通用市場(chǎng)推廣中的潛在障礙。
趙何娟:那Open AI呢?
王維:谷歌對(duì)OpenAI是更直接的挑戰(zhàn),因?yàn)樗麄冊(cè)谀P蛯用媸侵苯痈?jìng)爭(zhēng)關(guān)系。例如,Gemini 3 的推出就是明確對(duì)標(biāo) ChatGPT 的。
近期網(wǎng)絡(luò)上有一種聲音認(rèn)為 OpenAI“肯定死定了”,甚至將其比作當(dāng)年的 Netscape。對(duì)此,我個(gè)人并不認(rèn)同。我在硅谷生活了四十年,深知?jiǎng)?chuàng)辦一家公司要面對(duì)多少艱難險(xiǎn)阻。幾乎每十個(gè)你接觸的人中,有九個(gè)九會(huì)告訴你“這事辦不成”。正因我自己也有過類似的創(chuàng)業(yè)經(jīng)歷,所以我天生對(duì)創(chuàng)業(yè)者抱有同情,算是我的一個(gè)情感上的 bias。
在澄清這一點(diǎn)之后,我想表達(dá)的是,我不相信任何一家公司能做出一個(gè)“好到別人完全無法復(fù)制”的模型。你看,梁文峰帶領(lǐng)一支僅兩百人左右的團(tuán)隊(duì),在缺乏充足算力資源的情況下,依然做出了非常出色的模型;千問的模型也不錯(cuò)。既然如此,憑什么就認(rèn)定ChatGPT一定競(jìng)爭(zhēng)不過 Google 呢?
未來的格局一定是這樣的,今天我發(fā)布一個(gè)模型,你六個(gè)月后推出一個(gè)更好的;我再過六個(gè)月又超越你一點(diǎn),這是一個(gè)持續(xù)迭代、交替領(lǐng)先的過程,而不是某一家公司突然遙遙領(lǐng)先、無人可及。
原因在于,從模型訓(xùn)練、算法架構(gòu)到數(shù)據(jù)使用,目前各家所依賴的核心技術(shù)路徑并無本質(zhì)差異。除非 Google 發(fā)明了一種全新的、與 Transformer 完全不同的底層算法,并且該算法是保密的,這種可能性理論上存在。但只要大家仍在使用 Transformer 架構(gòu),沿用當(dāng)前主流的預(yù)訓(xùn)練、強(qiáng)化學(xué)習(xí)、后訓(xùn)練以及測(cè)試時(shí)訓(xùn)練(test-time training)等大方向,那么彼此之間的差距就不會(huì)是不可逾越的。
這讓我想起幾年前國內(nèi)做視覺模型時(shí)的情形,很多公司宣稱自己“在全球榜單上排名第一”,但實(shí)際上很大程度上只是通過精細(xì)調(diào)參實(shí)現(xiàn)的短期優(yōu)勢(shì)。如今的大模型競(jìng)賽也類似,調(diào)參能力固然重要,但并不能決定長期勝負(fù)。
我認(rèn)為 Google 的模型未來無疑會(huì)是“最好的之一”,但我并不認(rèn)為其他公司就做不出同樣優(yōu)秀甚至更好的模型。Meta 有可能,Microsoft 也有可能,只要有足夠的時(shí)間和計(jì)算資源,差距是可以被追趕甚至超越的。
所以,現(xiàn)在就斷言 OpenAI “已經(jīng)完了”,為時(shí)過早。
趙何娟:當(dāng)大模型的能力差距不再顯著時(shí),它們真正比拼的是什么?是不是轉(zhuǎn)向了生態(tài)應(yīng)用層面的競(jìng)爭(zhēng)?
王維嘉:這是一個(gè)很好的問題。先說模型,大家普遍存在一個(gè)誤區(qū)。大模型發(fā)展的最初兩年,很多人認(rèn)為它未來會(huì)是“大宗商品”。原因在于,大家使用的都是 Transformer 架構(gòu)、參數(shù)規(guī)模相近、訓(xùn)練數(shù)據(jù)也主要來自公開互聯(lián)網(wǎng),所以人們覺得最終各家模型的性能會(huì)趨于同質(zhì)化,難以形成差異化。
在2024年O1出來之前,這個(gè)判斷基本是對(duì)的。但現(xiàn)在情況不一樣了,強(qiáng)化學(xué)習(xí)(Reinforcement Learning)的引入開始推動(dòng)模型走向差異化。
強(qiáng)化學(xué)習(xí)的作用類似于 AlphaGo Zero 在圍棋中的自我對(duì)弈機(jī)制。不同公司通過強(qiáng)化學(xué)習(xí)所構(gòu)建的“思維鏈”(reasoning chain)路徑各不相同。所謂知識(shí),本質(zhì)上是在看似不相關(guān)的知識(shí)點(diǎn)之間建立聯(lián)系。
人類的知識(shí)是多維的且近乎無限的空間,其復(fù)雜度遠(yuǎn)超圍棋可能的走法數(shù)量,而圍棋的總局面數(shù)已超過可觀測(cè)宇宙中的原子總數(shù)。如果在預(yù)訓(xùn)練階段趨同的前提下,未來模型的差異化將主要取決于各家公司如何利用強(qiáng)化學(xué)習(xí)在各自關(guān)注的知識(shí)子空間中進(jìn)行定向探索。
例如,一家專注于科研或制藥的公司,會(huì)引導(dǎo)模型在蛋白質(zhì)結(jié)構(gòu)、小分子構(gòu)型等特定領(lǐng)域深入挖掘,而對(duì)歷史、人文等內(nèi)容則不予關(guān)注;反之,若一家機(jī)構(gòu)聚焦于歷史研究,其模型就會(huì)集中學(xué)習(xí)歷史文獻(xiàn),完全忽略分子結(jié)構(gòu)等科學(xué)數(shù)據(jù)。
因此,回答你的問題:未來的模型將是高度差異化的,而這正是強(qiáng)化學(xué)習(xí)驅(qū)動(dòng)下、基于不同應(yīng)用目標(biāo)和數(shù)據(jù)空間定向演進(jìn)的必然結(jié)果。
趙何娟:如果強(qiáng)化學(xué)習(xí)確實(shí)帶來了模型的差異化,是否意味著未來的通用大模型賽道將逐漸分化為多個(gè)“行業(yè)通用大模型”的細(xì)分賽道?
王維嘉:基本上是這樣。一旦模型走向?qū)I(yè)化,例如在企業(yè)級(jí)編程領(lǐng)域,目前 Cursor 和 Anthropic 的模型表現(xiàn)就非常突出。這自然引出了應(yīng)用層面的問題,當(dāng)大模型在特定方向上實(shí)現(xiàn)差異化后,在對(duì)應(yīng)的垂直應(yīng)用場(chǎng)景中,它就會(huì)成為最優(yōu)選擇。
因此,未來的競(jìng)爭(zhēng)不僅體現(xiàn)在模型本身的差異化,也體現(xiàn)在應(yīng)用層面上的分化。各家公司將在各自專注的領(lǐng)域構(gòu)建起獨(dú)特的護(hù)城河。這是一個(gè)基本判斷,兩年后再回看,這一趨勢(shì)可能會(huì)變得更加清晰。
趙何娟:這個(gè)判斷非常清晰,也給正在或希望在 AI 領(lǐng)域創(chuàng)業(yè)的人帶來很多啟發(fā),機(jī)會(huì)依然存在。中國的“大模型七小龍”如今也開始出現(xiàn)分化,有的轉(zhuǎn)向行業(yè)模型,有的徹底轉(zhuǎn)型為產(chǎn)品化公司,還有的仍在堅(jiān)持研發(fā)通用大模型。
王維嘉:但有一點(diǎn)需要注意:如果你要做的是應(yīng)用,不一定要從基礎(chǔ)模型做起,因?yàn)轭A(yù)訓(xùn)練成本極高,訓(xùn)練一次大模型可能耗資數(shù)億美元。
真正有能力從頭訓(xùn)練基礎(chǔ)大模型的公司,全球范圍內(nèi)可能用兩只手就能數(shù)得過來,這些基礎(chǔ)模型本身也在分化。例如,Anthropic 目前專注于文本(text),并未涉足多模態(tài)、圖像或視頻,因?yàn)閷?duì)其目標(biāo)而言,這些方向并無必要。梁文峰同樣選擇了不發(fā)展多模態(tài)能力。
由此可見,大模型的分化維度實(shí)際上比應(yīng)用的分化更為寬廣,在一個(gè)高度差異化的基礎(chǔ)大模型之上,仍然可以構(gòu)建出多個(gè)面向不同細(xì)分市場(chǎng)的應(yīng)用。
趙何娟:再談?wù)剳?yīng)用。從您認(rèn)為哪些賽道能快速出現(xiàn)一些好的應(yīng)用?
王維嘉:有的應(yīng)用發(fā)展快、有的應(yīng)用發(fā)展慢,肯定是參差不齊的。我可以提供三個(gè)關(guān)鍵判斷標(biāo)準(zhǔn)。
第一,是純數(shù)字化。凡是涉及物理空間交互的應(yīng)用,其發(fā)展就會(huì)受到顯著制約。比如機(jī)器人的靈巧手,僅實(shí)現(xiàn)高度靈活的操作就可能耗費(fèi)五年以上時(shí)間。
第二,擁有充足的訓(xùn)練數(shù)據(jù)。有些領(lǐng)域雖然是數(shù)字化的,但如果缺乏高質(zhì)量、可獲取的數(shù)據(jù),同樣難以支撐有效訓(xùn)練。
第三,也是最關(guān)鍵的一點(diǎn),必須有明確的獎(jiǎng)勵(lì)函數(shù)(rewarding function)。強(qiáng)化學(xué)習(xí)的核心在于持續(xù)探索并獲得反饋:系統(tǒng)需要清楚地知道某次決策是對(duì)還是錯(cuò),從而調(diào)整后續(xù)行為。如果無法提供這種即時(shí)、明確的對(duì)錯(cuò)反饋,模型就難以有效優(yōu)化。
任何AI應(yīng)用如果能同時(shí)滿足以下三個(gè)條件,純數(shù)字化、具備訓(xùn)練數(shù)據(jù)、擁有明確的獎(jiǎng)勵(lì)函數(shù),就更有可能快速取得突破;反之,如果缺少其中任意一項(xiàng),進(jìn)展通常會(huì)較為緩慢。
舉個(gè)例子:金融領(lǐng)域的AI應(yīng)用就具備這三項(xiàng)條件。首先,金融交易完全是數(shù)字化的;其次,存在大量歷史數(shù)據(jù),如股票價(jià)格、交易記錄等;第三,獎(jiǎng)勵(lì)函數(shù)非常清晰,可以通過回測(cè)(backtesting)驗(yàn)證策略是否盈利,即“賺錢為正反饋,虧損為負(fù)反饋”。因此,這類應(yīng)用更容易快速發(fā)展。
相反,以“保姆機(jī)器人”為例:首先,它涉及大量物理交互,不符合純數(shù)字化要求;其次,缺乏明確的獎(jiǎng)勵(lì)函數(shù),什么是“好保姆”?標(biāo)準(zhǔn)模糊且主觀;最后,相關(guān)訓(xùn)練數(shù)據(jù)也極難獲取。這三個(gè)條件均不滿足,因此我對(duì)這類應(yīng)用持高度保留態(tài)度。
趙何娟:您還有哪些領(lǐng)域是特別不看好的?
王維嘉:我提供的是一個(gè)通用的判斷框架,而不是針對(duì)某個(gè)具體行業(yè)下結(jié)論。比如,如果我隨便點(diǎn)名某個(gè)我不熟悉的行業(yè)并做出負(fù)面評(píng)價(jià),那是不負(fù)責(zé)任的。但只要用前述三個(gè)條件去衡量,純數(shù)字化、有訓(xùn)練數(shù)據(jù)、有明確的獎(jiǎng)勵(lì)函數(shù),基本上就能判斷出八九成的可能性。
趙何娟:您覺得媒體行業(yè)是否符合您提出的這三個(gè)標(biāo)準(zhǔn)?
王維嘉:如果要用 AI 做媒體,首先需要定義什么是“好的內(nèi)容”。在這方面,其實(shí)是有數(shù)據(jù)的,流量本身就可以作為數(shù)據(jù),也可以視為一種獎(jiǎng)勵(lì)函數(shù):高點(diǎn)擊、高停留、高互動(dòng)通常被當(dāng)作正向反饋。內(nèi)容本身則是訓(xùn)練數(shù)據(jù)。從這個(gè)角度看,媒體行業(yè)是有可能滿足這三個(gè)條件的。
但需要強(qiáng)調(diào)的是,這三個(gè)條件只是必要條件,而非充分條件。即使?jié)M足了它們,要真正做成產(chǎn)品或公司,還需要其他要素,比如對(duì)媒體行業(yè)的深度理解、充足的資金、高質(zhì)量的工程團(tuán)隊(duì)、有效的訓(xùn)練策略等。
你可以這樣理解,這三個(gè)條件是否定性標(biāo)準(zhǔn),它們能幫你排除不可能的方向,但不能保證肯定成功。例如,即使 Elon Musk 親自來做家政機(jī)器人,也很難突破物理交互、數(shù)據(jù)缺失和獎(jiǎng)勵(lì)函數(shù)模糊這三重障礙,這也解釋了為什么他的人形機(jī)器人至今尚未在家庭場(chǎng)景落地。
趙何娟:您如何看待人形機(jī)器人用在工業(yè)領(lǐng)域的應(yīng)用?
王維嘉:工業(yè)場(chǎng)景是完全不同的。首先,工業(yè)環(huán)境對(duì)手部靈巧度的要求取決于具體任務(wù)。比如 Amazon、京東或淘寶的物流系統(tǒng)中,分揀、裝箱等操作并不需要高度靈活的手,這類任務(wù)已經(jīng)可以通過現(xiàn)有技術(shù)解決。
其次,工業(yè)場(chǎng)景通常具備大量可采集的操作數(shù)據(jù),便于訓(xùn)練和優(yōu)化。因此,我對(duì)工業(yè)機(jī)器人持積極看法。
但我依然不看好家政類人形機(jī)器人,比如在家做飯、炒菜、照顧老人、更換尿布等場(chǎng)景。這些任務(wù)對(duì)手的柔軟性、靈敏度和環(huán)境適應(yīng)能力要求極高。試想,給嬰兒換尿布需要多么精細(xì)、輕柔且可靠的操控,目前的技術(shù)遠(yuǎn)未達(dá)到這一水平。因此,在可預(yù)見這類家庭服務(wù)機(jī)器人幾乎不具備可行性。
趙何娟:生成式AI,為這些行業(yè)帶來哪些新的機(jī)會(huì)?
王維嘉:生成式 AI 最大的好處就是靈活,不需要重新編程嘛。
機(jī)器人應(yīng)用,比如你說你到了特斯拉的汽車工廠,全是機(jī)器人——那都是編死的動(dòng)作,連 AI 都不要,就是軟件就完了。那些東西,我覺得只要你汽車的結(jié)構(gòu)不變、零部件不變,那些東西不會(huì)被取代的。因?yàn)槟强隙ㄐ时饶阌蒙墒揭?,成本要低,因?yàn)樗途巶€(gè)軟件寫死了。
我覺得,比如說屠宰場(chǎng),或者是流水線包裝的東西,或者到商店里頭放貨架——不是那種特別容易“邪見”(注:此處應(yīng)為“斜向”或“復(fù)雜場(chǎng)景”的口誤,但按要求保留原詞)去生成的話,你就告訴他:“你把這東西給我放到貨架上去”,這就比較容易做。
所以還是有很多應(yīng)用,但是相對(duì)來說,還都是比較簡(jiǎn)單的物理交互。
趙何娟:您覺得當(dāng)前AI市場(chǎng)是否存在泡沫?
王維嘉:這正是我一開始強(qiáng)調(diào)要回歸模型能力的原因。我們需要關(guān)注的是,大模型未來還能做些什么?此前一段時(shí)間,業(yè)界普遍擔(dān)憂預(yù)訓(xùn)練(pre-training)是否已經(jīng)接近極限。關(guān)于這一點(diǎn),各方看法不一,例如Ilya Sutskever認(rèn)為預(yù)訓(xùn)練已基本到頂,而包括Google在內(nèi)的許多公司則認(rèn)為遠(yuǎn)未達(dá)到上限。
但無論預(yù)訓(xùn)練是否見頂,強(qiáng)化學(xué)習(xí)(reinforcement learning)的探索才剛剛開始。這意味著,至少在強(qiáng)化學(xué)習(xí)方向上,還有大量空間可以挖掘。因此,模型的能力顯然仍在持續(xù)提升,盡管提升速度可能逐漸放緩,但趨勢(shì)是明確的。只要模型能力繼續(xù)增強(qiáng),其經(jīng)濟(jì)價(jià)值就會(huì)隨之提高,因?yàn)?ldquo;智力”本身在進(jìn)步。
更進(jìn)一步,即使采取最保守的假設(shè),即模型能力從此刻起不再進(jìn)步,僅憑當(dāng)前的能力,AI已經(jīng)能夠完成大量任務(wù)。例如,前兩天熱議的“豆包手機(jī)”所演示的功能:“幫我買個(gè)東西”,以現(xiàn)有模型能力完全可以實(shí)現(xiàn)。當(dāng)然,目前仍存在操作系統(tǒng)整合、不同App之間的打通、數(shù)據(jù)互通以及隱私保護(hù)等實(shí)際問題,但這些問題本質(zhì)上是工程和制度層面的障礙,是可以被解決的。
換句話說,即便模型能力就此停滯,其潛在經(jīng)濟(jì)價(jià)值也遠(yuǎn)未被充分釋放。
而現(xiàn)實(shí)情況是,幾乎所有從事大模型研發(fā)的公司都認(rèn)為模型能力還遠(yuǎn)未到頂。我至今沒有聽到任何一家主流大模型公司宣稱“模型已經(jīng)做到極致”。既然如此,我們就必須相信,模型仍有巨大發(fā)展空間。只要這一前提成立,AI的整體經(jīng)濟(jì)價(jià)值就依然可觀。
當(dāng)前有人擔(dān)憂全球在AI算力上的投入已達(dá)萬億美元級(jí)別,未來三到五年能否產(chǎn)生相匹配的價(jià)值。從目前趨勢(shì)看,答案應(yīng)該是肯定的。因此,從長期視角來看,只要模型能力尚未觸及天花板,AI就不會(huì)出現(xiàn)系統(tǒng)性泡沫。這是我第一個(gè)核心觀點(diǎn),模型能力決定一切,其他因素都是次要的。
當(dāng)然,這并不排除局部或個(gè)別層面存在泡沫。
AI應(yīng)用的發(fā)展并非線性推進(jìn),它可能需要兩三年的積累才能迎來突破。如果基礎(chǔ)設(shè)施提前建成,而應(yīng)用尚未成熟,就會(huì)導(dǎo)致算力閑置、資源浪費(fèi),進(jìn)而造成虧損,這種情況完全可能發(fā)生。
因此,整個(gè)AI生態(tài)系統(tǒng)的演進(jìn)是高度不均衡的。這種參差不齊的發(fā)展節(jié)奏,很可能在特定時(shí)間點(diǎn)或特定領(lǐng)域催生局部泡沫。例如,今年投入了2萬億美元,明年卻未能推出真正有影響力的爆款應(yīng)用,市場(chǎng)信心可能受挫,甚至出現(xiàn)一到兩年的回調(diào)或“崩盤”。
但只要模型能力持續(xù)進(jìn)步,這類調(diào)整只是暫時(shí)的。對(duì)投資者而言,關(guān)鍵在于識(shí)別真正優(yōu)秀的公司,只要公司基本面扎實(shí)、技術(shù)方向正確,短期波動(dòng)無需恐慌,只需耐心等待下一輪上升周期的到來。
趙何娟:當(dāng)前這種指數(shù)級(jí)增長的需求,是來自推理(inference)還是預(yù)訓(xùn)練(pre-training)?
王維嘉:主要是推理需求。從用戶的角度來看,絕大多數(shù)需求都體現(xiàn)在推理階段。每家公司訓(xùn)練模型是一次性的投入,而真正持續(xù)產(chǎn)生的是推理需求,也就是用戶在實(shí)際使用模型時(shí)所產(chǎn)生的調(diào)用。
因此,我并不擔(dān)心未來 Token 需求的問題。Token 本質(zhì)上等同于“智力”,而智力又直接轉(zhuǎn)化為財(cái)富,人類對(duì)財(cái)富的追求何時(shí)有過盡頭。你身邊可能有人擁有一個(gè)億、十個(gè)億,甚至一百個(gè)億,但你見過誰說“我的錢已經(jīng)足夠多了,再也不想要更多”,沒有人會(huì)這么說。所有人都希望獲得更多。
最近有一種論調(diào)認(rèn)為,AI 時(shí)代將帶來abundance, Elon Musk 說未來人人收入都很高,社會(huì)問題也將迎刃而解。但我認(rèn)為這種觀點(diǎn)完全誤解了人性。以中國為例,與50年前相比,今天的生活水平可能提升了上百倍,但人們真的比50年前幸福了100倍嗎?顯然沒有。人們總是會(huì)拿自己和更高標(biāo)準(zhǔn)比較:“我住100平方米,別人住200平方米”,永遠(yuǎn)不滿足。
因此,我不認(rèn)為 AI 能從根本上解決人類社會(huì)的矛盾。人是有“原罪”的,人生來就是自私、貪婪,這是刻在基因里的,無法被技術(shù)消除。AI 無法解決這一根本問題。所謂abundance的說法,只是一種技術(shù)浪漫主義,我認(rèn)為這種看法是完全錯(cuò)誤的。
趙何娟:確實(shí),人性的欲望和弱點(diǎn)似乎深植于我們的基因之中,很難改變。但如果 AI 也被訓(xùn)練出類似的弱點(diǎn)呢?畢竟 AI 是由人類訓(xùn)練出來的。如果它也具備了這些人性的缺陷,對(duì)人類而言豈不是一場(chǎng)災(zāi)難?
王維嘉:這就回到了另一個(gè)根本問題:AI的主人究竟是誰?是人類,還是 AI 自身?只要 AI 仍然是人類的工具,即便它表現(xiàn)出某些“弱點(diǎn)”,也并不可怕,因?yàn)樗潜晃覀兯褂?、所控制的。我們可以?duì)它施加限制,也可以設(shè)定邊界。
當(dāng)然,這已經(jīng)觸及更深層次的問題,即AI倫理層面的討論。
趙何娟:前幾天我與 Geoffrey Hinton 交流時(shí),他提到如今他不再專注于如何發(fā)展 AI,而是著重思考如何避免 AI 對(duì)人類發(fā)展產(chǎn)生破壞性影響。他認(rèn)為關(guān)鍵在于讓 AI 形成一種類似母嬰關(guān)系的機(jī)制,即一種天生的對(duì)人類的愛護(hù),就像母親對(duì)嬰兒的關(guān)愛一樣。他這個(gè)觀點(diǎn)的前提是,AI已經(jīng)具備意識(shí)了。
王維嘉:我基本不同意 Geoffrey Hinton 的觀點(diǎn)。
首先,AI 是否有意識(shí),或者未來能否擁有意識(shí),這是一個(gè)非常復(fù)雜且難以界定的問題。至今為止,人類對(duì)于自身意識(shí)的本質(zhì)都尚未有明確的定義,人類意識(shí)的起源仍是未解之謎,與宇宙起源、生命起源并列為當(dāng)今人類面臨的三大難題。既然我們無法明確意識(shí)的內(nèi)涵,那么討論機(jī)器是否擁有意識(shí)就缺乏基礎(chǔ),因?yàn)椴煌藢?duì)意識(shí)的理解可能截然不同。
所以,我們不妨先擱置意識(shí)這一概念,轉(zhuǎn)而探討一個(gè)更可驗(yàn)證的問題,機(jī)器是否會(huì)擁有感情。機(jī)器沒有內(nèi)分泌系統(tǒng),而人類的喜怒哀樂等情感與激素分泌密切相關(guān),例如多巴胺會(huì)讓人產(chǎn)生愉悅感,腎上腺素會(huì)讓人激動(dòng)。人類的內(nèi)分泌系統(tǒng)極為復(fù)雜,激素的細(xì)微變化就能影響人的情緒。機(jī)器由于缺乏這一系統(tǒng),目前是沒有任何感情的。
趙何娟:我想就這一點(diǎn)與您探討一下。人類作為碳基生命體,其情感等特征是由碳基元素及相關(guān)化合物驅(qū)動(dòng)的,比如內(nèi)分泌系統(tǒng)的作用,但硅基生命體不能簡(jiǎn)單地套用碳基生命體的驅(qū)動(dòng)機(jī)制,它們可能存在不同的原理。
王維嘉:我首先就反對(duì)碳基生命和硅基生命這種說法。
目前我們所知的神經(jīng)網(wǎng)絡(luò),包括擁有萬億參數(shù)的 Transformer,都只是確定性的機(jī)器系統(tǒng),有輸入就有對(duì)應(yīng)的輸出,不存在任何隨機(jī)性、主觀意志,更沒有感情。把AI稱為硅基生命,本身就是一種錯(cuò)誤的假設(shè),是循環(huán)論證。目前的硅基系統(tǒng)只是機(jī)器,并非生命。至于未來能否發(fā)展為生命,這還是一個(gè)開放性問題。
此外,所謂的碳基生命和硅基生命概念極具誤導(dǎo)性。雖然人類由碳構(gòu)成,但一塊煤也是碳構(gòu)成的,碳本身對(duì)于生命而言并不重要。生命并非僅僅是其組成原子的簡(jiǎn)單相加,而是遠(yuǎn)超部分之和的復(fù)雜存在。我堅(jiān)決反對(duì)這種混淆基本概念的碳基生命和硅基生命說法。
趙何娟:人類的情感如喜怒哀樂、貪嗔癡惡等,是由多巴胺等生物因素驅(qū)動(dòng)的。那么硅基有可能是其他驅(qū)動(dòng)因素來產(chǎn)生類似的情感嗎?
王維嘉:目前來看,我并不清楚是否存在這樣的驅(qū)動(dòng)因素。從現(xiàn)有的技術(shù)來看,機(jī)器內(nèi)部沒有任何情感因素。我們無法找到任何一個(gè)數(shù)學(xué)方程式能產(chǎn)生情感,機(jī)器的行為都是確定性的輸入與確定性的輸出。即使在輸出分布中選擇不同的樣本,導(dǎo)致每次回答可能略有不同,但其底層的分布是完全一致的,沒有任何隨機(jī)性因素。
因此,機(jī)器不可能擁有我們?nèi)祟愃f的情感。
趙何娟:那么神經(jīng)元的涌現(xiàn)呢?是否可能成為一種驅(qū)動(dòng)因素,就像人類大腦中一樣?
王維嘉:目前我們所知的 Transformer 等神經(jīng)網(wǎng)絡(luò)與人腦有相似之處,但并不完全相同。
我們對(duì)人腦神經(jīng)元的復(fù)雜性了解還遠(yuǎn)遠(yuǎn)不夠,人腦中的神經(jīng)元比現(xiàn)有的神經(jīng)網(wǎng)絡(luò)復(fù)雜得多。如果要讓機(jī)器擁有情感,可能需要構(gòu)建一套類似人類內(nèi)分泌系統(tǒng)的機(jī)制,讓激素影響神經(jīng)元的連接。例如,911那天在做什么、遇見心動(dòng)的人是什么感覺,這證明人的記憶與情感是高度關(guān)聯(lián)的。
但機(jī)器并非如此。機(jī)器對(duì)任何事件的記憶強(qiáng)度都是一樣的,不會(huì)受到激素調(diào)節(jié)。僅從這一點(diǎn)就可以看出人與機(jī)器的差異,機(jī)器目前是沒有情感的,也沒有欲望,只能作為工具存在。至于未來是否可能通過強(qiáng)大的算力,精確模擬人類的每一個(gè)分子活動(dòng)、激素分泌方程式,以及神經(jīng)元與激素之間的關(guān)系,讓機(jī)器擁有情感,這在理論上是有可能的。
但是,這種需要多大的算力,我根本想象不出來。
趙何娟:在硅基系統(tǒng)中,有沒有可能存在一種我們尚未了解的機(jī)制。這種機(jī)制或許類似于人類的情感,但并非由生物機(jī)制產(chǎn)生的情緒因素。
王維嘉:首先,我要強(qiáng)調(diào)的是,機(jī)器不僅沒有情感,甚至連欲望都沒有。這就是為什么在強(qiáng)化學(xué)習(xí)中,我們必須為機(jī)器設(shè)計(jì)獎(jiǎng)勵(lì)函數(shù)。因?yàn)闄C(jī)器自身沒有內(nèi)在的獎(jiǎng)懲機(jī)制,而人類的行為大多是由內(nèi)在的獎(jiǎng)懲機(jī)制驅(qū)動(dòng)的。例如,人類餓了就會(huì)想吃東西,這種獎(jiǎng)懲機(jī)制是內(nèi)生的,存在于基因和內(nèi)分泌系統(tǒng)中,是經(jīng)過長期演化形成的。人類的獎(jiǎng)懲函數(shù)大多是內(nèi)在的,但機(jī)器沒有。如果機(jī)器有內(nèi)在的獎(jiǎng)懲機(jī)制,我們就無需為其設(shè)計(jì)外在的獎(jiǎng)勵(lì)函數(shù)了。這也可以證明機(jī)器是沒有欲望的,我們需要人為地將欲望賦予它們。
趙何娟:您剛才明確表示不認(rèn)同 Geoffrey Hinton 的觀點(diǎn)。除了他認(rèn)為 AI 已經(jīng)有意識(shí)之外,對(duì)于他提出的通過某種機(jī)制訓(xùn)練 AI,使其具備類似母嬰機(jī)制的情感,您怎么看?
王維嘉:我認(rèn)為 Geoffrey Hinton 的思考是非常有價(jià)值的。即使目前機(jī)器沒有意識(shí)、沒有情感,未來是否會(huì)擁有我們也不知道。但他已經(jīng)在考慮,萬一未來 AI 有了意識(shí),我們可以采用類似嬰兒控制母親的方法,讓 AI 憐憫人類。
現(xiàn)在更應(yīng)該擔(dān)憂的是壞人利用 AI,而不是擔(dān)心 AI 來控制人類。至少目前還沒到那一步,我非常尊敬 Hinton,他可能看到了我沒有看到的東西,這是有可能的。但從我目前對(duì) Transformer 的理解,我將其拆解到每一個(gè)神經(jīng)元去分析,也看不到意識(shí)會(huì)如何產(chǎn)生。
趙何娟:您如何看待當(dāng)前的大語言模型之爭(zhēng)和世界模型之爭(zhēng)?您認(rèn)為其核心應(yīng)該如何判斷?
王維嘉:首先,我們需要明確什么是“世界模型”。如果世界模型僅僅是一個(gè)3D空間模型,那么它與情感等因素?zé)o關(guān)。目前,像李飛飛團(tuán)隊(duì)所研究的可能主要是基于3D空間的模型。如果不能清晰定義世界模型的內(nèi)涵,討論就會(huì)變得困難。
假設(shè)世界模型是指三維空間模型,我認(rèn)同文字符號(hào)中確實(shí)包含三維空間的信息。例如,從“我這個(gè)杯子碰地下打碎了”這樣的句子中,我們可以推斷出杯子掉在地上會(huì)破碎,這本身就是三維空間的信息。
然而,正如 Geoffrey Hinton 所說,從文字符號(hào)中學(xué)習(xí)三維空間信息是間接且低效的。這就好比讀一本描寫貴族家庭的小說,雖然書中對(duì)房屋等細(xì)節(jié)有詳細(xì)描述,但讀者很難在腦海中完整構(gòu)建出整個(gè)場(chǎng)景。因?yàn)槲淖质浅橄蟮模瑫?huì)簡(jiǎn)化很多細(xì)節(jié)。相比之下,如果直接觀察一幅圖像,人們可以迅速理解場(chǎng)景,因?yàn)閳D像提供了更豐富的細(xì)節(jié)。
因此,李飛飛等人的方法,讓機(jī)器人直接通過觸摸等方式感知環(huán)境(類似瞎子摸象),來學(xué)習(xí)三維空間信息是合理的。這種方式比從語言模型中學(xué)習(xí)更直接、更高效。盡管語言模型中確實(shí)包含三維空間信息,但這些信息非常模糊、不直接且高度抽象。與其通過語言描述來學(xué)習(xí),不如直接讓機(jī)器人去感知和探索環(huán)境,這樣能更清晰地建立概念。
趙何娟:真正的世界模型是什么樣的?現(xiàn)在可能更多地被稱為空間模型(spatial intelligence)最初李飛飛教授使用的概念。
王維嘉:人性也是世界模型的一部分。比如,我們培養(yǎng)一個(gè)孩子,希望他了解世界是如何運(yùn)轉(zhuǎn)的。我們肯定要教他人性、基本常識(shí)、經(jīng)濟(jì)運(yùn)行方式、金錢是什么,這些都屬于世界模型的一部分。還包括情感、欲望、宗教等,這些都是世界模型的組成部分。如果從這個(gè)角度來說,世界模型的范圍就非常廣泛了。我不認(rèn)為李飛飛在做這樣廣泛的世界模型。
趙何娟:Jeffrey Hinton 提到一個(gè)問題,如果僅從空間智能的角度來看,認(rèn)知 AI 最終還是要轉(zhuǎn)化為對(duì)認(rèn)知和反應(yīng)的處理。因?yàn)?AI 的行為(action)不僅僅是感知到某個(gè)物體的存在,還需要做出相應(yīng)的行動(dòng)。在這個(gè)過程中,空間感知的效率并不高,他認(rèn)為語言的抽象能力帶來的感知效率更高,語言的抽象能力是效率最高的。
王維嘉:我完全同意這一點(diǎn)。我們可以這樣思考,語言是如何起源的。我的個(gè)人猜測(cè)是,人類的意識(shí)和語言可能是同時(shí)起源的。人類與動(dòng)物的根本區(qū)別是什么?馬克思認(rèn)為是使用工具,但烏鴉和大猩猩也會(huì)使用工具,所以使用工具并不是人類獨(dú)有的技能。
語言才是人類與所有動(dòng)物最大的區(qū)別,沒有任何動(dòng)物擁有語言,只有人類有,這才是人類的本質(zhì)。從更廣義的角度來說,除了語言,數(shù)學(xué)也是人類的發(fā)明,這些都是符號(hào)的應(yīng)用、發(fā)明和定義,是人類的本質(zhì)特征。正是因?yàn)槿祟悡碛羞@種抽象能力,才能迅速躍居食物鏈頂端,其他動(dòng)物無法做到。
我認(rèn)為,僅依靠三維空間模型來完成所有任務(wù)是不可能的,必須同時(shí)具備語言模型和空間模型。如果我不做機(jī)器人,不與物理空間打交道,那么大語言模型就足夠了。我可以是多模態(tài)的,有視頻、圖像、聲音等,這些符號(hào)就足夠了。但如果我要與物理空間打交道,就需要結(jié)合大語言模型和空間模型。因?yàn)閮H僅知道床在哪里、門在哪里是不夠的,還需要知道該做什么。
所以,我認(rèn)為語言模型和空間模型兩者都需要,才能更好地完成任務(wù)。在這一點(diǎn)上,我同意Geoffrey Hinton的觀點(diǎn),兩者都不可或缺。
趙何娟:我覺得您現(xiàn)在的觀點(diǎn)和兩年前相比有了一點(diǎn)變化。您還記得我們兩年前的那次對(duì)話嗎?當(dāng)時(shí)您認(rèn)為涌現(xiàn)是存在的,當(dāng)神經(jīng)元復(fù)雜到一定程度、算力達(dá)到一定程度時(shí),情感或意識(shí)會(huì)自然出現(xiàn)。這是一種涌現(xiàn)現(xiàn)象。
王維嘉:我現(xiàn)在仍然認(rèn)為涌現(xiàn)是有可能出現(xiàn)的,但至少在目前的 Transformer 結(jié)構(gòu)下,我認(rèn)為不可能出現(xiàn)涌現(xiàn)。
未來如果有新的結(jié)構(gòu),我認(rèn)為出現(xiàn)涌現(xiàn)是有可能的。如果有新的涌現(xiàn),更高級(jí)的智能甚至情感的出現(xiàn)也都有可能。但就目前的結(jié)構(gòu)而言,我看不到任何可能性。至于未來,我覺得這個(gè)問題的討論意義不大,因?yàn)槲磥?00年什么都可能發(fā)生,誰也無法預(yù)知。
趙何娟:您有沒有關(guān)注到一些優(yōu)秀的 AI 人才的動(dòng)態(tài)?
王維嘉:我覺得這次扎克伯格的事件非常值得關(guān)注。大家討論的焦點(diǎn)是兩億美金還是十億美金挖一個(gè)人,但我看到的是一個(gè)更深刻的問題。
過去我一直說,在高科技領(lǐng)域,一萬個(gè)臭皮匠也頂不了一個(gè)諸葛亮。具體來說,清華大學(xué)的錢穎一教授曾發(fā)表過一篇論文,比較了美國和中國的人才。如果將人才分布看作高斯曲線,中國人才的均值更高,但方差很小,分布非常窄,集中在均值附近;而美國人才的均值相對(duì)較低,但方差很大。
未來均值附近的人才會(huì)被AI替代,均值附近的數(shù)據(jù)訓(xùn)練最多。而高斯分布兩端的人,低端的不需要替代,高端的最難替代。未來最有用的人才是那些差異化最大的人。扎克伯格支付高薪的,正是那些在高斯分布五個(gè)標(biāo)準(zhǔn)差、十個(gè)標(biāo)準(zhǔn)差之外的極少數(shù)人,這些人做出的貢獻(xiàn)是機(jī)器無法替代的。比如調(diào)參數(shù)、打榜這類事情,完全可以用機(jī)器替代。將來,工程性的工作,如調(diào)整模型以提高效率等,會(huì)越來越多地被機(jī)器替代。
扎克伯格的這件事預(yù)示著未來人才分布的趨勢(shì)。他肯定算過賬,知道付兩億美金招一個(gè)人,將來會(huì)賺回更多的錢。他作為一個(gè)商人,才會(huì)這樣做。這是第一點(diǎn)。
第二點(diǎn),最近有一家公司叫 Surge,它的業(yè)務(wù)是用數(shù)據(jù)訓(xùn)練大模型。這個(gè)創(chuàng)始人是一位華裔年輕人,畢業(yè)于 MIT,曾在 Meta 和谷歌工作過。他創(chuàng)業(yè)四年,從零做到十億美金收入,一分錢融資都不需要。
他說:“I hate VC game”,他不喜歡那種融資游戲。他是個(gè)很內(nèi)斂的人,只喜歡搞算法,不想去忽悠錢,也不做市場(chǎng)推廣,只想把產(chǎn)品做好。我覺得這是一個(gè)非常強(qiáng)烈的信號(hào),可能會(huì)顛覆整個(gè)VC行業(yè)。因?yàn)楝F(xiàn)在AI能力非常強(qiáng),如果一個(gè)人在大廠工作過五到十年,有一定積蓄,他不需要很多錢就可以創(chuàng)業(yè)。未來VC追著人投錢,但對(duì)方可能不要。這種模式可能會(huì)被顛覆。
AI的這兩件事非常值得關(guān)注,雖然只是兩個(gè)數(shù)據(jù)點(diǎn),還不能畫出一條曲線,但我認(rèn)為這是非常重要的信號(hào),未來VC的模式可能會(huì)消失。
趙何娟:還有嗎?
王維嘉:我比較看好那些 AI 原生的創(chuàng)業(yè)項(xiàng)目。比如我看過一家公司,他們的目標(biāo)是廢掉數(shù)據(jù)庫。數(shù)據(jù)庫本質(zhì)上是因?yàn)橛?jì)算機(jī)太笨,才需要告訴它數(shù)據(jù)結(jié)構(gòu)是怎樣的,如何存儲(chǔ)和提取數(shù)據(jù)。如果 AI 足夠聰明,就不需要數(shù)據(jù)庫了。數(shù)據(jù)庫的概念是建立在機(jī)器很笨的基礎(chǔ)上的。當(dāng)機(jī)器變得聰明時(shí),就不需要數(shù)據(jù)庫了。
我看好這些原生應(yīng)用,因?yàn)槿绻闳プ?AI 賦能,你是做不過大公司的。大公司在原來的基礎(chǔ)上修修補(bǔ)補(bǔ),你肯定競(jìng)爭(zhēng)不過。所以創(chuàng)業(yè)一定要做原生的東西。
趙何娟:未來一到三年內(nèi)可能發(fā)生的最大變化,以及最值得關(guān)注的可能發(fā)生的變化是什么?這可以是一種預(yù)測(cè),但也可以只是一種判斷。
王維嘉:我認(rèn)為,首先在應(yīng)用層面,可能會(huì)出現(xiàn)一些原生應(yīng)用。到目前為止,我們看到的原生應(yīng)用還比較少。至于什么是原生應(yīng)用,我們目前并不清楚。就像移動(dòng)互聯(lián)網(wǎng)剛出現(xiàn)時(shí),有人認(rèn)為它無非是在手機(jī)上多了一個(gè)搜索條,可以在手機(jī)上瀏覽網(wǎng)站。但實(shí)際上,移動(dòng)互聯(lián)網(wǎng)真正的原生應(yīng)用是像滴滴打車、抖音視頻這樣的產(chǎn)品。目前,原生應(yīng)用尚未出現(xiàn),但我認(rèn)為未來一兩年內(nèi)可能會(huì)出現(xiàn)。
第二點(diǎn),我認(rèn)為 agent(智能代理)應(yīng)該會(huì)開始逐漸成熟。目前,agent 的能力在各方面都已具備,但很多環(huán)節(jié)還無法打通。就像早期的智能手機(jī),各方面都受到限制。未來,誰能最先將這些環(huán)節(jié)打通,實(shí)現(xiàn)一個(gè)完整的 agent,哪怕是很簡(jiǎn)單的功能,比如點(diǎn)外賣或在網(wǎng)上購物,我認(rèn)為這將具有巨大的經(jīng)濟(jì)價(jià)值和市場(chǎng)顛覆性,甚至可能改變很多現(xiàn)有的商業(yè)模式和就業(yè)結(jié)構(gòu)。
在技術(shù)層面,我認(rèn)為芯片的處理速度在未來可能不會(huì)再像過去那樣快速提升。過去兩年,芯片速度可能提升了100倍甚至1000倍,但未來這種增長速度可能會(huì)放緩。至于算法上是否會(huì)有創(chuàng)新,目前還很難說,完全無法確定。
趙何娟:因?yàn)闀r(shí)間關(guān)系,今天的對(duì)話就到這里。謝謝維嘉老師,非常精彩,期待下次繼續(xù)探討。
王維嘉:謝謝何娟,再見。
(作者|郭虹妘,編輯|陶天宇)
更多對(duì)全球市場(chǎng)、跨國公司和中國經(jīng)濟(jì)的深度分析與獨(dú)家洞察,歡迎訪問
快報(bào)
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論
投資 AI 得看公司基本面,別被短期泡沫帶偏了方向
強(qiáng)化學(xué)習(xí)能讓大模型在不同知識(shí)領(lǐng)域深耕,形成獨(dú)特優(yōu)勢(shì)
家政機(jī)器人要應(yīng)對(duì)的場(chǎng)景太復(fù)雜,現(xiàn)在技術(shù)根本扛不住
李飛飛團(tuán)隊(duì)讓機(jī)器人直接感知環(huán)境學(xué) 3D,比從文字里學(xué)高效多了
AI 就是人類的工具,沒自主意識(shí),根本不用擔(dān)心它失控
自研芯片越來越多,英偉達(dá)得想更多辦法保住市場(chǎng)份額
AI 連內(nèi)分泌系統(tǒng)都沒有,怎么可能產(chǎn)生人類那樣的情感
AI 局部泡沫是發(fā)展不均衡導(dǎo)致的,調(diào)整調(diào)整就好,不用太慌
人類對(duì)財(cái)富的追求沒盡頭,AI 的市場(chǎng)需求也不會(huì)有天花板
大模型要從同質(zhì)化變差異化,靠強(qiáng)化學(xué)習(xí)在不同領(lǐng)域深耕,思路對(duì)