“AI教母”李飛飛團(tuán)隊(duì)誕生了一個(gè)全球最快獨(dú)角獸公司。
近日,據(jù)報(bào)道,著名計(jì)算機(jī)科學(xué)家、美國(guó)國(guó)家工程院院士、美國(guó)國(guó)家醫(yī)學(xué)院院士李飛飛創(chuàng)辦的AI公司 World Labs,日前已完成兩輪融資,最新一次融資額約1億美元,公司最新估值已達(dá)10億美元(約合72.6億元人民幣)。
成立于今年4月的World Labs,致力于發(fā)展 AI 的空間智能,以解決AI在三維空間感知和理解方面的難題。短短三個(gè)多月,World Labs投資方囊括了硅谷知名風(fēng)投a16z、AI基金Radical Ventures等頭部機(jī)構(gòu)。
現(xiàn)年48歲的李飛飛,在最新一場(chǎng)斯坦福大學(xué)的演講中表示,通用人工智能(AGI)和空間智能將填補(bǔ)“視覺(jué)”和“動(dòng)作”之間的空白。“機(jī)器很快就能夠像人類(lèi)一樣識(shí)別視覺(jué)對(duì)象。”
長(zhǎng)期主導(dǎo)斯坦福大學(xué) AI 研究的李飛飛,如今也加入到全球 AI 創(chuàng)業(yè)熱潮,躬身入局推進(jìn)AGI的未來(lái)。
李飛飛的名字,在 AI 學(xué)術(shù)界可以說(shuō)是無(wú)人不曉。
李飛飛早年出生于北京,在成都長(zhǎng)大,曾就讀于知名的成都七中。直至1992年,16歲的李飛飛隨父母赴美,后來(lái)一邊在洗衣店幫忙,一邊讀完普林斯頓物理學(xué)學(xué)位。
家族因抗日戰(zhàn)爭(zhēng)遷徙影響了她的成長(zhǎng)背景,包括父母和外祖父母。在家庭的影響下,父親激發(fā)其探索欲,母親則通過(guò)大量閱讀培養(yǎng)了她跨學(xué)科視野和批判性思維,為日后的AI研究奠定了基礎(chǔ)。
但在1999年,李飛飛在普林斯頓大學(xué)的學(xué)習(xí)生涯即將結(jié)束時(shí),她要面臨科學(xué)抱負(fù)與現(xiàn)實(shí)生活之間的抉擇。
一方面,母親的健康狀況惡化,家庭的經(jīng)濟(jì)壓力增大,使李飛飛不得不重新考慮自己的職業(yè)規(guī)劃;另一方面,華爾街巨頭提供的高薪職位和醫(yī)療保險(xiǎn)對(duì)家庭來(lái)說(shuō)無(wú)疑是一個(gè)大誘惑,但這也意味著李飛飛可能要放棄自己熱愛(ài)的科學(xué)研究。
在母親的開(kāi)導(dǎo)下,李飛飛選擇了繼續(xù)追求自己的科學(xué)夢(mèng)想,在母親的鼓勵(lì)下堅(jiān)定了自己的道路。
普林斯頓大學(xué)期間,李飛飛選擇了物理專(zhuān)業(yè),但隨后在研究生階段轉(zhuǎn)向計(jì)算機(jī)科學(xué)和神經(jīng)科學(xué),并在加州理工學(xué)院主要攻讀電子工程博士學(xué)位,這種“交叉融合”的學(xué)習(xí)為她日后的AI研究奠定了基礎(chǔ)。
同時(shí)在這一期間,李飛飛開(kāi)始關(guān)注 AI 領(lǐng)域,盡管當(dāng)時(shí)AI處于寒冬期,但她堅(jiān)信,數(shù)據(jù)對(duì)AI的重要性。
博士畢業(yè)后,李飛飛加入了斯坦福大學(xué) AI 實(shí)驗(yàn)室,開(kāi)始了她的學(xué)術(shù)研究生涯。2006年,李飛飛獲得了加州理工大學(xué)的博士學(xué)位,在伊利諾伊大學(xué)厄巴納-香檳分校擔(dān)任助理教授的職位。
在攻讀博士期間,當(dāng)時(shí)業(yè)界圍繞計(jì)算機(jī)視覺(jué)和算法有這樣的一個(gè)認(rèn)知,許多研究人員認(rèn)為,算法是計(jì)算機(jī)視覺(jué)的中心,如果把機(jī)器智能與生物智能做類(lèi)比,那么算法就相當(dāng)于機(jī)器的突觸,或者說(shuō)是大腦中錯(cuò)綜復(fù)雜的神經(jīng)回路。
李飛飛意識(shí)到了這種研究思路的局限性:如果訓(xùn)練算法的數(shù)據(jù)不能很好地反映現(xiàn)實(shí)世界,那么即使是最好的算法也無(wú)法很好地完成工作。李飛飛的想法是構(gòu)建一個(gè)能夠完全反映真實(shí)世界的數(shù)據(jù)集。
于是在偶然的機(jī)會(huì),李飛飛結(jié)識(shí)了語(yǔ)言學(xué)家克里斯蒂安·費(fèi)爾鮑姆,WordNet 項(xiàng)目的領(lǐng)導(dǎo)者。費(fèi)爾鮑姆向李飛飛介紹了 WordNet ,由心理學(xué)和認(rèn)知科學(xué)領(lǐng)域的先驅(qū)喬治·阿米蒂奇·米勒創(chuàng)立的項(xiàng)目。米勒在心理學(xué)研究中對(duì)語(yǔ)言的結(jié)構(gòu)及其在人類(lèi)認(rèn)知過(guò)程中的所扮演的角色產(chǎn)生了濃厚的興趣,設(shè)想在更大規(guī)模上描繪出語(yǔ)言的結(jié)構(gòu)圖。
在交談中,費(fèi)爾鮑姆提及了一個(gè)計(jì)劃,旨在通過(guò)視覺(jué)示例,如照片或圖表,來(lái)闡釋W(xué)ordNet中的每一個(gè)概念。盡管這個(gè)計(jì)劃最終未能實(shí)現(xiàn),但它激發(fā)了李飛飛的興趣,成為了后來(lái)ImageNet項(xiàng)目的靈感來(lái)源。
2007年,李飛飛在斯坦福大學(xué)啟動(dòng)了ImageNet項(xiàng)目。
ImageNet是一個(gè)用于視覺(jué)對(duì)象識(shí)別軟件研究的大型可視化數(shù)據(jù)庫(kù),包含超過(guò)1400萬(wàn)張圖像、涵蓋21800個(gè)類(lèi)別的圖像識(shí)別數(shù)據(jù)庫(kù)。ImageNet的數(shù)據(jù)庫(kù)結(jié)構(gòu)基本上是金字塔型,包括目錄、子目錄和圖片集,每一個(gè)節(jié)點(diǎn)(Node)相當(dāng)于一個(gè)項(xiàng)目(Item)或子類(lèi)別(Subcategory),且每個(gè)節(jié)點(diǎn)含有至少500個(gè)對(duì)應(yīng)物體的可供訓(xùn)練的圖片/圖像。

2009年6月,ImageNet的初始版本正式發(fā)布,收錄了1500萬(wàn)張圖片,覆蓋了22000個(gè)不同類(lèi)別。這些圖片從近10億張候選圖片中篩選出,并由來(lái)自167個(gè)國(guó)家的近5萬(wàn)名貢獻(xiàn)者進(jìn)行標(biāo)注。
2010年,為了提升 ImageNet 的名氣,李飛飛舉辦了ImageNet 大規(guī)模視覺(jué)識(shí)別挑戰(zhàn)賽 (ILSVRC),旨在激發(fā)學(xué)術(shù)界和工業(yè)界的創(chuàng)新,推動(dòng)計(jì)算機(jī)視覺(jué)技術(shù)的發(fā)展。
在ImageNet競(jìng)賽兩年后的2012 年,發(fā)生了一件更大的事情:多倫多大學(xué)的 Geoffrey Hinton,Ilya Sutskever 和 Alex Krizhevsky 提交了一個(gè)名為 AlexNet 的深度卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)——至今仍在研究中使用——實(shí)現(xiàn)了準(zhǔn)確率 10.8% 的大幅提升,高出第二名 41%。
而這一事件實(shí)現(xiàn)了我們今天看到的 AI 繁榮。Geoffrey Hinton后來(lái)因研發(fā)深度學(xué)習(xí)而獲得圖靈獎(jiǎng),而Ilya Sutskever則聯(lián)合奧爾特曼(Sam Altman)創(chuàng)立了OpenAI——如今 AI 熱潮的起點(diǎn)。
因此,ImageNet數(shù)據(jù)集項(xiàng)目是如今生成式 AI 技術(shù)的底層設(shè)施,包括ChatGPT技術(shù)也受益于ImageNet的數(shù)據(jù)支持,并且已成為很多深度學(xué)習(xí)算法和模型的重要測(cè)試平臺(tái)。
2016年11月,李飛飛于接受了谷歌公司的邀請(qǐng),出任副總裁并擔(dān)任Google Cloud AI首席科學(xué)家。
李飛飛認(rèn)為,谷歌在 AI 領(lǐng)域有著先進(jìn)和豐富的應(yīng)用場(chǎng)景。同時(shí),谷歌為研究人員提供了充足的資源和支持,包括先進(jìn)的計(jì)算設(shè)施、豐富的數(shù)據(jù)資源以及廣泛的合作機(jī)會(huì)。這意味著,在谷歌,李飛飛能夠接觸到前沿的技術(shù)和廣泛的應(yīng)用場(chǎng)景,進(jìn)一步推動(dòng)她的研究工作。
在谷歌期間,李飛飛利用自己在計(jì)算機(jī)視覺(jué)、認(rèn)知神經(jīng)科學(xué)、計(jì)算神經(jīng)科學(xué)和大數(shù)據(jù)分析等領(lǐng)域的深厚造詣,為谷歌的AI技術(shù)貢獻(xiàn)了重要力量。在谷歌期間,李飛飛可能還與其他團(tuán)隊(duì)和部門(mén)建立了緊密的合作關(guān)系,共同推動(dòng)谷歌在AI領(lǐng)域的創(chuàng)新和發(fā)展。
2018年底,李飛飛離開(kāi)谷歌,全身心專(zhuān)注于斯坦福大學(xué)的 AI 研發(fā)工作,擔(dān)任斯坦福大學(xué)教授和斯坦福AI實(shí)驗(yàn)室的負(fù)責(zé)人。
此次李飛飛的World Labs創(chuàng)業(yè)過(guò)程極其低調(diào),沒(méi)有官網(wǎng),沒(méi)有公開(kāi)招聘,甚至公司名字直到此次融資才被外界所知。
早在2024 年1月,李飛飛離開(kāi)美國(guó)斯坦福大學(xué),開(kāi)始為期兩年的休假,彼時(shí)她在領(lǐng)英上將自己的狀態(tài)改為“新手”和“新工作”,一度令人費(fèi)解。
如今,真相浮現(xiàn),World Labs正是這份“新工作”,這也是李飛飛的第一次創(chuàng)業(yè),聚焦于 AI 的“空間智能”。
所謂,空間智能是指人們或機(jī)器在三維空間中的感知、理解和交互能力。這一概念最早由美國(guó)心理學(xué)家霍華德·加德納(Howard Gardner)在多元智能理論中提出,讓在大腦中形成一個(gè)外部空間世界的模式,并能夠運(yùn)用和操作。
空間智能讓人有能力以三度空間的方式來(lái)思考,使人知覺(jué)到外在和內(nèi)在的影像,也能重現(xiàn)、轉(zhuǎn)變或修飾影像,從而能夠在空間中從容地游走,隨心所欲地操弄物件的位置,以產(chǎn)生或解讀圖形的訊息。
從廣義上看,空間智能不僅包括對(duì)空間方位的感知能力,還包括視覺(jué)辨別能力和形象思維能力。而對(duì)于機(jī)器而言,空間智能則是指其在三維空間中的視覺(jué)數(shù)據(jù)處理能力,能夠精準(zhǔn)做出預(yù)測(cè),并基于這些預(yù)測(cè)采取行動(dòng)。這種能力使得機(jī)器能夠像人類(lèi)一樣在復(fù)雜的三維世界中導(dǎo)航、操作和決策,從而超越傳統(tǒng)二維視覺(jué)的局限。
今年4月舉行的TED演講上,李飛飛坦言,視覺(jué)能力引發(fā)了寒武紀(jì)大爆發(fā),神經(jīng)系統(tǒng)的進(jìn)化帶來(lái)了智能。“我們想要的不僅僅是能看會(huì)說(shuō)的 AI,我們想要的是能做的 AI。”
在李飛飛看來(lái),空間智能是“解決 AI 技術(shù)難題的關(guān)鍵法寶”。
為此,她展示一張貓咪伸出爪子要把玻璃杯推向桌子邊緣的照片。她進(jìn)一步解釋稱,人類(lèi)大腦在這一瞬間可以評(píng)估玻璃杯的幾何形狀、在3D世界中的位置、與桌子和貓的關(guān)系,并且能預(yù)測(cè)接下來(lái)會(huì)發(fā)生什么,采取行動(dòng)制止。“大自然創(chuàng)造了觀察與行動(dòng)的良性循環(huán),這得益于空間智能。”
在她看來(lái),通過(guò)增強(qiáng)AI的空間推理能力,可以實(shí)現(xiàn)更復(fù)雜的物理世界互動(dòng)和導(dǎo)航。而空間智能的發(fā)展需要建立在先進(jìn)的技術(shù)基礎(chǔ)之上,包括三維視覺(jué)感知技術(shù)、時(shí)空數(shù)據(jù)處理與分析、深度學(xué)習(xí)等,這些技術(shù)將使機(jī)器能夠像人類(lèi)一樣感知和理解三維空間,從而做出更加智能的決策和行動(dòng)。
李飛飛表示,空間智能和語(yǔ)言智能將能夠?yàn)榫呱碇悄苜x能,以發(fā)展AGI。在具身智能領(lǐng)域,她帶領(lǐng)的研究團(tuán)隊(duì)曾在2023年推出一項(xiàng)新成果VoxPoser,利用大語(yǔ)言模型(LLMs)和視覺(jué)語(yǔ)言模型(VLMs)來(lái)驅(qū)動(dòng)機(jī)器人,并展示了根據(jù)口頭指令讓機(jī)械臂執(zhí)行各種任務(wù)的演示視頻,包括打開(kāi)抽屜但要小心花瓶、拔掉充滿電的手機(jī)、制作三明治等。

李飛飛強(qiáng)調(diào),未來(lái)的AI應(yīng)該具備空間智能,能夠理解和與3D世界互動(dòng),這將推動(dòng)AI的能力超越當(dāng)前的水平。
“AGI旨在創(chuàng)造出能夠在各種環(huán)境和任務(wù)中表現(xiàn)出人類(lèi)水平智能的系統(tǒng),而空間智能則是實(shí)現(xiàn)AGI的關(guān)鍵步驟之一。”李飛飛坦言。
有風(fēng)險(xiǎn)投資人描述了李飛飛創(chuàng)業(yè)公司的最新動(dòng)向:World Labs正在開(kāi)發(fā)一種能夠理解三維物理世界的模型,本質(zhì)上是對(duì)物體的物理特性、空間位置和功能的理解和模擬。
目前,李飛飛的項(xiàng)目受到VC圈的追捧。同時(shí),李飛飛團(tuán)隊(duì)還在不斷研發(fā)新的算法和技術(shù),探索空間智能在自動(dòng)駕駛、機(jī)器人導(dǎo)航、智能家居、虛擬現(xiàn)實(shí)等領(lǐng)域的應(yīng)用,以進(jìn)一步提升空間智能的表現(xiàn)和應(yīng)用效果。
一場(chǎng)以李飛飛發(fā)起的“空間智能”新時(shí)代才剛剛開(kāi)始。
ChatGPT爆火600余天引發(fā)的新一輪 AI 創(chuàng)業(yè)熱潮席卷全球,并且正以迅猛速度批量“生產(chǎn)”獨(dú)角獸(估值超過(guò)10億美金的初創(chuàng)公司)。
今年7月,95后團(tuán)隊(duì)創(chuàng)立、英偉達(dá)投資的 AI 創(chuàng)業(yè)公司Cohere完成5億美元D輪融資,由思科、AMD、富士通、加拿大養(yǎng)老金投資管理公司PSP Investments及加拿大出口信貸機(jī)構(gòu)EDC聯(lián)合投資,估值達(dá)到驚人的55億美元(約合人民幣399.34億元)。
無(wú)獨(dú)有偶。
本月,成立僅1年的 AI 初創(chuàng)公司Skild AI完成3億美元A輪融資,投資方包括孫正義的日本軟銀集團(tuán)、貝佐斯旗下基金、Sequoia Capital(紅杉資本)、光速創(chuàng)投、Coatue等,投后估值達(dá)到15億美元。
另外,成立僅僅6個(gè)月Cognition Labs今年4月獲一輪1.75億美元融資,估值達(dá)到驚人的20億美元。然而,雖然其團(tuán)隊(duì)研發(fā)了全球第一位接近人類(lèi)的 AI 程序員 Devin,但整個(gè)公司卻未產(chǎn)生任何實(shí)際營(yíng)收,處于虧損狀態(tài)。
在國(guó)內(nèi),大模型明星公司百川智能7月25日確認(rèn)完成A輪融資,總?cè)谫Y金額達(dá)50億元人民幣,投資方包括阿里、小米、騰訊、亞投資本、中金、北京市人工智能產(chǎn)業(yè)投資基金、上海人工智能產(chǎn)業(yè)投資基金、深創(chuàng)投等機(jī)構(gòu),并且將以200億估值開(kāi)啟B輪融資;月之暗面今年初也完成新一輪超過(guò)10億美元融資,投資方包括紅杉中國(guó)、小紅書(shū)、美團(tuán)和阿里,最新估值高達(dá)200億元。
所以,AI 依然是2024年創(chuàng)投行業(yè)的熱潮領(lǐng)域。
PitchBook數(shù)據(jù)顯示,僅在過(guò)去三個(gè)月里,投資機(jī)構(gòu)就向美國(guó) AI 初創(chuàng)企業(yè)投入了超過(guò) 270 億美元,全球在該領(lǐng)域的投資額約為 500 億美元。
有投資人向鈦媒體AGI坦言,很多企業(yè)高管和創(chuàng)業(yè)者都不愿意錯(cuò)過(guò)這一輪 AI 熱潮。比如,原魅族高級(jí)副總裁楊顏日前成立新公司深圳群青,要做新一代AI交互終端。
但是,這股 AI 熱潮正在形成投資“泡沫”,因此有人開(kāi)始敲響“泡沫爆發(fā)”的警鐘。
紅杉資本合伙人最新發(fā)布的報(bào)告顯示,AI行業(yè)需要?jiǎng)?chuàng)造 6000 億美元的年收入才能維持下去;高盛也對(duì)生成式 AI 表示懷疑,認(rèn)為科技巨頭計(jì)劃在未來(lái)幾年在AI資本支出上花費(fèi)1萬(wàn)億美元,但幾乎沒(méi)有任何實(shí)質(zhì)性的、可見(jiàn)的成果來(lái)證明這些投入是值得的。
就大名鼎鼎的OpenAI,作為 AI 領(lǐng)域佼佼者,預(yù)計(jì)今年?duì)I收為34億美元,但投入研發(fā)就高達(dá)84億美金,據(jù)稱今年OpenAI將虧損50億美元。
Mapsignals 首席投資策略師Alec Young表示:“最令人擔(dān)憂的是,所有 AI 基礎(chǔ)設(shè)施支出的投資回報(bào)率在哪里?投入的資金相當(dāng)驚人。也許幾年后就能收回成本。但我認(rèn)為投資者意識(shí)到回報(bào)需要時(shí)間才能實(shí)現(xiàn),而超大規(guī)模企業(yè)的收入在短期內(nèi)會(huì)因投入巨額資金而受到損害。”
巨量資金涌入AI賽道,某種程度上也帶來(lái)超高回報(bào)、超高風(fēng)險(xiǎn)的可能性。但是我們依然需要警惕,這場(chǎng) AI “泡沫”即將爆發(fā),會(huì)給 AI 創(chuàng)業(yè)潮最后留下一個(gè)什么樣的世界。
(本文首發(fā)于鈦媒體App,作者|竇悅怡、林志佳,編輯|林志佳、胡潤(rùn)峰)
![]()
快報(bào)
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論