才是完整的人類。
中年階段只是被美化的靈長類動物,我們正在做的事情所有靈長類動物都會——忙著在等級制度中尋找定位、交配、爭奪資源等。只有在幼年和老年時,我們才能進行心智理論、世界探索、因果推理、文化傳播和大規(guī)模敘事等真正“人性化”的活動。所以,“祖母和孩子們確實應(yīng)該低調(diào)些,畢竟我們才是享受樂趣的人。工作的事情還是讓35歲的人承擔(dān)吧。”
肖恩·卡羅爾:究其原因,是因為我們正處于傳統(tǒng)語境下或名義上的“成年黃金期”——我們更加專注、執(zhí)行力更強,但靈活性與創(chuàng)造力不足。
艾莉森·高普尼克:計算機科學(xué)認(rèn)為,解決“高維任務(wù)”時,一個問題有很多不同的可能解決方案,這些解決方案在許多不同維度上各不相同。你可以稍微調(diào)整一下你已經(jīng)在做的事情,看看這是否會讓事情變得更好一些。這是嘗試解決問題的一種非常有效、有效的方法。如果這種改變奏效,那就可以嘗試這一調(diào)整。這就是基本的“利用型策略”,也就是成年人慣用的策略。
當(dāng)然,在這個領(lǐng)域中可能還有另一種解決方案,它與我們目前的方案相去甚遠(yuǎn)。如果你只是不斷地做這些小的調(diào)整,你或許永遠(yuǎn)不會達(dá)到目標(biāo)。不妨縱身一躍,嘗試更多的事情,不管是否有用,只為看看世界究竟是如何運作的。在計算機科學(xué)中,這就是低溫搜索(low temperature search)和高溫搜索(high temperature search)之間的區(qū)別。
想象一下,空氣分子的運動,要么非常緩慢地移動,要么在空間中隨機彈跳。計算機的解決方案是平衡兩種策略。不能同時執(zhí)行兩者,那又該如何?
事實證明,最好的策略是從大規(guī)模的、隨機的野生搜索開始(當(dāng)然,這將花費更長的時間,而且很多時間花在了思考實際上沒什么益處的事情),然后再逐漸冷靜下來,開始進行更集中的搜索。計算機科學(xué)家們將這種策略稱為“模擬退火”(simulated annealing)。這就像加熱金屬后再冷卻使其更加堅固的過程。我認(rèn)為,童年本質(zhì)上是進化“模擬退火”的方式。
“專注且面向輸出的”與“嘈雜、跳躍、隨機的行為”,不用想也知道哪種描述更適合4歲的孩子。孩子們會說奇怪、瘋狂的話,經(jīng)常進行奇怪的假裝游戲,做些乍看毫無意義的事情,從某些角度來看,這可能看起來像是一種缺陷,但這確實是處于探索模式下最想做的事情。這意味著,至少在某些情況下,兒童比成年人更具創(chuàng)造力。
我們通過實證研究證明了這一觀點。例如,給兒童和成年人設(shè)置同一類問題,這些問題要么有顯而易見的解決方案,要么需要提出非常規(guī)假設(shè)。不出所料,當(dāng)解決方案比較明顯時,成年人更能快速找到答案。但面對需要非直觀假設(shè)的問題時,四歲兒童的表現(xiàn)反而優(yōu)于大學(xué)生,更能找到正確答案。
如此看來,4歲兒童(某些方面)比成人更有創(chuàng)造力。但問題在于,當(dāng)我們談?wù)摮扇说膭?chuàng)造力時,它包含兩個層面:第一層是生成大量可能性,第二層是從中篩選出最優(yōu)解——關(guān)注有價值的選項而非無意義的干擾。這兩者并不容易直接比較,前者產(chǎn)生很多解決方案,想到很多可能性,這是兒童擅長的領(lǐng)域,而后者需要成人的執(zhí)行型利用能力。
偉大的哲學(xué)家約翰·洛克(John Locke)曾提出,人類智能分兩類——“機智”(wit)與“判斷”(judgment),機智是生成新想法的能力,判斷則是篩選優(yōu)質(zhì)想法的能力。如此看來,兒童似乎擁有極強的機智,而判斷相對較弱。
![]()
?約翰·洛克(John Locke)是17世紀(jì)英國著名的哲學(xué)家、思想家,被譽為“自由主義之父”。他提出了“天賦人權(quán)”“分權(quán)制衡”等重要思想,為現(xiàn)代民主政治和自由主義理論奠定了基礎(chǔ)。他的著作《政府論》等對后世的政治哲學(xué)和社會思想產(chǎn)生了深遠(yuǎn)影響。
肖恩·卡羅爾:如果我們認(rèn)可進化賦予了人類生命周期中這種精妙的“時間分工”,為什么我們需要面對這樣一個事實,即嬰兒極度依賴他人,需要漫長時間才能自立。能否談?wù)勥@種現(xiàn)象在其他物種中的情況?這是偶然現(xiàn)象,還是某種優(yōu)化策略的結(jié)果?
艾莉森·高普尼克:是的,這很有趣。如果你觀察各種各樣的物種,會發(fā)現(xiàn)從昆蟲(甚至植物)到靈長類和哺乳動物,智能水平、學(xué)習(xí)能力、大腦使用效率與其童年時長呈正相關(guān)(從人類視角衡量)。
這首先就體現(xiàn)在鳥類身上,如果你觀察像鴉科(corvids)或烏鴉(crows),這些鳥類極其聰明,雛鳥期長達(dá)一到兩年,需要一直被照顧;而家雞幾周內(nèi)就成熟了,盡管這說法可能得罪養(yǎng)雞愛好者,但雞確實不算聰明。更準(zhǔn)確地說,它們只擅長做如啄食谷物之類的事情,它們從出生起就非常擅長做這些事情,但它們不擅長學(xué)習(xí)。
從“探索-利用”視角看,這種差異合乎邏輯。對于生活在多變環(huán)境中需要不斷適應(yīng)新事物的生物而言,它們需要經(jīng)歷一個探索期才能進入發(fā)展階段。在這一時期,個體的生存能力較弱,需要依賴同物種的成年成員照料,以獲取充足的營養(yǎng)供給,支撐這段高強度學(xué)習(xí)期的能量需求。這似乎是一種進化策略。
卡路里的消耗頗具啟示性。事實證明,人類大腦的能量消耗驚人——即便是成年人,大腦也要消耗全身20%的熱量,這意味著大腦堪稱一臺高耗能的計算設(shè)備;而對于四歲兒童而言,這一比例竟高達(dá)60%,甚至接近70%。從這個角度看,一名普通四歲兒童簡直就像《神秘博士》里的星際生物的存在——他們帶著一個仿佛永不饜足的“饑餓”大腦穿梭世界,既驅(qū)使我們不斷投喂花生醬三明治以滿足其能量需求,又要求海量數(shù)據(jù)喂養(yǎng)其認(rèn)知發(fā)展。
肖恩·卡羅爾:這觀點很有意思,因為它并非純粹物理層面的解釋——與腦容量等直觀指標(biāo)無關(guān)。若我們允許自己以詩意的視角,將自然設(shè)計的動力歸因于某種聰明的智能設(shè)計,就會發(fā)現(xiàn):這種刻意設(shè)置的生存困境恰有其深意,它迫使孩童在探索中培養(yǎng)創(chuàng)造力,而這種能力終將在未來人生階段收獲豐碩回報。
艾莉森·高普尼克:確實如此。這種觀點的核心在于,生物學(xué)和進化論本身充滿復(fù)雜性,且與其他動物性狀存在關(guān)聯(lián)。例如,有些聰明的動物并沒有漫長的童年期,比如頭足類動物中的章魚。
不同物種似乎演化出各異的“探索-利用”解決方案:某些昆蟲如螞蟻與蜜蜂通過群體分工實現(xiàn),例如工蜂負(fù)責(zé)勞作而偵察蜂專注探索。雖然具體策略千差萬別,但這種機制在從昆蟲到脊椎動物的廣泛物種中呈現(xiàn)出驚人普遍性,恰恰印證了其承載的深層自適應(yīng)性價值。
肖恩·卡羅爾:這種分工是否是普遍現(xiàn)象?我記得邁克爾·穆圖克里斯南(Michael Muthukrishna)曾在節(jié)目中提過一個心理學(xué)經(jīng)典實驗:讓兒童和黑猩猩將棍子插入盒子獲取獎勵;當(dāng)發(fā)現(xiàn)其中一根棍子無效時,兒童并未意識到問題,而黑猩猩卻能調(diào)整策略。這或許源于兒童對成年人的認(rèn)知信任機制。
艾莉森·高普尼克:確實如此。這也從另一個維度揭示了人類漫長的童年期與特有智能的深層關(guān)聯(lián)——我們不僅是社會性學(xué)習(xí)者,更是文化傳承者。人類通過代際傳遞信息的規(guī)模遠(yuǎn)超其他物種,雖然主要發(fā)生在父母照料兒童的場景中,但值得關(guān)注的是這種機制背后的平衡法則:單純模仿他人行為并無意義,只會導(dǎo)致文明停滯。因此,在代際傳承鏈條中,總需要有人既能傳承既有知識,又能突破常規(guī)進行創(chuàng)新。
多項研究表明,兒童在模仿過程中會進行權(quán)衡,“這件事的實際邏輯是什么?”“示范者的可信度如何?”有一個可愛的實驗:當(dāng)實驗者宣稱“我將演示操作方法”時,兒童更傾向于出現(xiàn)你提及的“過度模仿”現(xiàn)象,即完全復(fù)刻示范動作。但若實驗者改用開放式提問:“哇,快看這個!我也不知道這是怎么回事,你知道嗎?”兒童則更傾向于探索,包括以這些看似不合理的方式探索,反之亦然。
![]()
?圖源:yzhu.io
我們也做過一些實驗,若讓兒童接觸一臺機器,我們常用的是“布克特探測器”(Blicket detector),當(dāng)他們發(fā)現(xiàn)紅色積木能激活機器后,而成人聲稱“藍(lán)色積木才是正確選擇”時,兒童會精準(zhǔn)地在自身觀察與成人陳述之間尋找平衡。他們既不完全依賴自己的發(fā)現(xiàn),也不盲從權(quán)威,而是根據(jù)兩種解決方案的概率權(quán)重提出折中方案。
所以,我承認(rèn)我們確實是社會人這一事實,但在文化和社會進化的過程中,我們必須平衡模仿和創(chuàng)新——這樣做相當(dāng)復(fù)雜,我認(rèn)為這在兒童的特殊智力中也發(fā)揮作用。
肖恩·卡羅爾:這讓我聯(lián)想到指導(dǎo)研究生的場景,你會告誡他們“要勇于創(chuàng)新,但也要研讀文獻”,其中存在平衡,不能只想著盲目地追隨其他人已經(jīng)做過的事情。
艾莉森·高普尼克:當(dāng)前我們在重點研究照護行為中的認(rèn)知維度,尤其是當(dāng)人類承擔(dān)養(yǎng)育責(zé)任時展現(xiàn)的"照護的智慧"。這種智慧的核心在于,如何為被照護者搭建通往自主性的階梯。
作為教育者、治療師或家長,既不希望他們盲目模仿,也不愿看到他們因循守舊,更不能任其誤入歧途。這種平衡藝術(shù)在不同照護場景中具有普適性。不論是兩歲孫輩的祖母,還是指導(dǎo)博士后研究員的導(dǎo)師,本質(zhì)上都在解決同一認(rèn)知難題——如何在文明傳承中平衡模仿與創(chuàng)新。正是這些照護者的存在,文明傳承才得以真正實現(xiàn)。
近期我在研究與寫作中發(fā)現(xiàn)一個有趣現(xiàn)象——祖父母(尤其是祖母)在文化傳承中扮演著舉足輕重的角色。相當(dāng)多的人類學(xué)證據(jù)表明,當(dāng)涉及文化傳播時,老年人而非父母往往承擔(dān)主要傳遞者角色。父母更多努力處理日常事務(wù),維持子女溫飽與安全,而祖父母則通過給孫輩朗讀《納尼亞》系列書籍、哼唱百老匯經(jīng)典曲目等精心設(shè)計的文化儀式,他們專注于完成這種文化傳播。當(dāng)然,就像我們的童年特別長,我們的絕經(jīng)后期(老年期)也很長,唯有虎鯨種群呈現(xiàn)出類似的演化奇跡。
虎鯨是為數(shù)不多在絕經(jīng)后仍能長期存活的哺乳動物,它們的祖母鯨群會持續(xù)傳遞生存智慧。當(dāng)食物匱乏時,正是這些老年雌鯨帶領(lǐng)鯨群尋找生機——我記得二十年前某處海域就曾出現(xiàn)這種現(xiàn)象。這種跨代智慧傳遞機制,展現(xiàn)了區(qū)別于常規(guī)成年智能的獨特認(rèn)知模式。
肖恩·卡羅爾:這聽起來簡直可愛得不像真的?;ⅥL真的把這么多責(zé)任交給祖母嗎?
艾莉森·高普尼克:嗯,我喜歡這個例子的原因就是,它顯示了傳遞食譜是非常重要的,而這是為祖母們設(shè)計的進化。
肖恩·卡羅爾:人類嬰兒是如何構(gòu)建世界觀的?
艾莉森·高普尼克:過去20-25年間,我們這些兒童發(fā)展學(xué)家主張:兒童發(fā)展本質(zhì)上類似科學(xué)理論的構(gòu)建。乍一聽很荒謬,畢竟幼兒并非真正的聰明的科學(xué)家,但當(dāng)你仔細(xì)觀察他們理解世界的方式時,會發(fā)現(xiàn)這與科學(xué)理論的迭代很相似。從計算視角看,這是一種極佳的獲取世界信息的方式。嬰幼兒從極小時期開始就在探尋因果關(guān)系,這對世界觀構(gòu)建至關(guān)重要。
通過具有意外因果屬性的"布利克特探測器"實驗裝置可以證明,即使是蹣跚學(xué)步的兒童也能對這類系統(tǒng)的運作機制做出正確推斷。他們似乎建立了這種"因果模型"(有時稱為直覺理論),會隨著新數(shù)據(jù)的輸入不斷修正其理論體系。我們能夠系統(tǒng)性地驗證這一點,比如,當(dāng)向幼兒展示探測器的工作原理后,其推理模式與優(yōu)秀科學(xué)家高度一致。
當(dāng)然,理解機制原理尚屬次要,更重要的是解讀周圍的人是如何工作的。早在80年代,我與同行發(fā)展了“心智理論”(theory of mind)研究,旨在揭示嬰兒如何理解他人思想。我們發(fā)現(xiàn),嬰兒的初始認(rèn)知遠(yuǎn)超我們預(yù)期,且嬰兒會持續(xù)學(xué)習(xí),如從1-2歲開始理解“他人可能有不同需求”,3-6歲逐漸掌握“他人可能持有不同信念”。這些都是非常深奧的東西。
最近,發(fā)展出了一項非常有意思的工作——兒童直覺社會學(xué)(children's intuitive sociology)。他們也會思考一些更深層次的問題,例如,當(dāng)他們是盟友時,會以某種方式行事,而當(dāng)他們是敵人時,則會以另一種方式行事。若某個生物體型更大、處于支配地位,他就能如愿以償。
回到照護主題,我們現(xiàn)在試圖弄清嬰兒如何理解照護行為。已有證據(jù)表明,嬰兒甚至能識別“什么樣的人可能成為合格的照顧者”。因此,在我談到他們的無助時,其實有一種有意思的糾結(jié)在里面。如果你是那種無助的生物,了解他人、了解愛、了解他人是什么樣的,這對你的生存來說真的很重要。當(dāng)然,作為成年人,這仍然是我們學(xué)習(xí)的最重要的事情。
肖恩·卡羅爾:我想讓聽眾更直觀地理解“布克特探測器”,顯然它在你的心理學(xué)實驗中發(fā)揮了重要作用。
艾莉森·高普尼克:我們從20年前開始從事這項實驗,當(dāng)時所有裝置都是自己制作的。在那些日子里,我們在心理學(xué)系有一家工坊(如今已不復(fù)存在)。我們會告訴店員:“我們需要一個簡易盒子,當(dāng)往上面放置物品時,他會隨機亮燈并播放音樂。”我們設(shè)計了其他的變體,比如齒輪變體,當(dāng)輕按開關(guān)后齒輪會轉(zhuǎn)動,然后發(fā)生其他的事情,就像組裝的魯布·戈德堡(Rube Goldberg)機械。
![]()
?布克特探測器以及使用的蝴蝶/花朵刺激物裝置. doi: 10.3389/fpsyg.2020.02210
有意思的是,盡管我們曾認(rèn)為“用觸控屏實現(xiàn)這些功能會更高效”,但將實驗裝置電子化后,孩子們卻完全不感興趣。他們其實需要真實的東西。但我們發(fā)現(xiàn),現(xiàn)在三四歲的孩子就已經(jīng)能理解交互式屏幕了。對更小的孩子而言,實體裝置仍是首選,而大齡兒童已能接受“屏幕裝置同樣具有因果效力”。
肖恩·卡羅爾:如你所說,“1歲以下的嬰兒沒有心理理論,2歲才開始有”。那么,這是否意味著存在某些認(rèn)知發(fā)展的里程碑或階段性轉(zhuǎn)變?
艾莉森·高普尼克:是的。正如我一開始所說的,從出生起,嬰兒就表現(xiàn)出對人臉的特殊關(guān)注與解讀能力,且以其他靈長類動物所不具備的方式進行模仿,這表明理解他人確實很重要。9個月大的嬰兒已會通過指物進行交流,如果你沒有回應(yīng)他們的指示,他們會焦躁地重復(fù)“??!那里!”這表明他們意識到他人可能與自己共享視覺焦點。
傳統(tǒng)觀點認(rèn)為“心智理論”到4-5歲才形成,但這并不準(zhǔn)確。兒童只是在不同領(lǐng)域構(gòu)建了不同的認(rèn)知框架,就如同物理學(xué)體系一樣。值得注意的是,你可以在特定年齡點觀察到這些變化,例如在約9個月時出現(xiàn)的認(rèn)知革命,可能與生理的成熟有關(guān)。但更關(guān)鍵的是,我們還沒有充分認(rèn)識到,即使是嬰幼兒,也是積極、主動的學(xué)習(xí)者。他們的行為不僅是觀察統(tǒng)計規(guī)律,更是通過實驗探索世界。
你想一下,即使是新生兒,他們也會看著你,會微笑,會觀察他們的行為產(chǎn)生的影響,而當(dāng)嬰幼兒成長至蹣跚學(xué)步階段時,這種探索行為已然構(gòu)成了他們完整的生命體驗。他們一直在不斷地探索,盡管我們常稱之為“到處搗亂”。而當(dāng)物理學(xué)家做這些事情時,就叫作是一名“優(yōu)秀的實驗物理學(xué)家”。
我們近年嘗試將兒童學(xué)習(xí)與AI(如大語言模型)對比。AI和這些小孩子所做的事情之間有什么關(guān)系呢?
我認(rèn)為關(guān)鍵區(qū)別在于,兒童主動探索世界以獲取信息,并根據(jù)新知動態(tài)更新認(rèn)知體系;而不是像大模型一樣,只是進行模仿。我曾經(jīng)論證過,大語言模型本質(zhì)上只是從人類既有知識中提取模式(其本質(zhì)是文明傳承的模仿環(huán)節(jié)),而兒童卻能突破既有框架,通過主動實驗發(fā)現(xiàn)新規(guī)律、驗證新假設(shè)。我們認(rèn)為,這才是真正重要的東西,這導(dǎo)致孩子們學(xué)得更多、學(xué)得更快,且相比AI消耗卡路里更少。
肖恩·卡羅爾:這有點像因果推理中“簡單地尋找相關(guān)性”與“對事物進行干預(yù)”之間的區(qū)別。跳脫出數(shù)據(jù)集,“如果我這樣做,接下來會發(fā)生什么?”
艾莉森·高普尼克:確實如此。我們與科學(xué)哲學(xué)家及計算機科學(xué)家展開了長達(dá)二十年的合作,試圖破解科學(xué)領(lǐng)域的因果推斷難題。核心洞見就是:單純依賴統(tǒng)計相關(guān)性是無法實現(xiàn)真正的因果推理的。
![]()
?大衛(wèi)·休謨(David Hume,1711—1776)是18世紀(jì)蘇格蘭啟蒙運動時期的著名哲學(xué)家、經(jīng)濟學(xué)家和歷史學(xué)家。他是一位經(jīng)驗主義者,認(rèn)為所有知識都源于感官經(jīng)驗,并提出了著名的“休謨叉”(Hume's Fork),將知識分為“觀念的關(guān)系”(a priori)和“實際的事實”(a posteriori)。休謨對因果關(guān)系的分析尤為著名,他認(rèn)為我們無法直接感知因果關(guān)系,而是基于習(xí)慣和聯(lián)想推斷出因果聯(lián)系。此外,他還探討了自我意識,認(rèn)為自我是不斷變化的感知集合,而非固定實體。圖源:digital.nls.uk
那么,因果推理與相關(guān)性有什么不同呢?這是休謨(Hume)*時代的一個傳統(tǒng)哲學(xué)問題。當(dāng)前學(xué)界的共識是:要建立可靠的因果關(guān)系,必須通過主動干預(yù)實驗。唯有在現(xiàn)實世界中施加變量、觀測結(jié)果差異,才能確定事件之間的因果。
事實上我們在這方面已經(jīng)做了一些工作。我認(rèn)為,即便是嬰幼兒,當(dāng)他們接觸“百寶箱”(busy box)這類裝置時,便能通過自主操作建立對物理世界的認(rèn)知。百寶箱中存在很多因果可能性,可以用來做不同的實驗。它遠(yuǎn)比標(biāo)準(zhǔn)回旋加速器便宜得多,但對于嬰幼兒而言卻能發(fā)揮相同的作用。這種實驗方式可以讓你真正地在實驗中弄清楚世界是如何運作的。
正如我們所說的,心理理論與直覺心理學(xué)在認(rèn)知發(fā)展中極其重要,照料者實際上充當(dāng)了嬰兒的“實驗對象”。從某種意義上說,這些蹣跚學(xué)步的“小心理學(xué)家”正以照顧者為觀察樣本,持續(xù)進行著社會性認(rèn)知實驗。例如“可怕的兩歲”(the terrible twos)階段,嬰幼兒通過主動行為引發(fā)照料者反應(yīng),然后進行觀察。
肖恩·卡羅爾:我們播客曾邀請過朱迪亞·珀爾(Judea Pearl)*,當(dāng)時他直言不諱道:“嬰兒就是通過觸摸物體并繪制因果圖譜。”我當(dāng)時并沒有意識到這就是字面上的意思。
艾莉森·高普尼克:完全正確。我們的研究工作建立在珀爾開發(fā)的形式化框架之上,比如將因果貝葉斯網(wǎng)絡(luò)與兒童解決因果問題的方式相對照。我們發(fā)現(xiàn)兒童構(gòu)建因果模型的過程與因果圖模型(causal graphical models)的理論預(yù)測高度吻合。具體而言,他們通過觀察數(shù)據(jù)構(gòu)建因果圖模型,并基于此干預(yù)決策。
但無論是珀爾還是科學(xué)界,仍有一個未解難題:如何確定“最有價值的實驗”?
朱迪亞的理論框架能告訴你:“當(dāng)獲得某個實驗結(jié)果時,對應(yīng)的因果圖應(yīng)該是什么樣”。但如何決定最初該測試什么?我們發(fā)現(xiàn)許多傳統(tǒng)實驗的金科玉律(比如必須保持其他變量恒定、每次只能改變一個變量)對嬰幼兒并不適用,甚至可能并非最優(yōu)科學(xué)范式。
這引出了一個很棒的開放性問題:實驗設(shè)計的元規(guī)則究竟是什么?
![]()
?比較成人、兒童和強化學(xué)習(xí)代理在類似Minecraft的Crafter環(huán)境中的探索行為,分析了熵、信息增益和賦權(quán)等內(nèi)在目標(biāo)與人類探索行為的關(guān)系。arXiv:2503.23631v1 [cs.AI] 31 Mar 2025
我們已開始將兒童與AI置于相同實驗環(huán)境進行觀察。我們所做的是將孩子們和AI智能體分別放置在《我的世界》(Minecraft)這個環(huán)境中,然后讓他們“弄清楚發(fā)生了什么”。即使是相對年幼的孩子也會以理性的方式探索那個環(huán)境,而不僅僅是隨便嘗試。他們以一種讓他們能夠弄清楚環(huán)境如何運作的方式做事,而且他們比AI更擅長這一點。
肖恩·卡羅爾:有意思。傳統(tǒng)科研范式要求保持其他變量恒定、僅改變單一變量,這是有道理的。但這僅僅是因為改變單一變量更簡單嗎?實際上它是否不如協(xié)同干預(yù)更有效?
艾莉森·高普尼克:是的。這其實是個非常有趣的技術(shù)性問題——關(guān)于何時應(yīng)當(dāng)遵循某種規(guī)范性準(zhǔn)則(即每次僅改變一個變量進行實驗)。雖然傳統(tǒng)方法認(rèn)為這是真理,但事實上同時改變多個變量有時能獲得更大信息量的結(jié)果。畢竟要保持其他變量恒定而只改變一個變量,操作難度極大。想想看,孩子們擺弄著忙碌盒子,卻能通過各種不同方式的探索高效學(xué)習(xí),這對AI、科學(xué)、發(fā)展心理學(xué)來說都是一個很有趣的問題,而他們究竟是如何做到的?
肖恩·卡羅爾:把這些非常年幼的孩子描述成貝葉斯主義的良好遵從者,有多大準(zhǔn)確度呢?
艾莉森·高普尼克:我們所做的本質(zhì)上是將貝葉斯推斷的各種理論框架轉(zhuǎn)化為實踐,例如向兒童提供信息、假設(shè)基線概率,再給予新數(shù)據(jù)使其更新假設(shè),而他們總能以恰當(dāng)方式進行正確更新。
另外,無論是我的實驗室還是理查德·阿斯林(Richard Aslin)、珍妮·薩弗蘭(Jenny Saffran)團隊在九十年代的研究都指出:兒童非常擅長做統(tǒng)計。這令人驚訝,畢竟成年人普遍不擅長概率計算。舉例來說,當(dāng)展示兩個裝置——A裝置十次中有八次有效,B裝置十次中四次有效——18個月大的嬰兒會選擇有效概率更高的A裝置。即便將概率調(diào)整為三分之二與十分之八的對比,他們?nèi)阅茏龀鱿嗤x擇。他們似乎能夠下意識地、自然而然地進行數(shù)學(xué)運算,不知不覺中弄清楚概率是如何運作的。
就這樣,引出了一個難題——兒童的行為模式看似符合貝葉斯推斷機制,但理論上這種計算是不可行的。當(dāng)面對海量假設(shè)時,貝葉斯方法要求逐一驗證每個假設(shè)與數(shù)據(jù)的匹配度,當(dāng)你假設(shè)很多時,這就會花費無數(shù)時間。這一問題被稱為搜索問題,沒有人真正解決了這個問題,無論是在統(tǒng)計學(xué)、AI還是童年時期。
但孩子們似乎確實能解決這個難題——他們最終成功理解了世界運作規(guī)律。他們是如何做到的,這是一個非常有趣的問題。目前我的推測是,主動推斷機制可能是關(guān)鍵要素。這不僅僅是被動接收數(shù)據(jù)并更新假設(shè)的過程,而是通過主動實驗探索來構(gòu)建認(rèn)知模型。在物理學(xué)界,理論家與實驗學(xué)家之間總是有一些緊張。從發(fā)展的角度來看,我們是團隊實驗者。
肖恩·卡羅爾:關(guān)于這種認(rèn)知機制的神經(jīng)科學(xué)基礎(chǔ),我們目前了解多少?兒童認(rèn)知能力的提升,是否與其大腦神經(jīng)網(wǎng)絡(luò)發(fā)育存在對應(yīng)關(guān)系?
艾莉森·高普尼克:確實如此。最有趣的是,早期的發(fā)育神經(jīng)科學(xué)所發(fā)現(xiàn)的與我們今天看到的一致:在發(fā)育初期,大腦會生成大量新突觸,形成新的連接;隨后通過髓鞘化加強聯(lián)系、強化傳導(dǎo)效率,未使用的連接則被刪減。因此,早期大腦具有超強可塑性,能快速適應(yīng)新經(jīng)驗,但功能效率低下,而后期大腦雖執(zhí)行高效,但不太擅長改變,可塑性也小得多。這種模式就像是“探索-利用”權(quán)衡的另一種表現(xiàn)。從經(jīng)驗上講,觀察大腦發(fā)育,有的區(qū)域會看到這種非常早期的增殖,有的則是處于后期修剪模式。
肖恩·卡羅爾:視覺系統(tǒng)發(fā)育的關(guān)鍵轉(zhuǎn)折期出現(xiàn)在約18個月大時。此時視覺系統(tǒng)完成初步架構(gòu)搭建,進入穩(wěn)定階段——這也是為何嬰幼兒視力問題需盡早矯正。而語言區(qū)的發(fā)展轉(zhuǎn)折點則延遲至5-6歲,表現(xiàn)為掌握一門語言后,第二語言習(xí)得效率顯著下降。前額葉執(zhí)行功能區(qū)的成熟最晚,它在青少年時期還沒有完全定型。這種發(fā)育軌跡印證了普遍規(guī)律:所有腦區(qū)一開始都會產(chǎn)生很多的連接,然后在某個時間點進行加強和修剪。
把話題扯回學(xué)術(shù)圈,這確實印證了一個現(xiàn)象——那些充滿活力的思想創(chuàng)造者往往是年輕的教職員工和博士后,而非已功成名就數(shù)十年的資深教授。
艾莉森·高普尼克:是的。我想很多人都會問的一個問題是,“成年人能否像兒童一樣保持創(chuàng)造力?”現(xiàn)實情況是,即便拋開科研基金不談,實驗室運作確實需要深諳體系規(guī)則、經(jīng)驗豐富的研究者來爭取資助。
以物理學(xué)家為例,光實驗就是項龐大工程,需要高度專注力和執(zhí)行力。因此我們不希望系主任是那種整天迸發(fā)奇思妙想的狂人,而需要他們保持專注。但有趣的是,成年人已發(fā)展出社會機制來平衡探索與利用,我認(rèn)為休假制度正是典型案例。我們不會要求科學(xué)家閉門造車,我們認(rèn)為靜休、休假、參加學(xué)術(shù)會議等事情可以把自己從現(xiàn)有環(huán)境中拉出來,進行更大范圍的探索。作為科學(xué)家,我們花了很多時間在旅途中,這確實辛苦,但能夠在不同的地方,在不同的環(huán)境下,做跨學(xué)科工作,以不同的方式思考問題,所有這些似乎都是成年人讓自己變得更有創(chuàng)造力的方式。
肖恩·卡羅爾:我們能否將我們從發(fā)育中學(xué)到的經(jīng)驗用來構(gòu)建更好的AI模型?可操作性如何?
艾莉森·高普尼克:這正是我們伯克利AI研究組正在推進的方向。我們嘗試將主動學(xué)習(xí)、社會學(xué)習(xí)、因果模型構(gòu)建等核心理念融入AI系統(tǒng)設(shè)計。由于當(dāng)前大型模型在很多方面都非常有效,因此傾向于認(rèn)為“只要持續(xù)增加算力投入,他們就會更加強大,消耗更多能量,他們會變得越來越好。我們將擁有一個名為‘通用性人工智能’(AGI)的神話”。
但我在與AI研究組交流時發(fā)現(xiàn),每次談到"不存在所謂的通用智能(General Intelligence),無論人工還是自然"時,總能引發(fā)聽眾強烈反應(yīng)。他們認(rèn)為存在一種單一維度、可以量化的智能,有些人天生具備更多智能,有些人則相對匱乏,并相信智能儲備的持續(xù)積累將直接使得其效力增強。
這根本不是正確的認(rèn)知科學(xué)理論或模型。認(rèn)知科學(xué)中的真相其實是:人類認(rèn)知系統(tǒng)存在不同能力間的權(quán)衡機制,而當(dāng)前的大語言模型(LLM)恰恰缺乏這些核心能力。它們不會主動開展實驗探索世界,無法構(gòu)建抽象因果模型以生成內(nèi)容。差別顯而易見,兒童僅憑微量數(shù)據(jù)即可實現(xiàn)跨情景應(yīng)用,而LLM需要海量訓(xùn)練數(shù)據(jù)卻仍難以實現(xiàn)。
所以,問題在于:孩子們做了什么?這能否用于AI使其更有效?目前情況是,AI與兒童認(rèn)知水平存在很大的差距,孩子比我們現(xiàn)今擁有的任何AI系統(tǒng)都要強出好幾個數(shù)量級。但這正是我們應(yīng)該探索的方向。
肖恩·卡羅爾:確實如此。對于那些AI樂觀主義者而言,他們只會看到AI在圍棋或游戲中碾壓人類頂尖選手,與他們對話優(yōu)勢確實很難。我們試著像你剛才那樣說明AI在智能方面的局限性,但這一點似乎有點模糊,很難給它設(shè)定一個基準(zhǔn)。
艾莉森·高普尼克:機器人領(lǐng)域為例,眾所周知,AI在下棋方面表現(xiàn)出色,但在實際抓取棋子上卻糟糕透頂。如果設(shè)計一個游戲環(huán)節(jié)B,要求AI從地板上撿起散落的棋子并精準(zhǔn)歸位,它們的表現(xiàn)依然令人失望。尤其當(dāng)使用一套全新設(shè)計的棋盤(比如《愛麗絲鏡中奇遇記》(Through the Looking Glass)中的棋局*)時,這些棋子無法通過既有訓(xùn)練數(shù)據(jù)識別它們。
![]()
?在《愛麗絲鏡中奇遇記》中的棋盤是一個巨大的、由田野、河流和森林構(gòu)成的奇幻世界,整個鏡中世界被設(shè)計成一個國際象棋棋盤,棋格由自然景觀劃分,棋子則是故事中的角色。愛麗絲作為白棋卒,從第二格開始,經(jīng)歷各種奇妙的冒險,最終到達(dá)第八格成為王后。這個棋盤不僅是一個游戲場景,還象征著愛麗絲的成長旅程和對規(guī)則的探索。插圖:John Tenniel
這正是著名的“莫拉萊斯悖論”(Moravec's Paradox)。這一悖論貫穿AI發(fā)展史:那些對人類來說很難的事情對AI來說卻相對容易,而對人類輕而易舉的感知、行動、運動能力,以及兒童探索“布克特探測器”時的因果推理,對AI來說卻很難。
我認(rèn)為,關(guān)于AI智能的所有討論,根本上都存在誤導(dǎo)。這些系統(tǒng)之所以如此有效,根本原因在于它們利用了網(wǎng)絡(luò)上數(shù)十萬人類為其貢獻文本,并通過某種強化學(xué)習(xí)機制,從人類的反饋中學(xué)習(xí),最終訓(xùn)練出了這些系統(tǒng)。
你們知道《石湯》(Stone Soup)這個經(jīng)典兒童故事嗎?故事是這樣的:從前有幾位訪客來到村莊,他們說:“我們想要些食物。”村民回答:“抱歉,我們沒有多余的食物可以分享。”訪客說:“沒關(guān)系,我們要煮石頭湯。我們有神奇的石頭。”于是他們架起大鍋,放進幾塊石頭開始煮。訪客說:“看,我們要煮石頭湯了。雖然美味,但如果有洋蔥和胡蘿卜就更好了。不過沒有也沒關(guān)系。”這時有村民說:“我家好像有洋蔥和胡蘿卜。”他們就去取來放進去。訪客贊嘆:“看,我們的湯因此變得更棒了!就像當(dāng)年給國王煮湯時加了雞肉效果特別好。您能不能……?”當(dāng)然,你肯定能猜到后來發(fā)生了什么。村民們紛紛貢獻出自己的食物。最終村民感嘆:“太神奇了!我們僅憑一塊石頭就熬出了這么美味的湯。”
如果把這個故事改編成計算機科學(xué)的版本可能是:“我們要開發(fā)AGI,只需要三個算法——梯度(gradient)、下降(descent)和變換器(transformers),我們馬上就能實現(xiàn)AGI,不過需要大量數(shù)據(jù)支撐。”用戶回應(yīng):“沒問題!我們在網(wǎng)上發(fā)布的所有文字、圖片、書籍和報紙都可以貢獻出來。”技術(shù)專家又說:“這真的很棒,但現(xiàn)在我們的AGI還是會說蠢話。要是能通過人類反饋強化學(xué)習(xí),讓大家評估AGI的表現(xiàn)并給出反饋,效果會更好。”人們回應(yīng)道:“好吧,肯尼亞的整個村莊都可以這樣做。”最后技術(shù)專家說:“雖然現(xiàn)在我們的智能水平已經(jīng)很不錯了,但如果能做好提示工程,找到那個能讓系統(tǒng)更聰明的黃金提示詞,你們覺得能實現(xiàn)嗎?”用戶們表示:“我們可以對此進行很多思考。”于是到最后,技術(shù)專家宣稱:“看吧,我們早就說過只需幾個算法就能造出AGI。”
但這種做法卻刻意忽視了系統(tǒng)有效運轉(zhuǎn)的真正原因——并非算法本身,而是背后海量的人類數(shù)據(jù)。這些數(shù)據(jù)來自一群人,他們正在進行四歲孩子所做的那種探索性創(chuàng)造性智能。
![]()
?兒童繪本《石湯》 Nelson Price Milburn出版社出版 圖源:Amazon
肖恩·卡羅爾:我認(rèn)為還有其他構(gòu)建AI系統(tǒng)的角度,這些角度更側(cè)重于建立世界因果模型,甚至進行干預(yù)并將其部署到AI中。
艾莉森·高普尼克:確實如此。這也是研究方向之一,但正如我所說的,這非常困難。貝葉斯推斷的嘗試之所以艱難,是因為搜索問題的復(fù)雜性。此外,所謂的強化學(xué)習(xí),其實就是一個古老的心理學(xué)概念“通過行動驗證效果”。
就像實驗室里的小鼠在迷宮中奔跑,有時獲得奶酪獎勵,有時遭受電擊懲罰,最終學(xué)會趨利避害。這種技術(shù)在棋類AI中發(fā)揮了重要作用,系統(tǒng)通過大量自我對弈探索最優(yōu)策略。但強化學(xué)習(xí)的致命缺陷,在于其視野過于狹隘。當(dāng)智能體僅關(guān)注“當(dāng)前行動是否帶來即時收益”時,就永遠(yuǎn)無法真正探索世界運行的深層規(guī)律。
因此,我認(rèn)為我們正在探索的最有前景的理念,其實與科學(xué)方法高度契合,即學(xué)習(xí)過程中不應(yīng)僅計算“效用是否提升”或“能否獲得更多奶酪”,更應(yīng)該聚焦“此次行動是否比上次獲得更多信息?是否加深了對世界或者系統(tǒng)的認(rèn)知?”
這意味著我們必須選擇那些能揭示世界運行規(guī)律的行為,即便短期內(nèi)無法獲得直接收益。我們一直在努力地構(gòu)建一種內(nèi)在獎勵機制,就像科學(xué)家沉浸于探索的純粹樂趣。
這個問題的解決方案是擁有一種強化學(xué)習(xí)的智能體,但獎勵不是奶酪、效用或贏得游戲,而是發(fā)現(xiàn)了新的東西,更多地了解世界是如何運作的。
在開發(fā)和AI,我們嘗試了諸多有趣的方法來探索如何實現(xiàn)這一目標(biāo)。我們目前正在研究一個非常有趣的構(gòu)想叫做“賦能”(Empowerment),其核心理念在于:當(dāng)你的行為對世界產(chǎn)生可預(yù)測的影響時,就會獲得獎勵。
為此,你會盡可能多地嘗試各種行動,通過改變具體操作來觀察世界的不同變化。這種過程充滿驚喜與趣味,自然會激發(fā)重復(fù)探索的欲望,也會希望盡可能多地進行不同類型的行動,盡可能多地建立類似的關(guān)系。如果過了一段時間你感到無聊,就會嘗試去尋找新的目標(biāo)。
這與我之前提到的因果學(xué)習(xí)密切相關(guān)。所謂賦能獎勵的本質(zhì),就是讓你學(xué)會如何干預(yù)世界,理解自身行為如何引發(fā)連鎖反應(yīng)。一些證據(jù)顯示,即使是兩個月大的嬰兒,當(dāng)你在他們的腳和手機之間放一條絲帶,以便他們控制手機,他們會坐在那里,嘗試各種不同的踢腿方式,看看對手機有什么影響。就像小小的科學(xué)家,他們會咯咯笑,然后繼續(xù)重復(fù)實驗。這種探索行為對他們而言似乎十分有滿足感。當(dāng)然,他們也會模仿媽媽做同樣的事情,他們做各種鬼臉,然后看媽媽是否會對他們回以鬼臉。
我認(rèn)為這是解決方案的很重要的一部分。我想再次說明,這與科學(xué)研究有關(guān)?;氐轿覀冎八f實驗的系統(tǒng)性上,我注意到,當(dāng)權(quán)者總是說,“你不能只是漫無目的地釣魚式調(diào)查(fishing expedition,指缺乏明確目標(biāo)的調(diào)查或信息搜集行為,靠碰運氣解決問題)。”通過嘗試某種方法,意外發(fā)現(xiàn)了某種系統(tǒng)性的規(guī)律——這才是真正的價值所在,遠(yuǎn)比那些已知因果關(guān)系更有意義。而“賦能”的理念會鼓勵你繼續(xù)進行釣魚式調(diào)查。
肖恩·卡羅爾:卡爾·弗里斯頓(Karl Friston)提出的“自由能原理”和“貝葉斯大腦”理論主張,“大腦的本質(zhì)是盡可能減少意外感”。如果按照這個邏輯,人類就應(yīng)該蜷縮在黑暗房間里,什么都不要做。但他的觀點其實是,為了我們最小化生命中的意外感,我們必須立即開始積極探索、嘗試各種非常規(guī)行為,這樣才能預(yù)判未來會發(fā)生什么。
艾莉森·高普尼克:沒錯,這正是我之前提到的探索與利用的權(quán)衡。關(guān)鍵在于你需要構(gòu)建對周遭世界的連貫認(rèn)知框架,既不能只關(guān)注隨機發(fā)生的新奇事物,也不能不斷重復(fù)舊有的事情。我們發(fā)現(xiàn),當(dāng)給孩子一個隨機行為的“布克特探測器”時,與那些行為結(jié)果具備系統(tǒng)性關(guān)聯(lián)的設(shè)備相比,孩子們更傾向與“布克特探測器”互動。這種對系統(tǒng)性驚喜的偏愛,同樣適用于科學(xué)家群體。
肖恩·卡羅爾:對于世界存在的某種固有結(jié)構(gòu),雖然我們在著手利用它,但無論是哲學(xué)家、物理學(xué)家、AI研究者都尚未完全掌握將其系統(tǒng)化的方法。
艾莉森·高普尼克:是的。有一件事總會讓我感到震憾,這也是我當(dāng)年作為哲學(xué)系學(xué)生開啟這項研究的初心——知識的本質(zhì),這源于對柏拉圖與亞里士多德所探討的深層哲學(xué)問題的思考。
我們?nèi)绾未_知外部世界的存在?它不僅包含某種結(jié)構(gòu),還包含夸克、心智和各種各樣無法被直接觀測的東西。然而,從世界傳達(dá)到我們的只是一堆干擾我們耳膜的空氣和我們眼睛的光子。
我們是如何從這些數(shù)據(jù)中重建那個世界的呢?我想回到柏拉圖和亞里士多德的理論。“我們似乎是通過數(shù)據(jù)來理解這個世界。它一直都在那里。”這本質(zhì)上源于某種先天進化結(jié)構(gòu)——這正是柏拉圖的哲學(xué)路徑。而亞里士多德的理論則對應(yīng)著當(dāng)代大型語言模型的范式,“我們看似是理解了世界結(jié)構(gòu),實則只是提取光子與耳膜聲波間的統(tǒng)計關(guān)聯(lián)。我們錯誤地將數(shù)據(jù)相關(guān)性等同于結(jié)構(gòu)認(rèn)知,卻缺乏充分理由支撐這種推斷。”
發(fā)育的奇妙之處在于:真實嬰兒的學(xué)習(xí)過程,似乎并不符合上述兩種情況。我們似乎能夠從根本上了解這個世界的新事物,無論是了解我可能喜歡西蘭花而你不喜歡,還是了解夸克和輕子。但人類認(rèn)知不僅僅是在數(shù)據(jù)中的統(tǒng)計相關(guān)性。
雖然看起來我們確實能發(fā)展出超越數(shù)據(jù)關(guān)聯(lián)性的理論,但一千年來,我們?nèi)晕茨芙⒂行У挠嬎隳P蛠斫忉屵@種能力。我認(rèn)為,觀察兒童如何實現(xiàn)這種學(xué)習(xí)過程,正是破解這一哲學(xué)難題的關(guān)鍵路徑。這正是我畢生研究的課題。
肖恩·卡羅爾:有時候觀察現(xiàn)實世界的實際運作確實能幫助我們更好地理解它。
翻譯這篇對話的過程,既是對認(rèn)知科學(xué)前沿的一次沉浸式學(xué)習(xí),也引發(fā)了我對人類智能本質(zhì)的深刻反思。艾莉森·高普尼克將兒童比作“進化設(shè)計的探索者”,其認(rèn)知模式猶如“模擬退火”中的高溫搜索,以無序嘗試構(gòu)建世界模型。這種視角顛覆了傳統(tǒng)教育中對“專注力不足”的負(fù)面評價,反而將其視為文明進步的原始動力。反觀當(dāng)前AI領(lǐng)域,大型語言模型雖能復(fù)刻人類知識的表象,卻缺乏兒童般主動干預(yù)世界、驗證因果的創(chuàng)造力。
翻譯時,如何精準(zhǔn)傳遞“賦能”(Empowerment)等跨學(xué)科概念成為挑戰(zhàn)——它們既是技術(shù)術(shù)語,又隱喻著人類認(rèn)知與機器邏輯的分野。高普尼克提到“祖母與虎鯨的文化傳遞”,更令人深思:智能不僅是算法優(yōu)化,更是代際間經(jīng)驗與創(chuàng)新的動態(tài)平衡。
或許,在追求通用人工智能的路上,我們更需要向嬰兒學(xué)習(xí):放下對“效率”的執(zhí)念,重拾探索的純粹樂趣。畢竟,文明的火種,始于混沌中的第一粒星火。
*為保證閱讀體驗,本文對聽稿進行了適當(dāng)?shù)鼐庉嫛?/p>
快報
根據(jù)《網(wǎng)絡(luò)安全法》實名制要求,請綁定手機號后發(fā)表評論