一
1月31日,在第五屆CCTV賀歲杯中日韓圍棋爭(zhēng)霸賽決賽上,面對(duì)衛(wèi)冕冠軍柯潔,井山裕太數(shù)度模仿AlphaGO在橫掃弈城時(shí)的著法?,F(xiàn)場(chǎng)觀戰(zhàn)的羅建文對(duì)記者說(shuō):“自從AlphaGO出現(xiàn)后,以前的很多理論都被顛覆了……像這種下法,以前是要被老師罵的!”
在AlphaGO和李世石的歷史性對(duì)局之后,所謂“AlphaGO流”的圍棋風(fēng)格就開(kāi)始在職業(yè)棋壇流行起來(lái),并且在“master”的連勝之下愈演愈烈。
和20年前的“深藍(lán)”一樣,AlphaGO同樣選擇一項(xiàng)棋類游戲?qū)θ祟惏l(fā)起挑戰(zhàn),這不是偶然。和語(yǔ)言翻譯、新聞推薦、語(yǔ)音理解不同,這是勝負(fù)分明的領(lǐng)域,失敗者必須尊重和學(xué)習(xí)勝利者,而不是挑剔它們偶爾出現(xiàn)的誤差。
至少在圍棋領(lǐng)域,機(jī)器向人類學(xué)習(xí)的時(shí)代已經(jīng)開(kāi)始接近尾聲,而人類向機(jī)器學(xué)習(xí)的時(shí)代正在黎明。
二
為什么在“深藍(lán)”擊敗人類大師的20年后,AlphaGO仍然讓我們感到空前的不安?
國(guó)際象棋的游戲復(fù)雜度是10的46次方,對(duì)于現(xiàn)代計(jì)算機(jī)來(lái)說(shuō)不是一個(gè)天文數(shù)字。“深藍(lán)”采取的策略非常簡(jiǎn)單粗暴:在人類對(duì)手下完之后,利用計(jì)算力的優(yōu)勢(shì),窮盡棋盤(pán)上的每一種可能性,并從其中排除掉會(huì)令自己落敗的著法。
所以,“深藍(lán)”其實(shí)從來(lái)沒(méi)有被人們看作一種“智能”,她只是一套從數(shù)學(xué)上“破解”了國(guó)際象棋的“程序”——這門(mén)游戲盡管已經(jīng)非常復(fù)雜,但相比現(xiàn)實(shí)中的人類智力活動(dòng)還是很簡(jiǎn)單的,這種“窮舉法”無(wú)法直接應(yīng)用于社會(huì)實(shí)踐中。
圍棋的游戲復(fù)雜度達(dá)到了10的172次方——要窮盡它的策略選擇,是不可能的。AlphaGO的“深度學(xué)習(xí)”是一種基于統(tǒng)計(jì)數(shù)學(xué)的方法論:通過(guò)獲取人類對(duì)弈的記錄,以及直接與人類或自身對(duì)弈,AlphaGO能夠獲得大量用于統(tǒng)計(jì)分析的“學(xué)習(xí)樣本”。通過(guò)對(duì)著子紀(jì)錄和勝負(fù)關(guān)系進(jìn)行數(shù)學(xué)分析,AlphaGO可以逐漸理解在不同的棋局里哪些下法更容易贏、哪些下法更容易輸。接著,她用分析得到的策略去和人類對(duì)弈,或者和自身對(duì)弈,保留更優(yōu)的著法——不斷重復(fù)。
AlaphGO并不是“深藍(lán)”那樣算無(wú)遺策的機(jī)器,而是人類的模仿者。她觀察、分析、訓(xùn)練、總結(jié)……不知疲倦地重復(fù)。
終于,她用人的方式戰(zhàn)勝了人——昔日的學(xué)徒成為了大師。
三
在和機(jī)器打交道的數(shù)百年里,人們已經(jīng)習(xí)慣于機(jī)器絕對(duì)的精密和準(zhǔn)確。但AlphaGO不一樣,正因?yàn)樗靡詫?duì)抗人類的“思考方式”遠(yuǎn)比“深藍(lán)”更像人類本身,所以AlphaGO的著法不像“深藍(lán)”那樣無(wú)可挑剔。
當(dāng)需要解決的問(wèn)題足夠復(fù)雜時(shí),每一個(gè)現(xiàn)實(shí)樣本都有其自身的特殊性,一個(gè)能完美吻合所有學(xué)習(xí)樣本的數(shù)學(xué)模型是不可能的。不夠復(fù)雜的模型會(huì)擬合不了現(xiàn)有的學(xué)習(xí)樣本(欠擬合),而過(guò)于復(fù)雜的模型則會(huì)在實(shí)踐應(yīng)用中出現(xiàn)太大的誤差(過(guò)擬合)。機(jī)器學(xué)習(xí)的優(yōu)化目標(biāo),不是對(duì)于每一個(gè)樣本都完美擬合,而是在“欠擬合”和“過(guò)擬合”之間找到整體最均衡的狀態(tài)。
這剛好就像圍棋一樣:為了交換整體局勢(shì)的最優(yōu),在局部付出一些代價(jià)是必須的。
對(duì)于當(dāng)下任何足以勝任復(fù)雜任務(wù)的“人工智能”,都應(yīng)當(dāng)作如是觀。當(dāng)我們挑剔AlphaGO、谷歌翻譯和Siri們所犯下的各種錯(cuò)誤時(shí),最好別忘了,因?yàn)檫@些”智能“在計(jì)算中的誤差,才讓她們看起來(lái)比以前更像人類——人類是會(huì)犯錯(cuò)誤的。
四
機(jī)器的“深度學(xué)習(xí)”會(huì)讓人聯(lián)想到人類兒童接受的早期教育。我們的“學(xué)習(xí)樣本”被標(biāo)注為“圓形、方塊、三角”、“紅色、綠色、藍(lán)色”或者“大的、小的”。一旦這些抽象概念的模型在我們的頭腦中被成功建立起來(lái),我們會(huì)開(kāi)始練習(xí)使用這些基本概念去組合形成更加復(fù)雜的概念:“紅色的大三角”、“綠色的小方塊”……再接下來(lái),和生活實(shí)踐相結(jié)合,我們開(kāi)始區(qū)分貓和狗、男性和女性、房屋和車(chē)輛……
區(qū)別在于,如果AlphaGO的團(tuán)隊(duì)認(rèn)為有必要,她可以每天進(jìn)行數(shù)以萬(wàn)計(jì)的自我對(duì)弈以獲取大量的新的學(xué)習(xí)樣本——即便把這個(gè)標(biāo)準(zhǔn)降低到每天幾盤(pán),也只有極少數(shù)人類才能堅(jiān)持下來(lái)。
要保持終身、高專注度的學(xué)習(xí),人需要不斷克服自己的惰性、欲望、挫敗感。而這些是機(jī)器永遠(yuǎn)不需要面對(duì)的。
所以,人類的思想很容易陷入僵化。階層、教育、家庭背景的制約會(huì)逐漸減少一個(gè)人生活的選擇,因而讓他陷入對(duì)既有生活經(jīng)驗(yàn)的簡(jiǎn)單重復(fù)中,而當(dāng)你花了太多時(shí)間在少量、高度相似的學(xué)習(xí)樣本上,你很容易得到對(duì)這些樣本“過(guò)度擬合”、缺乏泛化能力的思考模型。
有一篇流傳甚廣的雞湯不無(wú)道理,它說(shuō):大多數(shù)人在30歲的時(shí)候就死了,他們只是不斷重復(fù)自己在30歲以前的人生——除非他能始終保持開(kāi)放的心態(tài),主動(dòng)去接觸那些超出自己經(jīng)驗(yàn)范圍的樣本,不斷泛化自己的思想模型。
但那很不容易。大多數(shù)人面對(duì)超出既有生活經(jīng)驗(yàn)的新現(xiàn)象,幾乎會(huì)出于本能地提出質(zhì)疑和否定,從而換得停留在既有經(jīng)驗(yàn)和思想上的舒適感。
五
AlphaGO的勝利是一個(gè)毋庸置疑的信號(hào),它讓人類不得不正視這樣一個(gè)事實(shí):人類思考的過(guò)程與機(jī)器的相似之處也許遠(yuǎn)比人們過(guò)去以為的高。盡管機(jī)器常被認(rèn)為沒(méi)有靈感、聯(lián)想和視覺(jué)思維等人類“獨(dú)有”的思考模式,但僅憑借對(duì)邏輯的充分運(yùn)用,機(jī)器一樣可以恰當(dāng)?shù)啬M人類的思考,甚至比人類干得更好。
這其實(shí)提出了一個(gè)很好的問(wèn)題:人類真的存在那些非邏輯的思維方式嗎?或者說(shuō)那只是出于對(duì)自身認(rèn)知模式的無(wú)知而提出的一些不符合事實(shí)的假設(shè)呢?
完全有理由相信,機(jī)器學(xué)習(xí)在人類社會(huì)中的影響還遠(yuǎn)沒(méi)有開(kāi)始充分釋放。這不僅是指機(jī)器學(xué)習(xí)將如何進(jìn)一步應(yīng)用于人類的社會(huì)實(shí)踐中。更關(guān)鍵的一種影響可能是文化意義上的,機(jī)器在人類領(lǐng)域設(shè)立的更多成功樣本可能成為人類學(xué)習(xí)和模仿的對(duì)象。
AlphaGO不是天才,李世石才是天才——他用遠(yuǎn)比AlphaGO更少的訓(xùn)練樣本,達(dá)到了與它旗鼓相當(dāng)?shù)乃伎妓健?/p>
AlphaGO其實(shí)向我們?cè)俅巫C明了那些我們很早就知道卻沒(méi)能做到的道理。
就像一位大師說(shuō)過(guò)的那樣:“真正的大師永遠(yuǎn)都是學(xué)徒。A true master is an eternal student.”(本文首發(fā)鈦媒體)






快報(bào)
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論
和科大訊飛提出的觀點(diǎn)類似--讓機(jī)器從能聽(tīng)會(huì)說(shuō)到能理解會(huì)思考,不知道人工智能會(huì)發(fā)展成什么樣,體驗(yàn)過(guò)旗下的靈犀語(yǔ)音助手,感覺(jué)處在“能聽(tīng)會(huì)說(shuō)階段”