在线成人精品欧美激情四射,成人做爰免费A片

席爾瓦透露了AlphaGo的下一步可能動(dòng)向以及應(yīng)用前景，將是人們息息相關(guān)的生活。AlphaGo的最新版本自我估分在4500左右，遠(yuǎn)遠(yuǎn)超出積分3625的柯潔，實(shí)力水平大約在13段左右，人類選手中已然無(wú)敵。

鈦媒體注：“谷李”世紀(jì)大戰(zhàn)硝煙散盡，由此引發(fā)的機(jī)器學(xué)習(xí)與人工智能的熱潮不減反增。日前，AlphaGo （中文俗稱“阿爾法狗”）項(xiàng)目負(fù)責(zé)人，有著阿爾法狗之父之稱的大衛(wèi)·席爾瓦（David Silver）回到英國(guó)倫敦，在母校倫敦大學(xué)學(xué)院（UniversityCollege London，UCL）一場(chǎng)私密會(huì)上復(fù)盤了人工智能圍棋系統(tǒng)AlphaGo與李世石的5番棋大戰(zhàn)，在場(chǎng)的聽(tīng)眾被禁止拍照。這也是賽后，阿爾法狗團(tuán)隊(duì)的首次半公開復(fù)盤。
UCL計(jì)算機(jī)系是全英計(jì)算機(jī)排名第一的學(xué)院。在UCL計(jì)算機(jī)系攻讀博士學(xué)位的中國(guó)留學(xué)生張偉楠全程參與了這次分享會(huì)，并且在會(huì)后與席爾瓦進(jìn)行了面對(duì)面的交流。鈦媒體獨(dú)家約稿張偉楠，根據(jù)席爾瓦的分享及會(huì)后與席爾瓦的交流，寫作此文，席爾瓦也透露了AlphaGo的下一步可能動(dòng)向以及應(yīng)用前景。席爾瓦透露，AlphaGo的最新版本自我估分在4500左右，遠(yuǎn)遠(yuǎn)超出積分3625的柯潔，實(shí)力水平大約在13段左右，人類選手中已然無(wú)敵。

張偉楠與阿爾法狗之父席爾瓦在交流

兩周前的那場(chǎng)人機(jī)大戰(zhàn)，AlphaGo出人意料地獲得了壓倒性的勝利，4:1戰(zhàn)勝了李世石。棋局進(jìn)程激烈精彩之處，不亞于那些人類棋手創(chuàng)造的歷史名局。

3月24日，回到UCL大學(xué)，席爾瓦在復(fù)盤中詳細(xì)講述了AlphaGo背后的技術(shù)原理以及谷李5場(chǎng)比賽的分析。

獲得歷史性的勝利之后，外界十分關(guān)心AlphaGo的下一步和未來(lái)，席爾瓦透露，在《Nature》那篇文章引發(fā)廣泛關(guān)注和轟動(dòng)之后，AlphaGo團(tuán)隊(duì)還將再寫一篇論文，與外界分享AlphaGo與李世石比賽中的技術(shù)進(jìn)步。

席爾瓦還表示，DeepMind一直希望能夠?yàn)殚_發(fā)者社區(qū)做貢獻(xiàn)，他們之前也公布了DQN項(xiàng)目（deep－q-network）的代碼——基于深度強(qiáng)化學(xué)習(xí)的游戲平臺(tái)。未來(lái)他們可能會(huì)公布AlphaGo的代碼，只要能找到一個(gè)合適的方案，但是目前還沒(méi)有找到。

投入20個(gè)人的團(tuán)隊(duì)，花費(fèi)大量的財(cái)力去做圍棋對(duì)弈，對(duì)谷歌來(lái)說(shuō)意味著什么？下一步會(huì)如何延伸到其他產(chǎn)業(yè)領(lǐng)域？

席爾瓦透露，DeepMind今后的著眼點(diǎn)是和人們?nèi)粘Ｉ钕⑾⑾嚓P(guān)，并可以改變世界的應(yīng)用，比如精準(zhǔn)醫(yī)療、家用機(jī)器人以及智能手機(jī)助手。

AlphaGo之父十年磨一劍

似乎在一夜之間，機(jī)器選手戰(zhàn)勝了人類最頂尖圍棋選手。但是，對(duì)于席爾瓦來(lái)說(shuō)，人工智能圍棋耗時(shí)十幾年，最終不過(guò)是水到渠成。

作為AlphaGo的幕后團(tuán)隊(duì)的技術(shù)主管，也是谷歌DeepMind團(tuán)隊(duì)最重要的科學(xué)家之一，席爾瓦還身兼UCL大學(xué)的教職，是該校計(jì)算機(jī)系的教授，教授“強(qiáng)化學(xué)習(xí)”的課程。

席爾瓦是在加拿大阿伯塔大學(xué)獲得博士學(xué)位，師從世界上首屈一指的“強(qiáng)化學(xué)習(xí)”大師理查德·薩頓（Richard S.Sutton）研究強(qiáng)化學(xué)習(xí)算法，后來(lái)在另一座科技圣殿美國(guó)麻省理工學(xué)院從事博士后研究。

在攻讀博士以及博士后工作期間，席爾瓦一直致力于強(qiáng)化學(xué)習(xí)在圍棋人工智能上的研究。到英國(guó)UCL大學(xué)計(jì)算機(jī)系執(zhí)教以后，他還經(jīng)常拿圍棋作為授課的應(yīng)用實(shí)例。

席爾瓦的課程開始聽(tīng)的人并非很多。三年前，我曾上過(guò)他的課程。有一次因故遲到了20分鐘，當(dāng)時(shí)的教室里仍然可以找到座位。現(xiàn)在，隨著他加入到Deepmind團(tuán)隊(duì)，尤其是他掌舵AlphaGo項(xiàng)目名聲大噪，他的課程也開始廣受歡迎，遲到的人基本上只能站著聽(tīng)課了。

加入DeepMind之前，席爾瓦即已開始和CEO戴密斯·哈薩比斯（Demis Hassabis）共同研究強(qiáng)化學(xué)習(xí)。哈薩比斯在UCL拿到了神經(jīng)學(xué)博士學(xué)位。兩個(gè)人都癡迷于游戲，哈薩比斯少年時(shí)曾經(jīng)是英國(guó)國(guó)際象棋隊(duì)隊(duì)長(zhǎng)，在13歲便已經(jīng)獲得國(guó)際象棋大師的頭銜，青年時(shí)自創(chuàng)游戲公司，而席爾瓦則長(zhǎng)期對(duì)圍棋情有獨(dú)鐘。

2014年初，在被谷歌收購(gòu)之前，DeepMind即開始與UCL洽談，希望能買斷席爾瓦的工作時(shí)間。這樣可以保留他在大學(xué)的教職的同時(shí)，還可以讓他在DeepMind全心工作。

加盟DeepMind之后，席爾瓦成立了20個(gè)人的AlphaGo團(tuán)隊(duì)，專門研究圍棋人工智能。匯集整個(gè)團(tuán)隊(duì)的力量，他要求在技術(shù)研發(fā)的每一個(gè)環(huán)節(jié)上都追求極致。AlphaGo團(tuán)隊(duì)成員就透露，有的智能模塊在谷歌團(tuán)隊(duì)看來(lái)已經(jīng)很完美了，但是席爾瓦卻仍認(rèn)為不及格，離完美還差很遠(yuǎn)。

長(zhǎng)期專注于人工智能與圍棋項(xiàng)目，在技術(shù)方面追求極致，再加上勢(shì)大財(cái)雄的谷歌的團(tuán)隊(duì)配合，最終成就了AlphaGo的驟然爆發(fā)。

復(fù)盤谷李大戰(zhàn)

復(fù)盤是職業(yè)圍棋選手經(jīng)常做的一件事，他們相信總結(jié)過(guò)去一盤棋的經(jīng)驗(yàn)和教訓(xùn)，可以提高自己的棋藝。

AlphaGo團(tuán)隊(duì)也做了復(fù)盤，通過(guò)幾張幻燈片的形式，席爾瓦復(fù)盤了這5場(chǎng)比賽的勝負(fù)關(guān)鍵處，而在場(chǎng)的聽(tīng)眾被禁止拍照。

第一盤的勝負(fù)關(guān)鍵處是，AlphaGo執(zhí)白棋第102手打入黑空，職業(yè)高手們普遍認(rèn)為這是一招險(xiǎn)招，看上去李世石對(duì)此也早有準(zhǔn)備。事后看，棋局的進(jìn)程卻是李世石應(yīng)對(duì)有誤，進(jìn)入到了AlphaGo的計(jì)算步調(diào)中。再下了幾手棋之后，AlphaGo已經(jīng)優(yōu)勢(shì)明顯。

第二盤棋的開局不久，AlphaGo就下出了職業(yè)棋手們普遍認(rèn)為不妥的一手棋。席爾瓦稱其為反人類（unhuman）一手——第37手5路肩沖。觀戰(zhàn)的多數(shù)職業(yè)高手認(rèn)為這不太成立，超出了職業(yè)高手們正常的行棋邏輯。

隨后的進(jìn)程，這手棋的價(jià)值逐漸閃現(xiàn)，李世石又一次輸?shù)煤翢o(wú)脾氣。

席爾瓦解釋道：“多數(shù)評(píng)論員都第一時(shí)間批評(píng)這一步棋，從來(lái)沒(méi)有人在這樣的情況下走出如此一著。在勝負(fù)已定之后，一些專業(yè)人士重新思考這一步，他們改口稱自己很可能也會(huì)走這一著。”

而在AlphaGo看來(lái)，當(dāng)時(shí)只是一步很正常的走子選擇而已。

對(duì)于第一盤棋和第二盤棋，許多職業(yè)圍棋選手以及媒體分析都認(rèn)為，AlphaGo逆轉(zhuǎn)取勝，但是在AlphaGo自身的價(jià)值網(wǎng)絡(luò)所做的實(shí)時(shí)勝率分析看來(lái)，自己始終處于領(lǐng)先。在AlphaGo獲勝的4盤中，AlphaGo系統(tǒng)自有的勝率評(píng)估始終都是領(lǐng)先李世石，從頭到尾壓制直到最終獲勝。

第三盤和第五盤，AlphaGo 都是在棋局剛開始不久，就已經(jīng)取得了明顯優(yōu)勢(shì)并持續(xù)提高勝率直到終局。與職業(yè)棋手根據(jù)經(jīng)驗(yàn)所做的勝負(fù)判斷不同，AlphaGo的自有勝率評(píng)估是基于一個(gè)價(jià)值模塊，做出對(duì)棋局勝負(fù)的預(yù)計(jì)。

這兩種判斷截然不同。當(dāng)?shù)谖灞P右下角的爭(zhēng)奪錯(cuò)綜復(fù)雜時(shí)，AlphaGo選擇脫先，轉(zhuǎn)而落子在其他位置。不少職業(yè)棋手認(rèn)為，AlphaGo在此犯錯(cuò)并落后了，但AlphaGo的選擇卻是依據(jù)全局最優(yōu)估計(jì)而做出的。

以幾局的成敗論，AlphaGo的這種判斷似乎更為準(zhǔn)確。突破了職業(yè)棋手對(duì)圍棋的傳統(tǒng)的理解范疇，不再局限于棋手多年培養(yǎng)出來(lái)的圍棋直覺(jué)和套路定式，會(huì)選擇探索職業(yè)棋手正常不愿意考慮的招數(shù)。AlphaGo在人類棋譜學(xué)習(xí)的基礎(chǔ)上，還進(jìn)行了大量的自我對(duì)弈，從而研究出了一些人類從未涉及到的走法。

“神之一手”的背后

AlphaGo系統(tǒng)并非無(wú)懈可擊，但是，漏洞并不是所謂的模仿棋、打劫等等。它的漏洞體現(xiàn)在李世石贏得比賽的第四盤棋，AlphaGo取得巨大進(jìn)步的價(jià)值模塊出現(xiàn)了瑕疵，這也是AlphaGo在5局棋中唯一的一次漏洞，也是唯一的一盤失利。

在第四盤棋中，開局之后很快就幾陷絕境中的李世石，弈出了被來(lái)自中國(guó)的世界冠軍古力成為“神之一手”的白78手，凌空一挖。堅(jiān)韌如山的對(duì)手突然倒下，AlphaGo變得不知所措，連續(xù)出現(xiàn)低級(jí)昏招，這也成就了AlphaGo有記載的公開的第一局失利。

對(duì)于AlphaGo的異常表現(xiàn)，各路觀戰(zhàn)的職業(yè)高手充滿了猜測(cè)。即使是觀賽的哈薩比斯和席爾瓦也都不知道究竟發(fā)生了什么。

事后的分析顯示，在李世石下出第78手之前，AlphaGo自有的勝率評(píng)估一直認(rèn)為自己領(lǐng)先，評(píng)估的勝率高達(dá)70%。在第78手之后，AlphaGo評(píng)估的勝率急轉(zhuǎn)直下，被李世石遙遙領(lǐng)先，之后再也沒(méi)有縮短差距。

為什么AlphaGo面對(duì)李世石的第78手表現(xiàn)如此差，是因?yàn)樗鼪](méi)有想到李世石的這手棋嗎？

席爾瓦揭曉了這一秘密。AlphaGo的計(jì)算體系中，的確曾經(jīng)評(píng)估過(guò)這手棋，只是在AlphaGo的評(píng)估中，李世石走那一子的概率大概是萬(wàn)分之一，最終，它沒(méi)有想到李世石會(huì)這樣走，也就沒(méi)有計(jì)算李世石這樣走之后如何應(yīng)對(duì)。

賽后，獲勝的李世石則說(shuō)，這一手在他看來(lái)是唯一的選擇。

AlphaGo背后的蒙特卡洛樹搜索依賴的策略網(wǎng)絡(luò)，是根據(jù)人類對(duì)弈棋譜數(shù)據(jù)訓(xùn)練出來(lái)的模型，它很難去預(yù)測(cè)白78手這樣的所謂手筋妙招，也就很難判斷基于這一步繼續(xù)往下搜索之后的勝負(fù)狀態(tài)。

這就是AlphaGo在這5盤對(duì)局中表現(xiàn)出的唯一破綻，也是目前人類智慧還領(lǐng)先于AlphaGo背后的大數(shù)據(jù)驅(qū)動(dòng)的通用人工智能（Data-driven Artificial General Intelligence）的地方。

人工智能已然無(wú)敵？

在此次大賽之前，多數(shù)來(lái)自職業(yè)圍棋界的棋手包括李世石自己都認(rèn)為，李世石會(huì)輕松取勝。但是，DeepMind團(tuán)隊(duì)卻信心滿滿。另一位DeepMind團(tuán)隊(duì)的主力成員也曾經(jīng)在UCL介紹AlphaGo的進(jìn)展，在展望與李世石的比賽時(shí)，他曾就篤定地預(yù)言，AlphaGo會(huì)贏。

當(dāng)有人問(wèn)及從去年10月戰(zhàn)勝梵麾，到今年3月對(duì)陣?yán)钍朗?，半年時(shí)間當(dāng)中， AlphaGo究竟有哪些方面的提升時(shí)，席爾瓦簡(jiǎn)要回答說(shuō)：“我們?cè)谙到y(tǒng)的每一個(gè)模型上盡可能推進(jìn)效果極致，尤其在價(jià)值網(wǎng)絡(luò)上獲得了很大的提升。訓(xùn)練價(jià)值網(wǎng)絡(luò)的目標(biāo)勝率除了通過(guò)自我對(duì)弈的結(jié)果外，我們還使用了搜索策略去盡可能逼近理論的勝率。”

直觀地說(shuō)，3月版本的AlphaGo比半年前的水平大概是讓4子——讓對(duì)方先占據(jù)4個(gè)星位！

在戰(zhàn)勝李世石之后，中國(guó)、韓國(guó)、日本許多的職業(yè)棋手，包括李世石本人都希望能夠再與AlphaGo一戰(zhàn)。

按照等級(jí)分排名，AlphaGo僅次于中國(guó)的世界冠軍柯潔，排名世界第二。而席爾瓦透露，AlphaGo的最新版本自我估分在4500左右，遠(yuǎn)遠(yuǎn)超出現(xiàn)在3600多的柯潔，實(shí)力水平大約在13段左右，人類選手中已然無(wú)敵！

AlphaGo為什么會(huì)有這么強(qiáng)勁的表現(xiàn)？在講座當(dāng)中，席爾瓦部分地復(fù)述和解釋了今年1月《Nature》上發(fā)表的論文，講述了人工智能的基本原理以及AlphaGo的技術(shù)框架。

對(duì)于人工智能來(lái)說(shuō)，圍棋游戲的難度在于，決策空間實(shí)在太大。決策（Decision Making）是人工智能的關(guān)鍵要素，使得機(jī)器能夠在人類的世界中發(fā)揮作用。

在圍棋以及任何游戲中，一次決策往往使得游戲更新到了一個(gè)新的局面，于是影響到了接下來(lái)的決策，一直到最終游戲的勝負(fù)。人工智能的關(guān)鍵就是在決策空間中搜索達(dá)到最大效益的路徑，最終體現(xiàn)在當(dāng)前決策中。

圍棋棋盤上棋子可能的組合方式的數(shù)量就有10的170次方之多，超過(guò)宇宙原子總數(shù)。在近乎無(wú)窮的決策空間中，去暴力搜索出當(dāng)前棋盤的下一步最優(yōu)走子是絕對(duì)不可能的事情。

AlphaGo的方案是在這樣的超級(jí)空間中，做到盡可能有效的路徑選擇。其思路是一個(gè)框架加兩個(gè)模塊：解決框架是蒙特卡洛樹搜索（MonteCarlo Tree Search），兩個(gè)模塊分別是策略網(wǎng)絡(luò)和價(jià)值網(wǎng)絡(luò)。

策略網(wǎng)絡(luò)（Policy Network）根據(jù)當(dāng)前棋盤狀態(tài)決策下一步走子，是典型的人工智能決策問(wèn)題。策略網(wǎng)絡(luò)搭建的第一步，基于KGS圍棋服務(wù)器上30萬(wàn)張業(yè)余選手對(duì)弈棋譜的監(jiān)督學(xué)習(xí)（SupervisedLearning），來(lái)判斷當(dāng)前棋盤人類最可能的下一走子是什么。

第二步，是利用監(jiān)督學(xué)習(xí)得到的第一個(gè)策略網(wǎng)絡(luò)去通過(guò)自我對(duì)弈來(lái)訓(xùn)練一個(gè)加強(qiáng)版的策略網(wǎng)絡(luò)，學(xué)習(xí)方法是強(qiáng)化學(xué)習(xí)（Reinforcement Learning），自我對(duì)弈3000萬(wàn)局，從人類的走子策略中進(jìn)一步提升。

遵循策略網(wǎng)絡(luò)的判斷，在蒙特卡洛樹搜索框架下對(duì)每個(gè)棋盤狀態(tài)的采樣范圍就大大減小，這是一個(gè)搜索寬度的減小，但是由于一盤圍棋總手?jǐn)?shù)可以多達(dá)250步以上，搜索的深度仍然帶來(lái)無(wú)法處理的巨大計(jì)算量，而這就由第二個(gè)模塊——價(jià)值網(wǎng)絡(luò)來(lái)解決。

價(jià)值網(wǎng)絡(luò)（Value Network）的功能是根據(jù)當(dāng)前棋盤狀態(tài)判斷黑白子某一方的勝率，是一個(gè)人工智能預(yù)測(cè)（Prediction）問(wèn)題。

處理預(yù)測(cè)問(wèn)題的機(jī)器學(xué)習(xí)模型一般需要直接知道需要預(yù)測(cè)的真實(shí)目標(biāo)是什么，比如預(yù)測(cè)第二天的天氣，或者預(yù)測(cè)用戶是否會(huì)一周內(nèi)購(gòu)買某個(gè)商品，這些歷史數(shù)據(jù)都有直接的目標(biāo)數(shù)據(jù)可供機(jī)器學(xué)習(xí)。而在圍棋對(duì)局中，給定的一盤棋局完全可能在歷史上就找不到哪次對(duì)弈出現(xiàn)過(guò)這樣的局面，也就不能直接得到對(duì)弈最終的勝負(fù)結(jié)果。

AlphaGo的解決方法是使用強(qiáng)化學(xué)習(xí)得到的策略網(wǎng)絡(luò)，以該棋局為起點(diǎn)進(jìn)行大量自我對(duì)弈，并把最終的勝率記錄下來(lái)作為價(jià)值網(wǎng)絡(luò)學(xué)習(xí)的目標(biāo)。

有了價(jià)值網(wǎng)絡(luò)，蒙特卡洛樹搜索也就不再需要一直采樣到對(duì)弈的最后，而是在適當(dāng)?shù)乃阉魃疃韧Ｏ聛?lái)，直接用價(jià)值網(wǎng)絡(luò)估計(jì)當(dāng)前勝率。這樣就通過(guò)降低搜索的深度來(lái)大大減小了運(yùn)算量。

AlphaGo整合了目前機(jī)器學(xué)習(xí)領(lǐng)域的大多數(shù)有效的學(xué)習(xí)模型，包括通過(guò)采樣來(lái)逼近最優(yōu)解的蒙特卡洛樹搜索，通過(guò)有監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)訓(xùn)練來(lái)降低搜索寬度并作出走子決策的策略網(wǎng)絡(luò)，以及通過(guò)有監(jiān)督學(xué)習(xí)訓(xùn)練的降低搜索深度提前判斷勝率的價(jià)值網(wǎng)絡(luò)。

作為人類棋手翹楚，33歲的職業(yè)圍棋九段高手李世石，過(guò)去15年獲得了十幾個(gè)世界冠軍頭銜，總共下了1萬(wàn)盤圍棋對(duì)弈，經(jīng)過(guò)了3萬(wàn)個(gè)小時(shí)訓(xùn)練，每秒可以搜索10個(gè)走子可能。

但是，作為人工智能科技進(jìn)步的代表，吸收了近期機(jī)器學(xué)習(xí)人工智能的最新進(jìn)展，建立起了全新的價(jià)值網(wǎng)絡(luò)和策略網(wǎng)絡(luò)，誕生只有兩年時(shí)間的AlphaGo，差不多經(jīng)歷了3萬(wàn)小時(shí)的訓(xùn)練，每秒?yún)s可以搜索10萬(wàn)個(gè)走子可能。這一刻，勝負(fù)已分。

人工智能的巨頭爭(zhēng)奪戰(zhàn)

在AlphaGo取得巨大成功，獲得全世界廣泛關(guān)注的背后，是谷歌、Facebook、微軟等幾家科技巨頭的競(jìng)爭(zhēng)?；谌斯ぶ悄?，幾大巨頭的都開展了各自的項(xiàng)目研究，以及人才爭(zhēng)奪。

幾天前的智能圍棋大賽上，F(xiàn)acebook派出了自己研發(fā)的“黑暗森林”，獲得了第二名，其主創(chuàng)人員田淵棟正是來(lái)自于谷歌，他曾經(jīng)服務(wù)于谷歌的無(wú)人駕駛汽車項(xiàng)目團(tuán)隊(duì)。

很明顯，黑暗森林現(xiàn)在還不是AlphaGo的對(duì)手。

2014年下半年以及2015年年中，我曾經(jīng)兩次在微軟劍橋研究院實(shí)習(xí)，參與了微軟Xbox音樂(lè)推薦引擎的研究項(xiàng)目，期望通過(guò)基于強(qiáng)化學(xué)習(xí)的人工智能算法來(lái)交互式地為用戶推薦他們喜歡的音樂(lè)并從用戶提供的反饋中進(jìn)一步學(xué)習(xí)。

該項(xiàng)目組直接負(fù)責(zé)人是特拉·格朗普（ThoreGraepel），業(yè)界大名鼎鼎的機(jī)器學(xué)習(xí)專家，又一個(gè)技術(shù)大咖中的圍棋高手。Windows中圍棋游戲里的人工智能就是他負(fù)責(zé)研發(fā)的，與席爾瓦一樣，他也是UCL計(jì)算機(jī)系的兼職教授。

一個(gè)周一的上午，當(dāng)我來(lái)到微軟劍橋辦公室的時(shí)候，一個(gè)同事告訴我，格朗普已經(jīng)離職了，和席爾瓦一樣，加入了DeepMind。他后來(lái)告訴我，他在DeepMind感受到了前所未有的魅力，以致于他很后悔沒(méi)有早一些加入。他感嘆自己從未見(jiàn)過(guò)凝聚力如此之高，目標(biāo)如此統(tǒng)一，而又沒(méi)有任何考核壓力的團(tuán)隊(duì)。

后來(lái)，格朗普的名字也出現(xiàn)在了《Nature》關(guān)于AlphaGo的論文作者名單中，在谷李大戰(zhàn)間隙，他曾經(jīng)與李世石一起接受電視臺(tái)的采訪，熟悉他的人能夠明顯地感受到，他發(fā)自內(nèi)心快樂(lè)。

我在微軟實(shí)習(xí)的另一位導(dǎo)師，是畢業(yè)于劍橋大學(xué)的貝葉斯機(jī)器學(xué)習(xí)方面的專家，他有著扎實(shí)的數(shù)學(xué)功底，在2015年下半年也從微軟離職，加入了劍橋的一家做語(yǔ)音識(shí)別智能系統(tǒng)的初創(chuàng)公司，不久之后該公司即被蘋果公司收購(gòu)。他帶領(lǐng)一個(gè)12人的團(tuán)隊(duì)，負(fù)責(zé)蘋果Siri智能問(wèn)答系統(tǒng)的一項(xiàng)技術(shù)。

就在最近，我在倫敦的酒吧里見(jiàn)到了他，他私下透露，自己正在申請(qǐng)加入DeepMind。他說(shuō)，現(xiàn)在正處在人工智能真正爆發(fā)的歷史轉(zhuǎn)折點(diǎn)，從0到1一般的重大。未來(lái)5到10年人工智能將會(huì)井噴式地發(fā)展，無(wú)論是工業(yè)界還是學(xué)術(shù)界。在這樣一個(gè)時(shí)代，搞人工智能出身的自己難道不想奮力擁抱浪潮么？

在這樣一種情境下，他不甘于在團(tuán)隊(duì)中做管理，他已經(jīng)半年沒(méi)有寫過(guò)一行程序，沒(méi)有推過(guò)一個(gè)數(shù)學(xué)公式了。“今天的人工智能領(lǐng)域就像是一場(chǎng)舉世矚目的英超德比，全世界的人們都為此感到沸騰。而這個(gè)時(shí)候，我們?nèi)斯ぶ悄苎芯繂T就應(yīng)該上場(chǎng)比賽，成為主角，而不是在觀眾席上加油。”

AlphaGo的巨大效應(yīng)讓谷歌吸引人才方面占盡優(yōu)勢(shì)，但是，F(xiàn)acebook、蘋果、微軟也不甘就此授首。

在格朗普從微軟離職之后，一位年輕的女研究員接管了我在微軟的實(shí)習(xí)項(xiàng)目，兩人的研究成果在人工智能會(huì)議AAAI2016上發(fā)表。2015年上半年，她在微軟啟動(dòng)了一個(gè)叫做AIX的人工智能項(xiàng)目，提供了一個(gè)通用人工智能的平臺(tái)，可以使得計(jì)算機(jī)科學(xué)家通過(guò)它編寫智能學(xué)習(xí)程序并在微軟旗下的《我的世界》（Minecraft）游戲世界中測(cè)試。

在AIX里，科學(xué)家并不需要直接編程告訴機(jī)器人如何完成一個(gè)具體的任務(wù)，例如選擇什么樣的路徑攀登上一座山的頂峰，而是把如何學(xué)習(xí)并取得進(jìn)步的程序輸入機(jī)器人，讓它們來(lái)通過(guò)和環(huán)境的交互來(lái)自動(dòng)學(xué)習(xí)到完成任務(wù)的辦法，真正做到“授機(jī)器以漁”。

與谷歌不一樣，微軟延續(xù)了自己慣用的平臺(tái)戰(zhàn)略思路。巨頭之間戰(zhàn)略思路不同，事屬平常，但都非常看好人工智能、機(jī)器學(xué)習(xí)帶來(lái)的戰(zhàn)略機(jī)遇，并同時(shí)開始在人才、技術(shù)、市場(chǎng)方面的布局和競(jìng)爭(zhēng)，也許這場(chǎng)競(jìng)爭(zhēng)會(huì)決定未來(lái)10年幾家巨頭競(jìng)爭(zhēng)的勝負(fù)。（本文獨(dú)家首發(fā)鈦媒體）

【鈦媒體作者：張偉楠，英國(guó)倫敦大學(xué)學(xué)院（UCL）博士候選人，即將受聘于上海交大擔(dān)任助理教授，北京優(yōu)路科技聯(lián)合創(chuàng)始人】

發(fā)表評(píng)論

0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求，請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論

請(qǐng) 登錄后輸入評(píng)論內(nèi)容

zuand
重點(diǎn)已經(jīng)轉(zhuǎn)向?qū)W習(xí)上了，當(dāng)AI能實(shí)現(xiàn)多方面的學(xué)習(xí)將會(huì)更加強(qiáng)大。
回復(fù) 2016.03.29 · via iphone
鈦ALv9TI
真正的一次商業(yè)宣傳，弱智能還在吹，看看自動(dòng)駕駛就行了！
回復(fù) 2016.03.29 · via android
楓林小火山
人類戰(zhàn)勝阿爾法狗的招數(shù)，本人小開腦洞如下： 1 人類應(yīng)該訓(xùn)練一支“拔電源特工隊(duì)”：精通300多種拔電源的技巧，擅長(zhǎng)各種精準(zhǔn)電源拔法、以及各種姿勢(shì)的花式拔法。 2 就圍棋規(guī)則而言，在人機(jī)對(duì)戰(zhàn)中，應(yīng)允許人類將”踹機(jī)箱“、”拍顯示器“等技巧合法代入到”盤外招“中。 3 建議將計(jì)算機(jī)設(shè)置性別，當(dāng)男計(jì)算機(jī)遇到女計(jì)算機(jī)時(shí)，男計(jì)算機(jī)的下部接口處將強(qiáng)力充電，這樣，計(jì)算機(jī)的計(jì)算部分供電不足，計(jì)算能力瞬間滑落。便于人類使用色you。 4 建議為計(jì)算機(jī)開發(fā)“頭疼”、“拉稀”等額外功能。話說(shuō)，表情是怎么發(fā)出來(lái)的啊……
回復(fù) 2016.03.29 · via pc
瘋?cè)嗽?8床
阿爾法狗真正厲害的是學(xué)習(xí)，圍棋厲害的是博弈，這個(gè)是圍棋之所以好玩的地方，博弈根本是謀略，而戰(zhàn)略就是謀略。
回復(fù) 2016.03.29 · via android
　LBZ600
阿爾法狗贏了李世石，不足怪，它還可能贏更多的人，但是，它也只是豐富了囲棋的棋譜，幫助人類了解和掌握更多更精彩的對(duì)弈，從而，也將促使人類智慧開發(fā)不斷向前！
回復(fù) 2016.03.29 · via android

免费看在线a黄视频|99爽99操日韩毛片儿|91停婷在线无码观看|日韩三级片小视频|一级黄片免费播放|欧美成人视频网站导航|亚洲日韩欧美七区|国产视频在线观看91|人成视频免费在线播放|国产精品成人在线免费观看

【獨(dú)家】阿爾法狗將走入人類生活，發(fā)明人首次復(fù)盤人機(jī)大戰(zhàn)

AlphaGo之父十年磨一劍

復(fù)盤谷李大戰(zhàn)

“神之一手”的背后

人工智能已然無(wú)敵？

敬原創(chuàng)，有鈦度，得贊賞

免费看在线a黄视频|99爽99操日韩毛片儿|91停婷在线无码观看|日韩三级片小视频|一级黄片免费播放|欧美成人视频网站导航|亚洲日韩欧美七区|国产视频在线观看91|人成视频免费在线播放|国产精品成人在线免费观看

【獨(dú)家】阿爾法狗將走入人類生活，發(fā)明人首次復(fù)盤人機(jī)大戰(zhàn)

AlphaGo之父十年磨一劍

復(fù)盤谷李大戰(zhàn)

“神之一手”的背后

人工智能已然無(wú)敵？

敬原創(chuàng)，有鈦度，得贊賞

【獨(dú)家】阿爾法狗將走入人類生活，發(fā)明人首次復(fù)盤人機(jī)大戰(zhàn)

人工智能已然無(wú)敵？

敬原創(chuàng)，有鈦度，得贊賞