在鈦媒體Pro專業(yè)用戶和付費用戶專享的“鈦坦白”在線課堂第32期,我們請來了三位鈦客,分享對機器學(xué)習(xí)的思考 。本期鈦客之一、清華大學(xué)交叉信息研究院助理教授、博士生導(dǎo)師、杉數(shù)科技科學(xué)家李建,在主流國際會議及刊物上發(fā)表專業(yè)論文60余篇,并獲得了VLDB 2009 、ESA 2010最佳論文獎。入選清華211基礎(chǔ)研究青年人才支持計劃、教育部新世紀(jì)人才支持計劃。其研究方向主要是算法設(shè)計與分析,機器學(xué)習(xí)與深度學(xué)習(xí),隨機優(yōu)化與組合優(yōu)化。
本文節(jié)選自李建在鈦坦白的分享。如果您還不是鈦媒體Pro用戶,希望查看鈦坦白所有干貨,進入鈦坦白九個專業(yè)群交流,并查看更豐富的專業(yè)數(shù)據(jù)和信息,可點擊:http://m.chcmb.cn/pro 注冊。
以下根據(jù)李建在鈦坦白的分享實錄整理:
大家好,我是李建,目前是清華大學(xué)交叉信息研究院的助理教授、博士生導(dǎo)師,也是杉數(shù)科技的合作科學(xué)家。很高興認(rèn)識大家,并在這里進行分享。
我先做個簡單的個人介紹。我來自于清華大學(xué)交叉信息研究院,因為我們院是2011年成立的,時間還比較短,可能有些朋友不是很了解。我們院是姚期智院士建立的,姚其智院士是我國唯一的圖靈獎獲得者,圖靈獎是計算機科學(xué)的最高獎。他在2005年從普林斯頓大學(xué)辭去職位,回國全職到清華創(chuàng)立姚班,也就是我們叉院的本科生班,也被稱為清華大學(xué)計算機科學(xué)實驗班。大家以后可能會常遇到叉院、姚班的同學(xué)、老師,希望多多關(guān)照。
我合作的杉數(shù)科技,是由斯坦福大學(xué)教授葉蔭宇老師和斯坦福大學(xué)幾位博士羅小渠、葛東東,王子卓聯(lián)合創(chuàng)辦的。葉教授是馮諾伊曼獎的得主,馮諾伊曼獎是運籌管理學(xué)里面最高獎。杉數(shù)科技主要為企業(yè)提供大數(shù)據(jù)的解決方案,包括為企業(yè)提供優(yōu)化和機器學(xué)習(xí)的算法引擎,供應(yīng)鏈優(yōu)化,金融方面的比如說風(fēng)險管理、收益管理,還有定價的一些問題。在算法引擎上,杉數(shù)可以幫企業(yè)搭建機器學(xué)習(xí)解決方案,他們開發(fā)的機器學(xué)習(xí)引擎優(yōu)化算法在單機版上比目前市面上開源的軟件能快幾十倍。
我個人的研究方向是理論計算機科學(xué),主要是算法設(shè)計,最近幾年我也做了一些機器學(xué)習(xí)和深度學(xué)習(xí)方面的工作。一會兒給大家分享一下我們在深度學(xué)習(xí)應(yīng)用在時空大數(shù)據(jù)分析方面的一些研究工作,和我個人的一些想法和體會。
什么是時空大數(shù)據(jù)?
相信大家已經(jīng)被深度學(xué)習(xí)刷屏了,它已經(jīng)在比如圖象識別、語音識別、圍棋、撲克……很多領(lǐng)域取得了巨大的成功,引起了多個領(lǐng)域革命性的變化。我今天要講的跟以上所列都不同,將把重點放在時空大數(shù)據(jù)分析。
什么是時空大數(shù)據(jù)呢?大家請看下面這張圖。時空大數(shù)據(jù)有很多的種類,比如說GPS的定位數(shù)據(jù),比如說網(wǎng)約車 ——滴滴、Uber的訂單的數(shù)據(jù),社會網(wǎng)絡(luò)上的數(shù)據(jù),更宏觀的國民經(jīng)濟的數(shù)據(jù),比如人口密度、人口遷徙的數(shù)據(jù)。這些數(shù)據(jù)的共同特點是它既有時間的屬性也有空間的屬性。
我們可以考慮有多個時間序列,其中每個時間序列是由一個不同的空間產(chǎn)生的。每個時間序列自身有時間上的依賴關(guān)聯(lián),而這些時間序列之間也有空間的一些關(guān)聯(lián)。時空大數(shù)據(jù)的空間上的關(guān)聯(lián),跟圖像上的空間關(guān)聯(lián)有些相似,但也有很多不同,后者的關(guān)聯(lián)是非常均勻的,或者說具有平移不變性,比如說一只狗的圖像,在這里放是一只狗的圖像,平移一下他還是那一只狗的圖像。對于時空大數(shù)據(jù)就不一樣了,比如北京的一條路和天津的一條路,甚至二環(huán)上的一條路和三環(huán)上的一條路表現(xiàn)可能是完全不一樣的,這里面還有許多其他的因素在影響。比如說交通,影響交通的有天氣,有PM2.5,有節(jié)假日,有其他特殊事件……這些都可能影響我們做預(yù)測。多種影響因素導(dǎo)致數(shù)據(jù)源可能也有很多,如何整合這些數(shù)據(jù)源也是一個很大的挑戰(zhàn)。另外一個不同點是,時空大數(shù)據(jù)有可能噪音非常大。
因為有很多不同的影響因素,所以對一些問題,即使人也很難做出判斷,這和我們看到的圖像分類、機器翻譯很不同,因為對這些問題我們至少人可以把它做得比較好,對于時空大數(shù)據(jù)的預(yù)測問題是人都很難進行判斷的,反而是機器學(xué)習(xí)能夠做得更好一點。
應(yīng)用深度學(xué)習(xí)進行時空大數(shù)據(jù)挖掘,第一個挑戰(zhàn)就是如何抓住時空的關(guān)聯(lián)性。這里面涉及到幾個問題:第一,你用什么樣的學(xué)習(xí)框架,監(jiān)督學(xué)習(xí)還是非監(jiān)督學(xué)習(xí),還有多任務(wù)學(xué)習(xí)、在線學(xué)習(xí)、增強學(xué)習(xí)……很多種方法,你用哪一種框架。這里并沒有一個很成熟的做法,比如圖像就用CNN;第二,你想用深度學(xué)習(xí),什么樣的網(wǎng)絡(luò)結(jié)構(gòu)比較好;第三,我剛才說了有很多的數(shù)據(jù)源,不同的數(shù)據(jù)源會產(chǎn)生不同的因子,我們?nèi)绾螛?gòu)造一個網(wǎng)絡(luò),能夠?qū)⑦@些不同質(zhì)的因子綜合起來,并且希望這個網(wǎng)絡(luò)能夠易于拓展,易于應(yīng)用;第四,我們可能還要處理一些噪音很大,或者說數(shù)據(jù)缺失的問題。
深度學(xué)習(xí)在時空大數(shù)據(jù)的四個經(jīng)典應(yīng)用
- 網(wǎng)約車供需的預(yù)測
任務(wù):一個區(qū)域在未來一段時間,有多少個網(wǎng)約車叫車訂單將不會被滿足?
我們這個工作實際上是基于前一段時間滴滴公司的一個大數(shù)據(jù)競賽。滴滴公司提供了一個月某個城市所有訂單的資料,以及其他的一些比如說天氣、PM2.5,還有一些路況的信息。具體的任務(wù)是,在他給定的幾個區(qū)域內(nèi),對每個區(qū)域,你去預(yù)測未來15分鐘有多少個訂單將不會被滿足,也就是說需求減去供給。
這個問題對于滴滴來說很重要,因為如果一個地方有很多訂單沒有被滿足的話,他可能事先去調(diào)派一些出租車,使得供需達到平衡。另外對他們定價也有很重要的作用。這樣的問題就是一個典型的時空大數(shù)據(jù)的預(yù)測問題。這個訂單既有時間的屬性,也有空間的屬性,另外還有其他許多因素。這個問題并不簡單,有很多數(shù)據(jù)源,有些數(shù)據(jù)源數(shù)據(jù)缺失也比較嚴(yán)重。
這里面我們發(fā)現(xiàn)有很多挑戰(zhàn),比如下面這張圖中,這兩個不同的位置的需求模式是非常不一樣的。而且,有一些突發(fā)的事件,像需求突然增大,想抓住這種突然增大的趨勢,也是有一定難度的。
傳統(tǒng)的方法,比較常用的有線性回歸、邏輯回歸、支持向量級、gradient boosting、隨機森林等,這些方法在實際應(yīng)用想要達到比較好的效果,一個很重要的工作就是要做很大量的特征工程,就是挖掘很多有預(yù)測能力的特征,有時甚至是很奇怪的特征,這些特征是可能對預(yù)測有幫助的因子。想達到一個非常有競爭力的效果,通常需要做很多很多這樣不同的因子,而且有些因子實際上看起來并沒有什么道理,或者講不清楚有什么道理,但有時也有一定效果。一般來說參加這種機器學(xué)習(xí)比賽的隊伍大多用gradient boosting的方法,很多隊伍都做了大量人工的因子,有的甚至都做了幾百個因子。我們用深度學(xué)習(xí)的初衷,就是它有自己提取特征的能力,我們希望減小特征工程的人工的工作量,希望是只做一些基本的特征工程,也能達到一個非常有競爭力的預(yù)測的準(zhǔn)確度。
同時我們也希望做一個比較易用的框架,使得我們比較容易的將不同類型的數(shù)據(jù)整合起來,比如說訂單數(shù)據(jù)、日期數(shù)據(jù)、位置數(shù)據(jù)、天氣等數(shù)據(jù),都是不同質(zhì)的,有些是數(shù)值型的,有些是種類,應(yīng)該有一個方法,把它們的信息非常容易的都綜合在一起。此外,每個數(shù)據(jù)源里面不同的數(shù)據(jù)有不同的預(yù)測能力,你得把里面的信息都抽取出來。再者,這些模塊也希望比較靈活的,你可以往里添加模塊,也就是添加數(shù)據(jù)源,有時有些信息可能是冗余信息,它并沒有提供新的預(yù)測能力,即使添加了這個模塊,也不會增加你的準(zhǔn)確度,但是你也希望它不會影響降低準(zhǔn)確度。
下面這張圖,就是我們后面做的深度學(xué)習(xí)的一個大的網(wǎng)絡(luò)框架的示意圖。大家可以看到,我們有幾個大的模塊,每一個模塊處理不同類型的數(shù)據(jù)。order part就是處理訂單數(shù)據(jù),Environment part處理環(huán)境信息,如路況、天氣等,還有Identify part就是處理時間,位置的ID就是我們要預(yù)測的時間和地點。我們最后是得到了一個端到端的一個模型,就是說我們能夠直接將這些原始數(shù)據(jù)做簡單的處理統(tǒng)計,然后就可以輸入到這個網(wǎng)絡(luò)里,然后這個網(wǎng)絡(luò)就會從不同的數(shù)據(jù)源里抓取有預(yù)測能力的信息,最后給出比較準(zhǔn)確的預(yù)測。
我們這里面用了一個小技巧,就是在不同模塊之間用了一個residual link,就是殘差的連接,這個連接是由深度殘差網(wǎng)絡(luò)這個工作啟發(fā)得到的,深度殘差網(wǎng)絡(luò)在鈦坦白昨天的分享中秦濤博士也提到了(相關(guān)文章:http://m.chcmb.cn/2578654.html),是微軟亞洲研究院做的一個很有名的工作,他們用這種殘差的連接可以訓(xùn)練幾百甚至上千層深度學(xué)習(xí)的網(wǎng)絡(luò)。我們這里面的殘差鏈接是從他們的工作受啟發(fā),但是我們的目的有所不同,一是為了方便優(yōu)化,這是跟他們一樣的。但另外一點,我們是希望能夠使這些模塊更容易的進行添加和刪除。比如說你現(xiàn)在添加一個模塊你直接加進來,比如里面有一個模塊沒有什么有預(yù)測能力的信息,實際上等價于一個權(quán)重為零的層,相當(dāng)于信息直接從這個模塊跳過去了,也不影響你的預(yù)測能力。
我們每個模塊有不同的設(shè)計方法,下面這張圖是我們訂單數(shù)據(jù)的一個大致的結(jié)構(gòu)。我們希望對比較典型的幾個不同數(shù)據(jù)類型,設(shè)計比較通用和易用的幾個網(wǎng)絡(luò)結(jié)構(gòu)來處理這些數(shù)據(jù)。
另外,在實際案例中,周一的訂單和周二的訂單、周日的訂單的模式可能是完全不同的。一種方法是把周一的數(shù)據(jù)拿過來訓(xùn)練一個模型,對周二數(shù)據(jù)拿過來訓(xùn)練一個模型,我們的做法是,把他們都加在一起進行訓(xùn)練,但是給他們每一天有一個不同的權(quán)重,這個網(wǎng)絡(luò)會自動的把這些權(quán)重學(xué)出來。
下面這張圖就是我們神經(jīng)網(wǎng)絡(luò)的預(yù)測效果,跟其他傳統(tǒng)方法進行了比較,我們用的一樣的特征。我們網(wǎng)絡(luò)的一個前期的版本參加了滴滴的預(yù)測大賽,一共有1600多個隊伍參加,我們獲得了第二名。而且據(jù)我們所知,在前十名隊伍里面只有我們一個隊伍是用的深度學(xué)習(xí)的方法。所以說在時空大數(shù)據(jù)預(yù)測方面,深度學(xué)習(xí)還是有很潛力的。在比賽以后,我們又把這個網(wǎng)絡(luò)的模塊化、易用性、準(zhǔn)確度做了進一步的提升。
下面這張圖顯示的是供給減去需求的曲線,大家可以看到,有很多突然出現(xiàn)的波峰,表示一個突發(fā)的打車高峰,比如說一個突發(fā)的事件來了,突然這個地方有很多打車的人,結(jié)果沒有打到,就會有一個峰值。虛線是真實的值,藍線是我們的預(yù)測,紅線是大家常用的gradient boosting的方法預(yù)測的值。大家可以看到,神經(jīng)網(wǎng)絡(luò)抓這種峰值的能力還是比較強的。
同時我們認(rèn)為,這個技術(shù)還可以應(yīng)用到其他的供需、流量預(yù)測的這類問題上。杉數(shù)科技目前正在幫助國內(nèi)某大型物流公司解決供應(yīng)鏈問題,流量預(yù)測也是其中的一個很重要的環(huán)節(jié),我作為杉數(shù)的合作科學(xué)家也在一起幫助解決這樣的一個問題。深度學(xué)習(xí)是我們認(rèn)為解決這個問題的一個非常好的解決方案。
- 出行時間的預(yù)測
任務(wù):對給定的路徑和出發(fā)時間,預(yù)估到達終點所用的時間
這個任務(wù)具體是,你給定一個點作為起點,給定另外一個點作為終點,給出你起始的時間,我們要預(yù)測你走這條路需要花多少時間。實際上目前比如說百度地圖、滴滴這些應(yīng)用上都有這樣的功能?,F(xiàn)在出行時間的預(yù)測是根據(jù)當(dāng)時的路況,但是假如我們從清華到朝陽的某個地方,路線比較長,可能當(dāng)時某一段路是比較堵的,但我們開到那邊其實已經(jīng)不堵了,實際上我們實際的出行時間就比當(dāng)時的預(yù)測要短。所以我們考慮用機器學(xué)習(xí)的方法來進行預(yù)測,而不是只用當(dāng)時的路況進行預(yù)測。
前段時間有個數(shù)據(jù)城堡大數(shù)據(jù)預(yù)測比賽。在這個比賽里面,數(shù)據(jù)和前面的供需預(yù)測有很多相似的地方,但有一點重要的不同,就是要考慮軌跡的數(shù)據(jù)。也就是訓(xùn)練數(shù)據(jù)包含很多歷史上開車的軌跡,這些軌跡都是GPS點,這些點上有時間的屬性和空間的屬性。
下面這張圖是我們的大致的網(wǎng)絡(luò)結(jié)構(gòu)。這個結(jié)構(gòu)跟我們前面的有些相似,也是模塊化的,就是每種不同類的數(shù)據(jù)我們有一個模塊去處理它。這里一個重要的不同就是有一個處理軌跡數(shù)據(jù)的新的模塊(在圖右上角),我們應(yīng)用的是兩層的LSTM結(jié)構(gòu),還有一些其他的技巧,比如說剛才提到的殘差網(wǎng)絡(luò)連接的這樣一些技巧來連接模塊。
下面這張圖,就是我們深度神經(jīng)網(wǎng)絡(luò)的預(yù)測效果,最后我們這個比賽是拿到了第三名。雖然不是第一,但是我們認(rèn)為達到了預(yù)期的效果。首先我們并沒有花很多精力去做特征工程,這是跟其他隊伍非常不一樣的。另外我認(rèn)為我們這種模塊化設(shè)計是比較通用的。另外我們的準(zhǔn)確率也很有競爭力,前幾名的的準(zhǔn)確率都是非常非常接近的。
- 商店選址
任務(wù):預(yù)測在什么地方開店比較好
這個項目我們沒有用到深度學(xué)習(xí),但這是一個應(yīng)用時空大數(shù)據(jù)比較好的例子。這是我們跟百度的大數(shù)據(jù)研究院合作的一個項目,應(yīng)用了百度移動端的數(shù)據(jù)還有百度糯米、百度地圖的一些數(shù)據(jù)。我們主要的目的是商店選址。比如說你想開一個咖啡店,我們來幫助你選擇在什么地方開店比較好。
我們基于的思想,大致就是首先來預(yù)測這些不同地點的供給以及需求。這個需求是可以通過比如百度的數(shù)據(jù)得到的,比如說你在某一個地方搜了一下星巴克,意味著很大可能這有一個需求。供給就是已經(jīng)開的店,這些店形成了一種競爭,可能已經(jīng)能夠提供一些服務(wù)滿足一些需求了。我們想找的就是供需差別最大的,哪些地方我有很大的需求,但是供給仍然不足。
我們的工作主要分四步:
- 通過百度的數(shù)據(jù)預(yù)測供給;
- 找出已經(jīng)有的店,然后計算出一個競爭的模型,就是每個地方你會有多少相似的店跟你競爭,然后這些店已經(jīng)能夠吸收多少需求;
- 找出這種供給和需求差比較大的一些這些地點,然后進行聚類,找出聚類的中心;
- 實際的進行選址。
我們做完這個項目做了一些實地的調(diào)研。下面這張圖,我們預(yù)測了一個地點適合開海底撈,其實在我們做這個工作前面兩個月就開了一家店海底撈,距離我們預(yù)測的地點非常近:
下面這張圖是星巴克的例子。實際新開的點距離我們預(yù)測的地方只差200米:
- 預(yù)測到訪
任務(wù):在一個地點,會進哪家店
我們有用戶移動端的很多GPS數(shù)據(jù),也有一些到店登錄Wifi的數(shù)據(jù),還有百度糯米的其他類相關(guān)的數(shù)據(jù),我們目的是給定他當(dāng)前的地點,我們想去預(yù)測他實際上是去了哪個店。
這件事情你可能認(rèn)為挺簡單,已經(jīng)知道了地點你還不知道去了哪個店,但是實際上并不是那么簡單,比如說你去了大悅城,里面有很多家店。你只知道一個大致的GPS地址,這個該怎么預(yù)測?我們預(yù)測的依據(jù)實際上是這個用戶的歷史信息,這個用戶可能歷史上去過某些店,將來很可能也去一些相似的店,另外有些相關(guān)性,比如說某些用戶和某些用戶的軌跡非常相似,有相關(guān)性,這種信息也會幫助我們進行預(yù)測。
這個預(yù)測我們也是用的深度神經(jīng)網(wǎng)絡(luò),我們應(yīng)用了跟前面很相似的處理軌跡信息的模塊,最后也達到了比較好的效果。下面這張圖就是我們這個方法預(yù)測的準(zhǔn)確率,三就代表我們預(yù)測三個里面有多少準(zhǔn)確的。預(yù)測一個基本上可以做到50%左右的準(zhǔn)確率,如果預(yù)測5個就比較高,就可以做到80%的準(zhǔn)確率。
時空大數(shù)據(jù)的其他一些研究方向
我下面簡單談一下其他相關(guān)的問題,和我們計劃下一步做的一些東西,不一定是深度學(xué)習(xí)。其中一個就是在線學(xué)習(xí)和增強學(xué)習(xí)。我剛才說的都是用時空大數(shù)據(jù)來做分析和預(yù)測,在現(xiàn)實應(yīng)用中,預(yù)測只是幫助我們來進行決策?,F(xiàn)在一般的方法是將預(yù)測和決策進行分離。我們先進行預(yù)測,然后再進行決策。決策往往是一個優(yōu)化問題。
但是我們現(xiàn)在想利用在線學(xué)習(xí)和增強學(xué)習(xí)這些強大的工具,將預(yù)測和決策這兩個東西結(jié)合起來。另外在線學(xué)習(xí)能夠得到這個預(yù)測和決策的關(guān)系。一般說來,我們當(dāng)然預(yù)測的越準(zhǔn)確越好。但實際上有時候不需要預(yù)測到多準(zhǔn)確,或者只對問題的某個方面而不是全部有好的預(yù)測,就已經(jīng)可以做很好的決策了。
在在線學(xué)習(xí)里面有一個很著名的問題叫專家問題,就是說假設(shè)一個游戲有T輪,有N個不同的專家,每個專家在每一輪都會給我們一些不同的建議,我們每一輪要決定聽哪個專家的。但是在那個專家做建議的時候我們實際上不知道他這個建議好還是差的。我們只知道以前這個專家做的建議都是好還是不好。在線學(xué)習(xí)會告訴我們每輪去聽哪個專家的建議。最后我們想達到一個什么效果呢?我們可以達到在整個T輪中,我們的表現(xiàn)可以和最好的那個專家差不多。
專家問題有一個變種,就是下面這張圖片。這個圖片上面的人物是一個非常著名的信息論學(xué)家,他叫Thomas Cover,前幾年過世了。他有一篇很著名的文章叫《Universal Portfolios》,可能翻譯成普遍投資組合。這個是個什么問題呢?實際上跟專家問題非常相關(guān)的,他實際上考慮的是一個大家更感興趣的問題就是股票的投資組合,就是說我現(xiàn)在假設(shè)有N個股票,我怎么樣來進行投資,在這個股票中分散我的投資。目標(biāo)是使得我最后的效果跟最好的那個股票比都不差。
Thomas Cover用的是很巧妙的乘法權(quán)重調(diào)整的方法,然后在不同股票數(shù)據(jù)中間做投資組合。實際上,不同股票數(shù)據(jù)也可以被認(rèn)為是一種時空大數(shù)據(jù),就是我們每個股票是個時間序列,不同股票之間也有一個空間上的相關(guān)性,比如說相同板塊的股票表現(xiàn)有一定的相似性,不同板塊獨立性就比較強,這個是空間關(guān)聯(lián)性。Thomas Cover就為我們預(yù)測加決策的這個在線學(xué)習(xí)方法提供了一個很好的基礎(chǔ)。在當(dāng)時,Thomas Cover因為這個算法非常興奮,就根據(jù)他的算法去開了一個對沖基金,好像效果還是不錯的。
在線學(xué)習(xí)還有一個很著名的問題叫多臂老虎機問題。假設(shè)我們有N個不同的老虎機,每個老虎機實際上是有一個獎勵的概率分布。你可以把它想成一個隨機變量,你每拉一次老虎機,相當(dāng)于從隨機變量中取一個樣本。你是希望找到最好的老虎機,也就是平均獎勵最高的老虎機,這個實際上就是一個學(xué)習(xí)和決策結(jié)合的這樣一個過程。事先我們并不知道這些老虎機的概率分布,我們需要學(xué)習(xí),但最后我們需要決策把最好的老虎機找出來。
多臂老虎機問題的算法告訴我們一件什么事情呢?就是說我們實際上并不需要都把所有的老虎機都學(xué)習(xí)得很好,我們不需要對所有老虎機的估計準(zhǔn)確率都很高,我們只需要對比較好的老虎機的準(zhǔn)確率比較高就可以,就可以做很好的決策了,而那些比較差的我們不需要學(xué)習(xí)到多好。那么這個多臂老虎機問題也是控制優(yōu)化,在線學(xué)習(xí)里面一個很經(jīng)典的問題,也有很多很多的應(yīng)用,我認(rèn)為也是我們做時空數(shù)據(jù)學(xué)習(xí)加決策的這樣一個很好的框架。
另外一個我認(rèn)為比較有意義的時空大數(shù)據(jù)的研究方向就是生成模型。比如說我們?nèi)绾翁摂M的生成訂單數(shù)據(jù),或者我們虛擬生成交通流量,或者虛擬市場交易數(shù)據(jù)。那么有了這個生成模型,我們才能說我們完全理解了這個模型。一方面生成模型能幫助我們理解,另一方面我們?nèi)绻辛松赡P?,我們就能夠用它來模擬新的環(huán)境。另外能用它來生成新的數(shù)據(jù),來進行訓(xùn)練,就相當(dāng)于是增多了我們的訓(xùn)練數(shù)據(jù),也可以用來測試新的場景。有很多傳統(tǒng)的時間序列和空間計量經(jīng)濟的模型,比如說時間序列模型,大家可能知道線性的ARMA模型還有GARCH模型,比如還有一些隨機過程,比如說空間點過程模型,但是這些模型都是相對簡單,可能很難抓住一個實際復(fù)雜的有很多因素決定的過程,其中有很多非線性的特征和細節(jié)。我們可能需要利用深度學(xué)習(xí)生成模型去抓住這種復(fù)雜的過程。比如說用深度學(xué)習(xí)里的authencoder,比如說更新的對抗生成網(wǎng)絡(luò)這樣一些生成模型。
(本文獨家首發(fā)鈦媒體,根據(jù)清華大學(xué)交叉信息研究院助理教授、博士生導(dǎo)師、杉數(shù)科技科學(xué)家李建在鈦坦白上的分享整理)
……………………………………
鈦坦白第32期,AI已來之機器學(xué)習(xí)1,三晚上的分享已經(jīng)結(jié)束了
干貨會陸續(xù)發(fā)布:http://m.chcmb.cn/tag/1508094
鈦坦白第33期預(yù)告:AI已來之機器學(xué)習(xí)2
來自百度、第四范式、地平線機器人的鈦客,繼續(xù)就“機器學(xué)習(xí)”帶來精彩分享~
時間:3月20日、21日、22日
地點:鈦坦白|人工智能(微信群)
報名聽課、交流:
鈦坦白目前有醫(yī)療健康、人工智能、文娛社交、VR/AR、區(qū)塊鏈、支付創(chuàng)新、體育、云計算、SaaS等九個專業(yè)群。
1、鈦媒體Pro專業(yè)版用戶,可以點擊鏈接http://m.chcmb.cn/pro,登錄賬號,在線免費、任意選擇自己要進入的群,按提示操作;
2、非鈦媒體Pro專業(yè)版用戶,可以添加微信號taitanbai0,在通過好友后,發(fā)99元紅包給小鈦,你將有權(quán)利從九個群中任選一個群進入,長期聽課、交流。請告訴小鈦你要進入哪一個群,然后等待小鈦拉你入群~
推薦鈦客、贊助、合作:
請與鈦坦白負責(zé)人佳音聯(lián)系,郵箱jiayinge@tmtpost.com






快報
根據(jù)《網(wǎng)絡(luò)安全法》實名制要求,請綁定手機號后發(fā)表評論
您好,我是超圖軟件新媒體的負責(zé)人,想和您申請本篇文章的授權(quán),不知是否可以,盼您回復(fù),非常感謝!
好多資料呀,果然是高端科技技術(shù),雖然看不懂,但感覺出來,人工智能需要解決的問題還有很多,但如果真的解決了,影響將是極大的,特別是現(xiàn)在很火的語音交互,說不定以這個為入口,打造不一樣的智能商店,有可能用現(xiàn)在靈犀語音助手,siri這樣的軟件就能操控一切。