美國紐約大學助理教授陳溪

葉蔭宇曾獲得美國運籌與管理學會馮諾依曼理論獎(運籌管理學界最高獎),也是迄今為止華人唯一獲獎者,2014年美國應用數(shù)學學會優(yōu)化大獎(每三年評一人)、2012年國際數(shù)學規(guī)劃大會Tseng Lectureship獎(每三年評一人),曾主持和參與美國波音、FICO、運通、美國衛(wèi)生部、美國科學基金、美國能源部以及美國空軍科研部門等多個科研項目。

1982年葉蔭宇赴美深造,當時人工智能經(jīng)歷了一小波高潮后,由于沒有大數(shù)據(jù)等現(xiàn)代技術的支撐,理論研究與商業(yè)應用都處于停滯狀態(tài),但運籌學則在各行各業(yè)方興未艾,從市場營銷、生產(chǎn)計劃、庫存管理、物流運輸、財政會計到人事管理、設備維修、工程最優(yōu)化、計算機與通信系統(tǒng)以及城市管理等都有廣泛的應用。

隨著計算機技術高速發(fā)展,要解決的問題規(guī)模不斷增大,運籌學的應用范圍也取得革命性的突破。大量算法、軟件產(chǎn)生,大數(shù)據(jù)時代給運籌學進一步帶來了生機——如何將大數(shù)據(jù)轉化為最優(yōu)決策成為運籌學重點的課題。美國紐約大學助理教授、博士后師從機器學習之父Michael I Jordan(螞蟻金服智囊團主席)的陳溪也認為,大數(shù)據(jù)的出現(xiàn)推動了機器學習、大規(guī)模統(tǒng)計推斷與運籌學算法三大領域齊頭并進,由此形成了大數(shù)據(jù)驅動下的商業(yè)決策。

葉蔭宇介紹了大數(shù)據(jù)驅動下的商業(yè)決策的三個階段:基于數(shù)據(jù)收集與管理的描述型(Descriptive)決策,數(shù)據(jù)成為大數(shù)據(jù)時代商業(yè)決策的基礎和公司發(fā)展的“原燃料”,通常由計算機和信息科學技術完成;基于規(guī)律性分析的預測型(Predictive)決策,從大數(shù)據(jù)中提取信息,獲得事物背后的規(guī)律,通常由統(tǒng)計和機器學習技術完成;但僅僅對數(shù)據(jù)的管理與規(guī)律性分析并不能釋放數(shù)據(jù)的巨大價值,必須真正提升決策質量、從海量數(shù)據(jù)中發(fā)掘出規(guī)律,才能讓大數(shù)據(jù)產(chǎn)生實質性價值,這就是基于決策建模與求解的處方型(Prescriptive)決策。

運籌學將實際中決策問題轉化為數(shù)學模型,用高效的優(yōu)化算法求解,運用系統(tǒng)科學和優(yōu)化算法獲得最佳決策及戰(zhàn)略,并實現(xiàn)決策的自動化、流程化、規(guī)范化。在美國和歐洲,已經(jīng)實現(xiàn)了運籌學算法的軟件化與工具化。例如,在投資組合優(yōu)化及相關決策領域,就有Barra、Axioma、ITG、Mosek等知名軟件,其中Mosek大規(guī)模數(shù)據(jù)優(yōu)化軟件是歐洲第一大優(yōu)化軟件,葉蔭宇教授同時擔任該公司科技顧問委員會主席、創(chuàng)始人也是在葉蔭宇的指導下對優(yōu)化算法有了深入了解,并創(chuàng)立了該公司,目前華爾街進行風險控制的軟件求解器有很多都使用Mosek軟件。

葉蔭宇認為,高頻交易的競賽就是算法速度的競賽。如果一家軟件的模型求解速度需要10秒鐘,而其它家軟件的速度為0.04秒,那么誰掌握了0.04秒求解軟件的源代碼誰就有核心競爭力,而從10秒到0.04秒就是算法的力量。

前不久的美聯(lián)航事件,是典型的不確定環(huán)境中庫存管理決策問題。航空公司機票超售是因為總有5%到10%的乘客因為各種原因不登機,而航空公司在不確定的條件下到底要超售多少張機票以彌補損失,當出現(xiàn)超售后有人不愿意下機的情況下,該如何鼓勵乘客改乘下一班飛機,這都是運籌優(yōu)化算法的范圍。在不確定和測不準的隨機或復雜環(huán)境下的困難決策,也是人工智能和機器學習算法的薄弱之處。

數(shù)據(jù)驅動商業(yè)場景中的決策優(yōu)化

美國明尼蘇達大學助理教授、杉數(shù)科技CTO王子卓

Mosek公司成立于1997年,迄今已經(jīng)有20年的歷史。而國內近年來在人工智能的產(chǎn)業(yè)化和商業(yè)化方面取得了一些進展,但優(yōu)化算法是整個人工智能推進中不可缺失的一環(huán),在國內卻處于相對弱勢情況。此外,即便是機器學習和深度學習的底層算法開源求解器,在國內也尚未見到。

2016年中,幾位來自斯坦福運籌學領域的教授和博士,從斯坦福校徽的“杉”和大數(shù)據(jù)的“數(shù)”取名,創(chuàng)立了杉數(shù)科技,開始致力于在中國推廣運籌學的商業(yè)應用以及開發(fā)機器學習和深度學習的底層求解算法。杉數(shù)科技目前已經(jīng)有了京東等大企業(yè)客戶,2016年7月獲得了來自真格基金和北極光創(chuàng)投的210萬美元天使輪融資。

美國明尼蘇達大學助理教授、杉數(shù)科技CTO王子卓,曾獲美國運籌管理學會收益管理分會2015年最佳實際應用獎提名,參與過美國運通、華為、IBM、希捷等項目,其中為IBM定制的定價策略系統(tǒng)獲美國兩項專利,為IBM創(chuàng)造過巨額的利潤。

王子卓介紹了互聯(lián)網(wǎng)時代由大數(shù)據(jù)驅動的定價策略,他認為好的定價策略是企業(yè)的“生命線”,特別是互聯(lián)網(wǎng)商業(yè)模式下的實時定價更決定了酒店、零售、航空、租車等行業(yè)和企業(yè)的生死存亡以及能否獲得更大的發(fā)展。

那么電商等實時企業(yè)如何更好的獲得“生命線”,如何制定自己的定價策略?首先這就需要了解消費者的構成、偏好以及消費行為等大數(shù)據(jù),其次在獲得了消費者或消費者群體大數(shù)據(jù)的前提下,做出價格、時間、地點等銷售決策。所以數(shù)據(jù)驅動的定價策略就是在正確的時間和正確的地點,以正確的價格為正確的客戶提供正確的產(chǎn)品與服務。

現(xiàn)在,杉數(shù)科技智能決策提供一套基于數(shù)據(jù)的完整定價解決方案,包括目標場景、底層模型、優(yōu)化策略、高效算法、信息回收、模型迭代等環(huán)節(jié)。其中,在構造和選擇底層模型的時候,由于消費者在面臨多個選擇、不同價格、不同質量等信息時會改變購買行為,雖然有時候會出現(xiàn)不理性行為但依然可以從大數(shù)據(jù)分析中得出規(guī)律,隨后通過非線性、離散、高維與動態(tài)算法等建立定價決策模型,再設計獨特高效算法得到精確最優(yōu)解/高質量近似解,采用并行計算架構就可以同時對大規(guī)模多SKU 問題有效求解,最終實現(xiàn)在線獲得最優(yōu)解、滿足實時性要求。當然,價格計算不是一勞永逸,市場在變化、環(huán)境在變化、價格也在變化,動態(tài)調價已經(jīng)成為很多行業(yè)的趨勢,也就是在線學習消費者購買行為后不斷更新算法模型。

杉數(shù)科技創(chuàng)始團隊自2016年以來,利用自己在定價方面的獨特積累和技術,已經(jīng)為國內多個行業(yè)的龍頭企業(yè),包括電商、物流、出行等,提供了收益管理方向的精確量化軟件開發(fā)和咨詢服務,合同額達到了近2000萬。

陳溪進一步介紹了在線學習與在線決策的聯(lián)動影響與決策算法。在線學習與在線決策聯(lián)動,有兩個基本的選擇:一是通過最少的嘗試以獲得對象的最大化信息(Exploration,勘探);二是在已獲得信息的基礎上做出最佳決策以最大化收益(Exploitation,收獲)。一個經(jīng)典的例子就是多臂老虎機問題(Multi-Armed Bandit Problem,MAB):不同老虎機的收益都是隨機的,有的隨機收益低、有的隨機收益高、有的能出現(xiàn)高額隨機收益,那么如何通過最少次數(shù)的嘗試盡量多地獲得每臺老虎機的收益水平,從而優(yōu)化拉老虎機的策略?2014年,王子卓、葉蔭宇等人的一篇學術論文討論了用于單一產(chǎn)品收益最大化管理的MAB算法。

多臂老虎機MAB算法有著廣泛的商業(yè)用途,比如電商可以把該算法用于某個產(chǎn)品消費群體的認知和開發(fā)。陳溪在2016年參與的一篇“電商個性化收益管理的統(tǒng)計學習算法”中就探討了杉數(shù)科技為唯品會開發(fā)的算法。當時在美國,某電商每個月甚至每兩個禮拜,就定期給女性顧客寄一個內有5件衣服的盒子,顧客可以選擇一件付款再把剩下的退回,如果5件衣服都不喜歡就會象征性收取郵費。以此來探知女性消費者的消費行為數(shù)據(jù),并用于相關算法的開發(fā)。

陳溪強調,由于現(xiàn)實中的商業(yè)環(huán)境極為復雜,因此需要機器學習、統(tǒng)計分析和運籌優(yōu)化的共同作用,才能做出最優(yōu)化的商業(yè)決策。

清華大學交叉信息研究院助理教授、杉數(shù)科學家李建

清華大學交叉信息研究院助理教授、杉數(shù)科學家李建介紹了基于時空大數(shù)據(jù)的機器學習算法,所謂時空大數(shù)據(jù)中是生產(chǎn)生活中帶有時間軸的地理大數(shù)據(jù)。李建表示,隨著社會發(fā)展、企業(yè)運營、工業(yè)生產(chǎn)朝著精細化運作的方向發(fā)展,對于生產(chǎn)中一些關鍵性時空屬性的預測和控制就顯得越發(fā)重要。

時空大數(shù)據(jù)有著廣泛的應用,例如:對于交通路況的預測,可以幫助交通部門調整和優(yōu)化交通指揮和布局;對于給定路徑的出行時間預測,可以幫助人們更好的規(guī)劃行程;對于在線租車來說,準確預測未來一段時間內的訂單量和區(qū)域分布,可以幫助公司更好的進行車輛調度,從而提高車輛共享效率; 對于物流公司而言,對各網(wǎng)點收發(fā)貨量的良好預測,可以幫助公司提前進行運力、人力等資源的調度,從而提高物流效率,增加收益;無人駕駛對周圍障礙物運動位置的預判,可以幫助駕駛系統(tǒng)提前規(guī)劃調整路徑,從而提高安全駕駛系數(shù)。

時空數(shù)據(jù)在各行各業(yè)中海量產(chǎn)生,對于這些數(shù)據(jù)的合理挖掘與利用可以幫助生產(chǎn)者乃至整個社會提高生產(chǎn)效率。

人工智能新浪潮:結合優(yōu)化算法的快速智能決策

佐治亞理工學院終身教授藍光輝

機器學習和人工智能是大數(shù)據(jù)時代科技發(fā)展的產(chǎn)物,近幾年有了突破性的發(fā)展,代表性成果包括圖像識別、語音識別、自然語言處理等,應用場景包括自動駕駛、智能診斷、無人機等。然而,機器學習和人工智能所基于的主流深度神經(jīng)網(wǎng)絡學習算法,還需要與優(yōu)化算法結合,才能適應現(xiàn)實商業(yè)世界中超大規(guī)模、快速實時響應等需求。

來自佐治亞理工學院的終身教授藍光輝,其主要研究領域為隨機優(yōu)化和非線性規(guī)劃的理論、算法和應用,包括隨機梯度下降和加速隨機梯度下降等于用于解決隨機凸和非凸優(yōu)化問題。藍光輝也是國際上機器學習和深度學習算法方向頂級專家,華人年輕一代優(yōu)化算法的領軍人物之一。

所謂凸優(yōu)化/非凸優(yōu)化是國際上一套已經(jīng)研究很完備的優(yōu)化算法理論體系和求解算法,如果把某個優(yōu)化問題轉化為凸優(yōu)化/非凸優(yōu)化問題,就能快速給出最優(yōu)解。簡單理解,凸優(yōu)化就是指某個問題可以找到局部最大值或最小值,而非凸優(yōu)化就是指某個問題雖然沒有局部最大值或最小值,但依然有幾個局部優(yōu)化點。換句話說,非凸優(yōu)化就是可以找個幾個局部優(yōu)化的解決方案以供決策,可用于投資組合交易、航線管控、生產(chǎn)排班、資源調配、信號傳輸?shù)阮I域。

例如在2017年6月21日到24日的北京汛期最強暴雨天氣中,根據(jù)航旅縱橫統(tǒng)計,從21日0:00-23日12:00,全國延誤航班架次11805架,取消航班架次3052架。在這種情況下,航空公司和鐵路公司能否實時的根據(jù)受影響航班、天氣、人流等數(shù)據(jù),及時優(yōu)化調整航班與鐵路車次,就成為了影響整個社會經(jīng)濟運行的重要因素。這不僅僅是智能學習和預測,還需要超大規(guī)模、快速實時響應,才能夠解決實際的問題。

藍光輝介紹,自2015年以來,大規(guī)模凸優(yōu)化及非凸優(yōu)化算法取得了很大的進展,已經(jīng)能夠處理超過一百萬甚至達上億變量的超大規(guī)模數(shù)據(jù)集。把凸優(yōu)化及非凸優(yōu)化算法用于機器學習算法的優(yōu)化,就能大幅加速機器學習算法的速度。杉數(shù)科技的科學家們也一直在開發(fā)自己的機器學習與深度學習算法求解器。同時也幫助上海財經(jīng)大學協(xié)同開發(fā)國產(chǎn)的最優(yōu)化求解器的開源軟件,推進我國開源社區(qū)在優(yōu)化算法方面的進展。

H2O與TensorFlow是兩大界頂級機器學習求解器,其中H2O是發(fā)布最早、影響力最大的機器學習開源軟件之一,已經(jīng)服務于三百多家金融、互聯(lián)網(wǎng)企業(yè),被全世界70000多名數(shù)據(jù)科學家和8000多家單位所使用。而TensorFlow是谷歌開發(fā)并力推的深度學習計算引擎,也可作為通用的機器學習求解器,是Github排名第一的世界頂級開源項目,在語音識別、圖像識別、機器翻譯等各人工智能領域有著廣泛的應用。

藍光輝介紹說,杉數(shù)科技的優(yōu)化求解器軟件在9個公開數(shù)據(jù)集上與TensorFlow和H2O兩種求解器進行了對比測試。其中,在針對分類模型的數(shù)據(jù)集上,杉數(shù)科技求解器的求解速度在所有數(shù)據(jù)集上均大幅高于TensorFlow,提升速度為10倍~70倍不等;而在計算速度大幅領先的情況下,杉數(shù)科技求解器預測效果仍略好于TensorFlow。針對回歸模型的數(shù)據(jù)集上,在3個公開數(shù)據(jù)集上的對比測試來看,在不影響求解精確度的情況下,通過選擇合適的超參數(shù)使得杉數(shù)科技求解器軟件的求解速度仍快于TensorFlow數(shù)倍,而預測效果則大致相當。

與H2O比較來看,針對分類模型數(shù)據(jù)集,在預測精度大致相同的情況下,杉數(shù)科技在幾乎所有數(shù)據(jù)集上求解速度都大幅度領先于領先于H2O;而在回歸模型數(shù)據(jù)集上對比,通過選擇合適的超參數(shù),杉數(shù)科技的求解器求解速度略慢于H2O,但預測精度能遠高于H2O。

也就是說,在新一波人工智能浪潮中,中國的科學家們已經(jīng)掌握了并不落后,甚至領先國外的核心算法及軟件工具,把優(yōu)化算法代碼與中國企業(yè)的商業(yè)流程無縫結合起來,真正掌握從單體智能到群體協(xié)同智慧的“軟實力”。

“核心算法是一個國家的軟實力。只要互聯(lián)網(wǎng)不死、數(shù)據(jù)與信息不死,算法就永遠存在。掌握了核心算法,一個國家才能在未來一波又一波人工智能浪潮中掌握主動權。”葉蔭宇強調說。

2017鈦媒體AI大師圓桌會第一期圓滿舉辦,在業(yè)界影響廣泛。接下來的7月和8月,我們還將聯(lián)合杉樹科技繼續(xù)舉辦“高維預測和大數(shù)據(jù)處理”、“人工智能:在不確定中博弈”、“AI創(chuàng)業(yè)與硅谷”、“AI社交網(wǎng)絡”共四場與大師面對面的機會。

報名鏈接點擊這里:

http://m.chcmb.cn/event/2017/ai/#guest

本文系作者 吳寧川 授權鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉載請注明出處、作者和本文鏈接
本內容來源于鈦媒體鈦度號,文章內容僅供參考、交流、學習,不構成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點和發(fā)現(xiàn),點擊這里投稿 。創(chuàng)業(yè)或融資尋求報道,點擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評論
0 / 300

根據(jù)《網(wǎng)絡安全法》實名制要求,請綁定手機號后發(fā)表評論

登錄后輸入評論內容

掃描下載App