英博數(shù)科總經(jīng)理周韡韡
以下是周韡韡演講實錄,略經(jīng)鈦媒體APP編輯:
各位嘉賓,各位行業(yè)大咖,大家上午好!我是英博數(shù)科CEO,也是北京AI創(chuàng)新賦能中心的負(fù)責(zé)人周韡韡。首先在這里要感謝福州市鼓樓區(qū)區(qū)委、區(qū)政府,感謝這次大會給我們新興企業(yè)這么好的展示平臺和承辦會議的機(jī)會,再次感謝各位領(lǐng)導(dǎo)的支持。
我們今天的主題是算力時代,算力是最近這個階段在我們生活中高頻出現(xiàn)的一個詞語。究竟什么是算力?算力能給我們普通人的生產(chǎn)生活帶來什么改變?我想并不是那么多人都能像展院長那樣講得如此清楚。于是帶著這樣的疑問,我希望今天借福州有福之州這塊寶地,與英博數(shù)科的虛擬管培生小e聊一聊這個問題。
小e是英博數(shù)科在與ChatGPT2.5的同源環(huán)境下、使用了Megatron訓(xùn)練框架、利用我們北京AI創(chuàng)新賦能中心的冗余算力和自行研發(fā)的語料,去訓(xùn)練出來的一個算是小參數(shù)AIGC內(nèi)容生成式的聊天機(jī)器人。前面這一串話或許很抽象,那我們不如現(xiàn)場直接請小e來介紹一下自己:![]()
小e現(xiàn)場演示畫面
這看似很簡單的問題,其實是目前國內(nèi)鑒定ChatGPT真?zhèn)蔚恼昭R,因為有很多企業(yè)只不過是接入了美國OpenAI的端口,就號稱自己掌握了這個技術(shù),所以聊天機(jī)器人在面臨這樣問題的時候,通常會回答我是OpenAI,或者來自谷歌,但還好,我們小e知道它是來自英博數(shù)科的AI助理??磥韺θ祟惖慕K極問題“我是誰“的這個問題,小e回答的還OK。
其實我們今天在這里,應(yīng)該說是國內(nèi)的第一場以現(xiàn)場直播,而不是錄播的形式,來展示企業(yè)對ChatGPT研究的實際應(yīng)用。
我們再問一下小e你怎么理解算力,怎么看待算力時代下英博數(shù)科的挑戰(zhàn)與機(jī)遇。這個問題有一點長,而且這個問題里面有復(fù)合性以及一系列的疊加性的問題。我們來看一下小e的回答是什么樣。![]()
小e現(xiàn)場演示畫面
我們稱ChatGPT叫做AIGC生成式,就是強(qiáng)調(diào)從訓(xùn)練的開始就使用深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò),像我們?nèi)艘粯樱瑢ν粋€問題,多次的詢問是可以給出多個答案的,這個是非常大區(qū)別于我們常見的智能客服。在此我們不如就這個問題再問她一次,看她是給一樣還是不一樣的答案。小e,請問你如何理解算力時代下英博數(shù)科的挑戰(zhàn)和機(jī)遇? ![]()
小e現(xiàn)場演示畫面
我們看到她給出了一個略有不同,但有很高相似度的答案,這說明我們的小e目前已經(jīng)具備了一定的創(chuàng)造力,但肯定還存在繼續(xù)訓(xùn)練和改進(jìn)的空間的。因為時間關(guān)系,我們今天在這里對小e的展示就暫時到這個段落,在這次數(shù)字中國的主展區(qū)是有小e的展臺的,感興趣的朋友可以到展區(qū)與小e做更多直接的互動,我們也非常歡迎大家通過掃碼的方式關(guān)注英博數(shù)科的公眾號,在里面可以在后臺去申請小e的免費測試帳號。
相信通過簡單的展示大家就可以感受到為什么ChatGPT在當(dāng)下如此的火爆。在過去二十年里,互聯(lián)網(wǎng)從端到端的時代進(jìn)入到移動互聯(lián)網(wǎng)時代,再到現(xiàn)在元宇宙的時代,是涌現(xiàn)了大量優(yōu)秀應(yīng)用的,可是為什么這些應(yīng)用不能像ChatGPT一樣給我們帶來如此高的關(guān)注度和震撼感?我覺得這里可以借用合作伙伴的一個描述:這個技術(shù)從出生之后到現(xiàn)在的100多天的時間里,幾乎每天都在帶來一個對自己革命性、顛覆性的升級提升,從來沒有過任何一款應(yīng)用能夠像ChatGPT一樣,給每個C端用戶帶來如此鋪面而來的、直觀的沖擊力和震撼感受。
看過剛才小e的回答之后,我在這里也給大家分享下,小e已經(jīng)是參與到英博數(shù)科目前很多的內(nèi)容文案創(chuàng)作工作中,比如兩周之前我們給另外一個福建當(dāng)?shù)卣峁┑闹撬阒行慕ㄔO(shè)規(guī)劃,在一周內(nèi)1萬多字的文案出了5個不同的版本,就是在小e的幫助下完成的,這對我們普通人類工作人員來講的話會是一個很大的挑戰(zhàn)。我們可以看到用自然語言方式與我們溝通的AI已經(jīng)不再是工具屬性,而更是一個陪伴屬性。我們可以看到在不久的將來,這種訪問鏈接一定是會被陪伴所取代,我們常見免費的廣告一定是會被優(yōu)質(zhì)的付費內(nèi)容所取代。有了ChatGPT之后,我們每個人就等于擁有了一個無處不在,而且是無所不知的隨身助理,一個人加上一個OpenAI這樣類型的ChatGPT,就可以完成一個項目,甚至可以開辦一個公司。這樣的生產(chǎn)效率提升,可以說是又一場工業(yè)革命的開始。
當(dāng)然,這樣顛覆性技術(shù)的研發(fā)是有非常高的難度系數(shù)的,有多難?即使像臉書這樣的企業(yè),哪怕是努力再努力,投入了那么多人力和財力之后,似乎做出來的應(yīng)用也不是那么理想。是什么樣的原因能夠給英博數(shù)科這樣新型的公司有這種挑戰(zhàn)大模型、挑戰(zhàn)自然語言處理、挑戰(zhàn)多模態(tài)的勇氣和底氣?應(yīng)該是算力,是目前我們北京AI創(chuàng)新賦能中心是國內(nèi)少有的可以提供專業(yè)AI訓(xùn)練,特別是針對大模型的GPU訓(xùn)練環(huán)境的公共算力服務(wù)平臺。
其實在去年我們投建的時候是面臨一個抉擇的,究竟是選擇數(shù)字基建先行還是選擇應(yīng)用的集成先行,在做選擇過程中如果做數(shù)據(jù)基建勢必面臨非常重度的資金投資,如果是做集成則有可能是投資更輕,且?guī)淼氖袌鲫P(guān)注度也會更高。帶著這個疑問,我與我們的顧問,也是剛剛的演講嘉賓數(shù)字中國研究院的展院長做了一次溝通,他一句話就點醒了我,他說“如果算力不自由,則數(shù)據(jù)無意義,更多的應(yīng)用就無法落地,無法產(chǎn)生“。所以,當(dāng)時我們就毫不猶豫選擇了重度投資之路,先投建了北京AI創(chuàng)新賦能中心,現(xiàn)在不到一年時間回過頭看,再由ChatGPT和大模型引爆市場對算力的渴求,尤其是對高端人工智能算力渴求的市場的當(dāng)下,這個選擇毫無疑問是非常的正確。而且算力的重要性也越來越被更多人所接受。在之前清華大學(xué)、浪潮,和國際上IDC研究院所推出的報告中,算力指數(shù)已經(jīng)成為繼ChatGPT指數(shù)之后另外一個全球公認(rèn)對區(qū)域經(jīng)濟(jì)發(fā)展的衡量指標(biāo),大家都認(rèn)為在區(qū)域經(jīng)濟(jì)中每一元錢對算力的投入可以帶來GDP三到四元錢的增長,這也是為什么在最近數(shù)字中國建設(shè)規(guī)劃中政府明確指出對于夯實算力基礎(chǔ)設(shè)施以及算力基礎(chǔ)設(shè)施建設(shè)的程度被列為各地方政府明確的業(yè)績考核的指標(biāo),因為這一種通過市場化運營的算力是真正能夠幫助到AI創(chuàng)新型企業(yè)的發(fā)展、真正助力到地區(qū)產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型的。根據(jù)我們這一次協(xié)辦方鈦媒體之前的媒體報道,我們國家在過去若干年,對算力和數(shù)據(jù)中心的市場投入超過8萬億,可是我們市場仍然面臨著一個算力短缺的問題,這究竟是什么原因?因為在以往我們的算力大部分投建的數(shù)據(jù)中心都是以溫冷數(shù)據(jù)的存調(diào)中心為主,就是我們常使用的貴州云、蘋果云這樣的平臺,在這樣的平臺存儲型的算力對AI當(dāng)下的發(fā)展的滿足程度非常的有限。應(yīng)該說市場上的算力短缺是一個相對的概念,其實是指在AI上的算力短缺,這種短缺情況還在逐步加?。菏袌錾系乃懔π枨笫敲咳剿膫€月可以翻一倍的情況,而根據(jù)我們AI創(chuàng)新賦能中心平臺上的實際反饋,我們的客戶模型的規(guī)模幾乎是每個月就會增長3到4倍的情況。
在這樣的情況下,我們是要把之前的這些存儲型的算力通過數(shù)據(jù)中心的升級改造變成更多可以直接轉(zhuǎn)化成AI時代生產(chǎn)效率的算力。我們北京的100P算力在一期投建完成之后,短短的時間內(nèi)已全部售罄,目前我們正在計劃一個30到40倍的規(guī)模擴(kuò)容,而且這一部分的算力,80%以上現(xiàn)在都已經(jīng)被售出了。
講到這些的時候會有在座嘉賓好奇,算力需求如此火爆,你為什么還有冗余的算力去訓(xùn)練小e?我覺得這個問題也是市場和很多調(diào)研機(jī)構(gòu)在跟我們私下溝通的時候經(jīng)常會問到的問題。這里可以向大家介紹我們接下來工作中的重中之重:我們即將推出的搏博云服務(wù)(BOB Cloud)的解決方案。算力需求是不會一直處于一個峰值狀態(tài)的,就像在電力系統(tǒng)中,我們會對電力進(jìn)行削峰填谷和平衡調(diào)度,這種方式在算力的服務(wù)上也同樣適用。我們在這個階段搏博云上首先要滿足的是通過善用彈性計算,來進(jìn)行一個對GPU的云調(diào)度,例如在一臺5P GPU算力的服務(wù)器上,就可以實現(xiàn)56個實例同時并行訓(xùn)練。在下一個階段,根據(jù)我們了解到的大模型客戶的一些痛點,這些大模型客戶在面對GPU計算需求的時候會把任務(wù)放在不同的云平臺上進(jìn)行,比如放在阿里云一個模型,同時另外一個是放在亞馬遜云的,這也是為了他們本身的項目安全。在這樣的情況下,跨云的溝通成為了一個剛性的需求,而且人工智能的算力在進(jìn)行GPU訓(xùn)練的時候也要面臨大量的CPU對數(shù)據(jù)的清洗和管理的工作。在這個時候如何協(xié)同CPU和GPU的高效協(xié)同和訓(xùn)練效果,就成為我們客戶的一個必須的剛性需求,這個也是我們接下來的搏博云需要解決的跨云溝通,和在GPU和CPU上協(xié)調(diào)訓(xùn)練的需求。
目前在北京AI創(chuàng)新賦能中心和搏博云的平臺上,已經(jīng)有包括例如自動駕駛、量化交易訓(xùn)練等這樣的大模型訓(xùn)練,這些全球頂尖解決方案客戶的入駐已經(jīng)帶來了大量實際應(yīng)用。我們也特別期待通過我們對算力的擴(kuò)容,通過我們加強(qiáng)自己的交互的能力,能夠早日實現(xiàn)平臺用戶和更多創(chuàng)新型企業(yè)的算力自由,早日看到他們能出現(xiàn)對標(biāo)工業(yè)時代像飛機(jī)、輪船、火車這樣的跨時代的大模型應(yīng)用的出現(xiàn),早日真正實現(xiàn)我們國家企業(yè)的算力自由,也早日實現(xiàn)我們英博數(shù)科的企業(yè)夢想:匯聚全球頂尖科技,助力中國產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型。
以上是我的分享。謝謝各位!
快報
根據(jù)《網(wǎng)絡(luò)安全法》實名制要求,請綁定手機(jī)號后發(fā)表評論
終于搶到你