炎熱的夏季,沖個(gè)涼水澡或者泡個(gè)水浴是消暑的好方法。而在服務(wù)器內(nèi)部核心結(jié)構(gòu),尤其是CPU、GPU,最高溫度可達(dá)50~60度,高溫之下,傳統(tǒng)風(fēng)冷的降溫效果已接近極限,換個(gè)方式——如果給服務(wù)器沖個(gè)“涼水澡”,或者泡在水里,熱交換后的溫度降低效果會極佳。由此,隨著AI算力暴增驅(qū)動,液冷市場規(guī)模正快速增長。
AI已經(jīng)成為當(dāng)下各行各業(yè)關(guān)注的焦點(diǎn),如何實(shí)現(xiàn)“人工智能+”是各行業(yè)實(shí)現(xiàn)彎道超車的關(guān)鍵抓手之一。在此背景下,作為AI算力供給的底層基礎(chǔ)設(shè)施——數(shù)據(jù)中心,也面臨更大的需求,以及更高的要求。秦淮數(shù)據(jù)集團(tuán)CEO吳華鵬曾公開表示,在AI浪潮的推動下,中國數(shù)據(jù)中心市場將以每年22%-25%的速度增長,到2030年,國內(nèi)算力規(guī)模將達(dá)到52GW-63GW。
AI算力需求的暴增,讓原本幾千瓦,最多10KW的標(biāo)準(zhǔn)通用算力機(jī)柜不在能滿足當(dāng)下的需求。GPU的應(yīng)用將單機(jī)柜功率提升至了幾十千瓦,甚至可以突破100KW,萬國數(shù)據(jù)中國區(qū)聯(lián)席總裁梁艷曾表示,現(xiàn)階段,國內(nèi)很多大廠單機(jī)柜密度已達(dá)到70~100KW。
以英偉達(dá)最新發(fā)布的Blackwell GB200 GPU異構(gòu)計(jì)算為例,其單機(jī)柜功耗高達(dá)120kW,相當(dāng)于CPU通用計(jì)算單機(jī)柜功耗的10-20倍。
顯然,傳統(tǒng)的供冷方式已經(jīng)不能滿足日益增長的算力需求。英特爾資深技術(shù)專家對鈦媒體APP表示,傳統(tǒng)風(fēng)冷環(huán)境中,風(fēng)速越快,散熱效果越好,但是當(dāng)散熱需求達(dá)到一定程度后,這種增益開始衰減,“如果要進(jìn)一步提升散熱功能的話,性價(jià)比會越來越低,”該專家指出,“與此同時(shí),風(fēng)扇的可靠性也會越來越低。”
當(dāng)下,液冷已成為數(shù)據(jù)中心提升供冷能力以滿足日益增長的機(jī)柜密度與功率的最佳途徑。鈦媒體APP通過對行業(yè)觀察了解到,僅采用傳統(tǒng)風(fēng)冷技術(shù)的數(shù)據(jù)中心PUE極限值為1.25,而采用液冷技術(shù)后,數(shù)據(jù)中心PUE值可低于1.1。
據(jù)科智咨詢預(yù)計(jì),2024年中國液冷數(shù)據(jù)中心市場將同比增長53%,市場規(guī)模將增長至236億元;預(yù)計(jì)2022年—2027年,中國液冷數(shù)據(jù)中心市場將以59%的復(fù)合增長率持續(xù)蓬勃發(fā)展;預(yù)計(jì)到2027年,隨著AI系列應(yīng)用的規(guī)?;涞匾约耙豪渖鷳B(tài)的日趨成熟,市場規(guī)模將突破千億大關(guān)。
值得注意的是,在前不久剛剛舉辦的WAIC上,浪潮信息、中科曙光等企業(yè)帶來了全新的液冷解決方案。浪潮信息展示了支持多元算力和多模算法的新一代模塊化液冷智算中心,該模塊化液冷智算中心遵循“以系統(tǒng)為核心”的設(shè)計(jì)理念,從算效、能效、調(diào)度管理、交付等方面,實(shí)現(xiàn)了整體性能的優(yōu)化。中科曙光也在大會現(xiàn)場帶來了全新的浸沒式液冷解決方案,據(jù)中科曙光展區(qū)工作人員對鈦媒體APP表示,該款液冷解決方案采用了相變浸沒式液冷,冷卻液為電子氟化液,可應(yīng)用于高密度的智算中心。
另一方面,鈦媒體APP注意到,英特爾也于近期推出了下一代G-Flow浸沒式液冷機(jī)柜相關(guān)技術(shù)。該技術(shù)采用的是單相浸沒式液冷,值得注意的是,在這套解決方案中,冷卻液采用的是??松梨谧钚卵邪l(fā)的無PFAS浸沒式冷卻液(某種碳?xì)浜铣捎停?,相較于傳統(tǒng)的氟化液更為環(huán)保。
雖然液冷技術(shù)在數(shù)據(jù)中心行業(yè)已經(jīng)有比較多大規(guī)模成熟的應(yīng)用出現(xiàn),不過,在選擇供冷技術(shù)的時(shí)候性價(jià)比仍然是用戶最為關(guān)心的一個(gè)話題。
“現(xiàn)階段,大規(guī)模應(yīng)用液冷與傳統(tǒng)風(fēng)冷相比,建設(shè)成本差別并不大,但是后期所節(jié)省的電費(fèi),讓大規(guī)模應(yīng)用液冷的數(shù)據(jù)中心在運(yùn)營過程中比傳統(tǒng)風(fēng)冷數(shù)據(jù)中心降低不少,整體降低了運(yùn)營成本。”綠色云圖CEO胡世軒對鈦媒體APP表示。
據(jù)賽迪顧問發(fā)布的《2023中國液冷應(yīng)用市場研究報(bào)告》,2022年液冷數(shù)據(jù)中心1kW的散熱成本為近6500元,相比2021年已經(jīng)下降了54.2%,預(yù)計(jì)2023年1kW的散熱成本有望降至5000元左右,與傳統(tǒng)風(fēng)冷的建設(shè)成本已基本持平。
從技術(shù)路線上看,目前廣泛受到關(guān)注的液冷技術(shù)主要分為兩類:浸沒式液冷、冷板式液冷。以目前包括浪潮信息、寧暢、阿里云、曙光等在內(nèi)的中國液冷行業(yè)頭部玩家,以及英特爾等國際科技巨頭的布局來看,冷板式液冷與浸沒式液冷屬于未來比較可行的液冷路徑。
就目前應(yīng)用情況來看,受改造難易度、成本等因素的影響,冷板式液冷市場占有率較高,據(jù)IDC數(shù)據(jù)顯示,2023上半年,中國液冷服務(wù)器市場中,冷板式占比達(dá)90%。不過,英特爾資深技術(shù)專家告訴鈦媒體APP,雖然目前冷板式液冷市場占有率比較高,但是不能忽視的是,浸沒式液冷的增長速度明顯高于冷板式液冷。
其實(shí)從前面提到的WAIC展會上不同廠商分別帶來的浸沒式與冷板式液冷的解決方案就不難看出,目前冷板式液冷與浸沒式液冷各有優(yōu)缺點(diǎn),數(shù)據(jù)中心液冷應(yīng)用處于“兩條腿”走路的狀態(tài)。
從市場需求上看,無論是浸沒式液冷,還是冷板式液冷,用戶在選擇的時(shí)候考慮的因素主要有兩個(gè)。
一個(gè)是安全可靠性。眾所周知服務(wù)器內(nèi)部由各類精密電子元器件組成,而冷板式液冷使用的冷卻液體為水和丙二醇水溶液,具有導(dǎo)電性,一旦漏液會造成服務(wù)器損壞。如何確保不漏液,并做好漏液后的防護(hù)措施是冷板式液冷所面臨的首要挑戰(zhàn)。
目前,針對漏液問題,業(yè)界普遍采用的應(yīng)對方案是安裝漏液檢測系統(tǒng),當(dāng)發(fā)現(xiàn)冷卻液泄露時(shí),進(jìn)行告警,盡快定位泄露節(jié)點(diǎn)進(jìn)行修復(fù)。“當(dāng)小型泄露發(fā)生時(shí),這種處理辦法尚為有效,但當(dāng)出現(xiàn)液柱大口噴射情況時(shí),突發(fā)且短時(shí)間內(nèi)擴(kuò)散可導(dǎo)致系統(tǒng)宕機(jī),漏液檢測系統(tǒng)無法規(guī)避事故損害。”浪潮信息相關(guān)負(fù)責(zé)人告訴鈦媒體APP。
據(jù)鈦媒體APP了解,為了從根源上防止漏液對服務(wù)器造成損害,浪潮信息首創(chuàng)了一種可以使得液冷系統(tǒng)二次側(cè)均為負(fù)壓的動力單元——液環(huán)式真空CDU,由于管路內(nèi)均為負(fù)壓,因此徹底杜絕了漏液隱患。同時(shí),這項(xiàng)技術(shù)創(chuàng)新突破了液冷循環(huán)系統(tǒng)只能采用高壓水泵,才能實(shí)現(xiàn)液體循環(huán)流動的“定律”,實(shí)現(xiàn)了僅依靠真空泵通過不同傳感器控制多腔室功能切換,即可實(shí)現(xiàn)流體的循環(huán)流動,在技術(shù)極簡化同時(shí)也實(shí)現(xiàn)了可靠性的大幅提升,將有效推動冷板式液冷技術(shù)的普及。
在浸沒式液冷方面,由于服務(wù)器要浸泡在冷卻液中,就對冷卻液的腐蝕性、安全性等方面提出了更高的要求。針對此,??松梨诤铣苫A(chǔ)油業(yè)務(wù)部門亞太市場總監(jiān)王欣告訴鈦媒體APP,原先常見的用于浸沒式液冷的含PFAS的氟化液因?yàn)槲廴拘暂^強(qiáng),本身不易被降解,現(xiàn)在已經(jīng)逐步被注重環(huán)保的公司所淘汰,“在此背景下,??松梨谘邪l(fā)出了新的無PFAS浸沒式冷卻液,已經(jīng)在與英特爾的合作中被驗(yàn)證是可以用于浸沒式液冷設(shè)備之中,”王欣指出,“而這種無PFAS浸沒式冷卻液因?yàn)椴缓琍FAS,整體對環(huán)境,對人類都是安全的。”
除了安全可靠性以外,用戶在應(yīng)用液冷過程中關(guān)注的問題就是成本問題。成本問題包括了采購成本、機(jī)房改造成本/難易度、后期運(yùn)營成本等等諸多方面。
采購成本方面,隨著液冷技術(shù)的不斷成熟,無論是冷板式液冷,還是浸沒式液冷,其成本相較于前幾年已經(jīng)有明顯下降,正如前文所述,對于大型、超大型數(shù)據(jù)中心而言,采用液冷技術(shù)的成本已經(jīng)幾乎與傳統(tǒng)風(fēng)冷持平。
值得一提的是,在浸沒式液冷方面,將原本的氟化液換成無PFAS浸沒式冷卻液以后,除了更環(huán)保以外,無PFAS浸沒式冷卻液的采購成本也比氟化液低不少,且據(jù)英特爾資深技術(shù)專家告訴鈦媒體APP,采用??松梨诘臒oPFAS浸沒式冷卻液,使用壽命可達(dá)10~12年,“理論上在生命周期內(nèi)事不需要更換冷卻液的,”該名專家進(jìn)一步表示,“另一方面,在設(shè)計(jì)的時(shí)候,我們也添加了過濾裝置,確保冷卻液的純凈度。”
另一方面,相較于傳統(tǒng)的氟化液,無PFAS浸沒式冷卻液的流動性也更高,粘度更低,冷卻效果也更好。
改造成本/難易度方面,目前絕大多數(shù)冷板式液冷的改造成本要優(yōu)于浸沒式液冷,這也是目前冷板式液冷市場占比遙遙領(lǐng)先的原因之一。目前市面上常見的冷板式液冷基本都采用工廠預(yù)制模式,提供一體化交付的能力。
不過隨著技術(shù)的不斷發(fā)展,浸沒式液冷部署難度及成本也越來越低,以英特爾最新發(fā)布的G-Flow浸沒式液冷機(jī)柜技術(shù)為例,英特爾資深技術(shù)專家告訴鈦媒體APP,該技術(shù)相較于傳統(tǒng)的單相浸沒式液冷而言,對機(jī)房改造少,運(yùn)用了成熟的技術(shù)組裝,不引入新的技術(shù)挑戰(zhàn),從而降低實(shí)施風(fēng)險(xiǎn),“能部署冷板式液冷的機(jī)房,都可以部署G-Flow浸沒式液冷機(jī)柜。”該名負(fù)責(zé)人如是說。
運(yùn)營成本方面,采用液冷的數(shù)據(jù)中心所消耗的電費(fèi)要比傳統(tǒng)風(fēng)冷數(shù)據(jù)中心低很多。另一方面,相較于傳統(tǒng)風(fēng)冷數(shù)據(jù)中心,采用液冷的數(shù)據(jù)中心故障率也有所下降。
隨著技術(shù)愈發(fā)成熟,液冷已經(jīng)成為數(shù)據(jù)中心不可或缺的供冷方式。不過王欣與胡世軒都曾向鈦媒體APP表示,用戶在選擇供冷方式的時(shí)候,對于性價(jià)比的要求是最高的,而液冷技術(shù)大規(guī)模部署的成本已經(jīng)與傳統(tǒng)風(fēng)冷持平,顯然液冷市場已經(jīng)來到了應(yīng)用的爆發(fā)點(diǎn),數(shù)據(jù)中心已經(jīng)步入了液冷時(shí)代。
雖然數(shù)據(jù)中心已經(jīng)進(jìn)入了液冷時(shí)代,不過對于哪種液冷技術(shù)是最優(yōu)解的爭論聲一直沒有停歇。業(yè)內(nèi)目前有多種聲音。
有的認(rèn)為,冷板式液冷憑借其更高的兼容性、更簡單的部署方式,以及更低的技術(shù)壁壘,將是數(shù)據(jù)中心應(yīng)用液冷的最優(yōu)解。
浪潮信息數(shù)據(jù)中心產(chǎn)品部副總經(jīng)理李金波曾對鈦媒體APP表示,相比于其他液冷方式,冷板式液冷在對數(shù)據(jù)中心與服務(wù)器架構(gòu)的改造程度、產(chǎn)業(yè)鏈成熟度、部件更換運(yùn)維便捷性、初期投資等方面均有顯著優(yōu)勢。
有的認(rèn)為,短期來看冷板式液冷將是數(shù)據(jù)中心液冷的最優(yōu)解,但當(dāng)單機(jī)柜功率進(jìn)一步提升,達(dá)到100KW甚至更高的時(shí)候,浸沒式液冷將取代冷板式液冷,成為液冷的“最終形態(tài)”。
而在胡世軒與英特爾資深技術(shù)專家看來,浸沒式液冷與冷板式液冷兩者會以兩條平行技術(shù)路徑的方式,一直向前發(fā)展。“冷板式液冷與浸沒式液冷目前,以及未來很長一段時(shí)間都會處于并存的狀態(tài),并不會出現(xiàn)一個(gè)會取代另一個(gè)的情況。”英特爾資深技術(shù)專家進(jìn)一步指出。
而無論是冷板式,還是浸沒式,技術(shù)也都在不斷演進(jìn),以英特爾最新發(fā)布的G-Flow浸沒式液冷為例,原有的單相浸沒式液冷技術(shù)存在泵入機(jī)柜的液體大部分不流經(jīng)CPU的散熱器(流阻大),但機(jī)柜流速增加時(shí)CPU的溫度變化不顯著;散熱器中有自然對流導(dǎo)致的液體流動,但速度較慢,散熱能力有限等問題。
英特爾最新推出的G-Flow浸沒式液冷在散熱器和機(jī)柜流體出口之間增加導(dǎo)流管,利用重力或泵的吸力,驅(qū)動液體流過散熱器,相當(dāng)于利用了液體本身的重力,加快了液體流速(1米的高差可達(dá)成4.4M/S的流速)的同時(shí),也讓液體充分的流過設(shè)備,從而提升了散熱效率。
另一方面,冷板式液冷技術(shù)雖然相對于浸沒式更為成熟,但技術(shù)進(jìn)步的腳步依舊沒有停下,為了降低漏液引發(fā)事故風(fēng)險(xiǎn),浪潮信息首創(chuàng)了液環(huán)式真空CDU;為了提高標(biāo)準(zhǔn)化水平,降低交付周期,眾多液冷廠商都推出了預(yù)制化產(chǎn)品。同樣以浪潮信息為例,浪潮信息高通過預(yù)制化環(huán)路管網(wǎng)整體系統(tǒng),經(jīng)BIM制圖設(shè)計(jì)好后,所有閥門管件工廠預(yù)制,現(xiàn)場拼接即可。通過管路及冷源預(yù)制化,該環(huán)節(jié)的施工時(shí)間從一個(gè)月縮短至一周。
在產(chǎn)業(yè)上下游眾多企業(yè)看來,技術(shù)不斷演進(jìn)的過程中,仍需要結(jié)合產(chǎn)業(yè)上下游各方的力量,共同推進(jìn)液冷技術(shù)不斷完善,從而能更好的在數(shù)據(jù)中心中應(yīng)用。“由于液冷產(chǎn)業(yè)發(fā)展處于起步階段,產(chǎn)業(yè)分工尚未明確導(dǎo)致整個(gè)產(chǎn)業(yè)鏈的協(xié)同性不強(qiáng),眾多鏈條企業(yè)更多依靠’作坊式生產(chǎn)‘的方式來完成產(chǎn)品及服務(wù)交付,產(chǎn)業(yè)鏈缺乏具備高度資源整合能力的鏈主企業(yè),從而導(dǎo)致資源配置效率不高、浪費(fèi)嚴(yán)重。”浪潮信息相關(guān)負(fù)責(zé)人告訴鈦媒體APP,“這時(shí)候就需要有一家具備高度整合能力的企業(yè)站出來,聯(lián)合產(chǎn)業(yè)上下游企業(yè),提高產(chǎn)業(yè)鏈協(xié)同性。”
無獨(dú)有偶,英特爾資深技術(shù)專家也曾對鈦媒體APP表示,液冷產(chǎn)業(yè)的發(fā)展首先需要包括服務(wù)器供應(yīng)商在內(nèi)的眾多硬件廠商的配合,提高服務(wù)器等硬件設(shè)備的兼容性。
其次,單就浸沒式液冷而言,還需要液體供應(yīng)商提供高可靠性、高性能、低成本的冷卻液,據(jù)鈦媒體了解到,自從3M此前宣布將在2025年底之前退出生產(chǎn)含氟聚合物、氟化液和基于全氟和多氟烷基物質(zhì)(PFAS)的添加劑產(chǎn)品業(yè)務(wù)之后,??松梨诳梢哉f是目前市面上研發(fā)能力與產(chǎn)品力最強(qiáng)的浸沒式液冷冷卻液供應(yīng)商。
當(dāng)AI算力需求不斷增加,數(shù)據(jù)中心在向智算中心演進(jìn)的過程中,液冷技術(shù)已經(jīng)逐漸成為智算中心供冷最優(yōu)選項(xiàng),而技術(shù)還在不斷演進(jìn),產(chǎn)業(yè)仍需完善。不過液冷在數(shù)據(jù)中心應(yīng)用的爆發(fā)已經(jīng)開始。
(本文首發(fā)于鈦媒體APP,作者|張申宇,編輯丨蓋虹達(dá))
快報(bào)
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請綁定手機(jī)號后發(fā)表評論