隨著云廠商不甘于僅扮演“水電工”角色,逐步進入到AI Infra(人工智能基礎(chǔ)設(shè)施)的全棧較量,也就是為AI應(yīng)用提供全生命周期的底層技術(shù)體系,包括訓(xùn)練、推理、部署、數(shù)據(jù)工程、上線運維等各個環(huán)節(jié),標志著行業(yè)競爭已從單純的資源供給,升級為全鏈路業(yè)務(wù)賦能的綜合比拼。這時候,只看token肯定會一葉障目。

不過,從GPU、Maas到AI infra,AI云的競爭要素與指標,并不是一開始就定好了,是與AI行業(yè)同步進化,逐漸演變到了當下的樣子。

理解這個演進軌跡,比記住一個簡單結(jié)論,重要得多。我們就來回顧一下云廠商的AI大戰(zhàn),是如何循著一條清晰的路徑,逐步聚攏于AI Infra的全面戰(zhàn)場。

AI云第一戰(zhàn):GPU的彈藥庫

2023年chatgpt橫空出世,大模型浪潮席卷全球,算力成為博弈的關(guān)鍵。云廠商成為中國AI大模型的算力守門人。這場“廣積糧”式的搶卡大戰(zhàn),更直接奠定了后來AI云競爭格局的基本盤。

為啥這么說呢?沒有最先進的芯片,大模型的訓(xùn)練都無從談起。一場“搶芯大戰(zhàn)”就此拉開帷幕,焦點就是英偉達高端GPU芯片,尤以H100、A800/H800系列。

可是,一來N卡很貴,而云廠商是資源大戶,更有實力全力角逐英偉達高端GPU資源。據(jù)Omdia統(tǒng)計數(shù)據(jù),2023年英偉達售出了50萬個A100和H100 GPU,頭部科技公司瓜分了絕大多數(shù)份額:Meta與微軟各拿下15萬塊H100 GPU,購買量并列位居第一,谷歌、亞馬遜、甲骨文及騰訊各采購5萬塊,百度、阿里分別斬獲3萬塊與2.5萬塊。

不難看到,騰訊的采購策略最為激進,以5萬張H100的采購量穩(wěn)居國內(nèi)首位。憑借充足的芯片儲備,騰訊云率先發(fā)布新一代HCC高性能計算集群,算力性能較前代提升3倍,縮短大模型訓(xùn)練時間,搶占了算力競賽的先發(fā)優(yōu)勢。

另一個原因是,N卡有限制。國內(nèi)企業(yè)僅能采購特供版芯片,但2023年云廠商還能繞過美國出口管制政策限制,憑借以往跟英偉達的供應(yīng)鏈合作關(guān)系,爭奪到高端算力資源。當時,百度雖然已經(jīng)有昆侖芯AI芯片,但2023年自研芯片尚未形成規(guī)模。

(圖源:Omdia報告)

坊間流傳,當時百度與英偉達黃仁勛直接對接,鎖定A800芯片的優(yōu)先供貨權(quán)。而這層關(guān)系背后,是百度長期在AI領(lǐng)域,特別是飛槳框架構(gòu)建的生態(tài)羈絆。

鮮為業(yè)內(nèi)知曉的是,百度飛槳早在2020年便布局硬件生態(tài),當年聯(lián)合13家國內(nèi)外頂級硬件廠商發(fā)起“飛槳硬件生態(tài)圈”計劃,就優(yōu)先綁定了英偉達,作為深度合作伙伴,通過高頻次中高管對接,英偉達組建了專職PM與研發(fā)團隊專項對接。這種長期合作積累的信任基礎(chǔ),應(yīng)該為百度參與搶芯大戰(zhàn)提供了不少助力,也有力支撐了百度智能云的AI算力集群,以及文心大模型作為首個對標chatgpt的中文大語言模型率先問世。

可以說,這一階段的競爭勝負,取決于資本實力與供應(yīng)鏈掌控力。

2023年的搶卡大戰(zhàn),堪稱國內(nèi)云廠商在AI時代的首場硬仗,為中國AI的發(fā)展提供了不可或缺的算力彈藥,并影響到后續(xù)戰(zhàn)略走向。后來,算力儲備充足如阿里云,可以通過降價搶占市場,而受海外供貨限制的華為等廠商,則轉(zhuǎn)向差異化突圍。

同時,當競爭集中在卡型、算力規(guī)格,也讓供應(yīng)鏈危機格外凸顯。英偉達芯片供應(yīng)鏈的不穩(wěn)定性,也讓云廠商開始清醒認識到,過度依賴外部硬件絕非長久之計。自此,國內(nèi)云廠商紛紛加大自研芯片投入,百度昆侖芯、阿里含光、華為昇騰等產(chǎn)品加速迭代,埋下了國產(chǎn)硬件突圍的伏筆。

AI云的第二戰(zhàn):模型的尖刀

囤了這么多GPU卡,云廠商是不是立馬開戰(zhàn)AI了?萬萬沒想到,2024年初的第一場云較量是《幻獸帕魯》。現(xiàn)象級游戲《幻獸帕魯》爆火,海量玩家的集中涌入導(dǎo)致服務(wù)器瀕臨崩潰,阿里云、華為云、騰訊云、京東云等國內(nèi)廠商集體響應(yīng),針對性推出專屬服務(wù)器。

大型游戲云服務(wù),拼的是全球多節(jié)點、充沛算力、穩(wěn)定網(wǎng)絡(luò),以及低價,這跟AI有半毛錢關(guān)系嗎?大模型熱潮已席卷一年,說好的AI云大戰(zhàn)似乎遲遲未進入核心階段。

云廠商很快發(fā)現(xiàn),想靠AI+云計算賺到錢,只堆算力并不夠,還必須將算力轉(zhuǎn)化為企業(yè)開箱即用的服務(wù),也就是MaaS(模型即服務(wù))。

與開年的云游戲形成鮮明對比的,是2024年底我參加某頭部云廠商的年度溝通會,其內(nèi)部人士直言,云部門首次取代政企部門,在集團中優(yōu)先登臺匯報,核心源于亮眼的增長表現(xiàn),而這份增長的核心驅(qū)動力,正是自研大模型這一“尖刀產(chǎn)品”。

MaaS賽道的競爭邏輯,就是把自研大模型,鍛造成切入業(yè)務(wù)場景的一把“尖刀”。

 

阿里云靠開源,通義全系列模型+“百煉”平臺,構(gòu)建模型的微調(diào)與部署一體化,以生態(tài)粘性鎖定用戶,同時主動發(fā)起價格戰(zhàn)搶占市場份額。百度智能云則文心閉源+模型超市,升級文心大模型,同時千帆平臺支持幾十款主流開源模型一鍵調(diào)用,以開放的開發(fā)者生態(tài)擴大影響力。

騰訊云發(fā)力政企服務(wù)市場,在2024年全球數(shù)字生態(tài)大會上披露,騰訊云“自研+被集成”戰(zhàn)略成效顯著,服務(wù)客戶超200萬家,SaaS合作伙伴收入增幅突破100%。

這一年,火山引擎也正式加入AI云大戰(zhàn),憑借極強的工程化能力和推理優(yōu)化,將模型推理成本降低90%以上,直接推動AI應(yīng)用規(guī)?;l(fā)。

華為云則走出差異化路線。憑借政企市場的積累,發(fā)布盤古大模型3.0,構(gòu)建L0(基礎(chǔ)層)至L3(行業(yè)層)的四級架構(gòu),聚焦政務(wù)、金融、制造等場景,以行業(yè)Know-How構(gòu)筑壁壘。

可以看到,這一階段的競爭勝負手,已從單純的算力儲備,轉(zhuǎn)變?yōu)槟P湍芰?、行業(yè)適配能力。

風(fēng)險也在醞釀,那就是模型能力幾乎難以拉開差距,這就導(dǎo)致Maas服務(wù)對客戶的鎖定效應(yīng)不明顯。這一困境并不是國內(nèi)云廠商獨有的。

《Big AI: Cloud infrastructure dependence and the industrialisation of artificial intelligence》作者調(diào)研也發(fā)現(xiàn),海外云基礎(chǔ)設(shè)施也體現(xiàn)出高度相似性,AWS、Microsoft Azure與GCP雖提供多樣化服務(wù),但核心服務(wù)類型與名稱高度相似,這凸顯了云基礎(chǔ)設(shè)施的共性要素。

(圖:云AI堆棧) 注:圖中展示了亞馬遜網(wǎng)絡(luò)服務(wù)、微軟Azure和谷歌云平臺中云平臺產(chǎn)品和服務(wù)之間的結(jié)構(gòu)性互聯(lián)。線條粗細表示引用頻率,指示不同產(chǎn)品和服務(wù)之間聯(lián)系的強度。

究其原因,是AI與云計算的整合,離不開一套完整技術(shù)棧、云基礎(chǔ)設(shè)施工具及服務(wù)生態(tài)中的核心組件,這個龐大的技術(shù)棧必然有大部分都是重合的。

于是,云廠商的AI大戰(zhàn)開始邁入第三階段,轉(zhuǎn)向AI Infra,增強共性基礎(chǔ)要素的綜合競爭力。

AI云第三戰(zhàn):Infra的生態(tài)鎖定

時間來到2025年,兩大核心變量,將AI云競爭推向AI Infra(人工智能基礎(chǔ)設(shè)施)的戰(zhàn)場。

一是模型。2025春節(jié),DeepSeek橫空出世,模型重心從訓(xùn)練規(guī)模轉(zhuǎn)向推理效率。即便基于同一款開源模型,不同廠商的推理成本差距可通過Infra優(yōu)化能力無限拉大,“同模型不同命”讓企業(yè)越來越重視云基礎(chǔ)設(shè)施的深度優(yōu)化能力。

二是應(yīng)用。Agent智能體應(yīng)用爆發(fā),又是典型的“Token大戶”,AI Infra作為連接算力與應(yīng)用的關(guān)鍵橋梁,直接影響到智能體的能力差異,頭部云廠商與中小玩家的差距持續(xù)擴大。

此時,AI云已經(jīng)進入AI Infra階段,成為巨頭的游戲。頭部廠商紛紛加碼布局,加速技術(shù)架構(gòu)升級與組織調(diào)整。阿里云首提基礎(chǔ)設(shè)施,華為云依托昇騰芯片與ModelArts平臺打造全棧自主可控底座,百度智能云則提出AI-Native服務(wù)架構(gòu),打造從芯片研發(fā)、集群部署到平臺優(yōu)化的全鏈路技術(shù)閉環(huán),騰訊云也專門成立AI Infra部門。

為什么支撐大模型和agent應(yīng)用,離不開AI Infra?這背后其實就是一本經(jīng)濟賬。

想開源,增加AI云的使用量和收入,AI Infra 有極強的生態(tài)鎖定優(yōu)勢。企業(yè)一旦將核心業(yè)務(wù)Agent部署于某家廠商的Infra之上,遷移成本極高,形成穩(wěn)固的用戶粘性。比如谷歌與Anthropic、Midjourney達成深度合作,亞馬遜成為Stability AI、Hugging Face的首選云合作伙伴,都是這個邏輯。

想節(jié)流,硬件芯片的性能釋放效率,完全依賴Infra層的適配調(diào)度能力。特別是在GPU供給受限的背景下,華為昇騰、寒武紀、沐曦等國產(chǎn)集群,更需要深度優(yōu)化來提升算力利用率,讓云廠商的單位Token成本持續(xù)下降。AI Infra靠自研芯片擺脫對單一供應(yīng)商的依賴,將推理成本壓至行業(yè)低位,構(gòu)建可持續(xù)的成本優(yōu)勢。

要知道,云計算是一門規(guī)模生意,成本決定生死,成本架構(gòu)的優(yōu)化能力是最底層的競爭力。而既能開源,又能節(jié)流,AI Infra就成了云廠商在AI時代最大的利潤池與護城河。

AI Infra的核心競爭力,體現(xiàn)在各層級技術(shù)的全面布局、深度協(xié)同、極致優(yōu)化,分別對應(yīng)的是技術(shù)架構(gòu)是否完整、技術(shù)之間能不能打通、降本增效效果好不好。

從底層,國產(chǎn)芯片正為AI Infra奠定基礎(chǔ)。華為昇騰性能已接近英偉達,百度昆侖芯片支持萬卡集群部署,阿里含光800專攻云端計算優(yōu)化,這些國產(chǎn)芯片的性能提升,持續(xù)強化AI Infra的算力供給能力。

2025年超節(jié)點的火熱,也是系統(tǒng)級優(yōu)化的一個成果體現(xiàn),通過架構(gòu)創(chuàng)新,實現(xiàn)算力效能倍增。比如百度天池256/512超節(jié)點通過拓撲優(yōu)化,將卡間互聯(lián)帶寬提升4倍;華為云CloudMatrix 384超節(jié)點將384顆昇騰NPU與192顆鯤鵬CPU互聯(lián),都填補了國產(chǎn)超節(jié)點集群的市場空白。

當然,算力資源只是基礎(chǔ),能否實現(xiàn)規(guī)?;{(diào)度、穩(wěn)定推理、低成本運營及生產(chǎn)環(huán)境長期適配,才是對云廠商全棧能力的終極考驗。百度百舸平臺、華為云昇騰與CANN、火山引擎HiAgent體系,都是通過全鏈路優(yōu)化讓算力真正好用、易用。

可以說,有了可持續(xù)的AI Infra,云廠商就算打價格戰(zhàn),也比別人的血條更厚、撐得更久。

阿里云宣布未來三年投入超3800億元用于云和AI硬件基礎(chǔ)設(shè)施建設(shè),騰訊新成立AI Infra(人工智能基礎(chǔ)設(shè)施)部,頭部廠商的持續(xù)加碼,印證了AI Infra的長期價值。而這一切,最終都回歸到AI云的核心邏輯:誰能讓AI跑得更穩(wěn)、更省,誰就能聚集起更大的用戶規(guī)模,建立強者恒強的行業(yè)地位。

云起AI之潮,決戰(zhàn)Infra之巔,云廠商的AI大戰(zhàn),接下來將進入到白熱化階段。

上世紀末的光纖基建狂潮,為后來的Google、Facebook崛起,以及互聯(lián)網(wǎng)時代的爆發(fā),筑牢了物理根基。今天,云產(chǎn)業(yè)正在復(fù)刻這一邏輯。

頭部云廠商砸下千億級資金布局AI基礎(chǔ)設(shè)施,本質(zhì)是在為下一個時代的科技巨頭搭建成長底座。AI Infra作為AI時代的水電煤,直接決定了未來十幾年智能產(chǎn)業(yè)的發(fā)展格局。戰(zhàn)局如何演進,讓我們拭目以待。

本文系作者 腦極體 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請注明出處、作者和本文鏈接
本內(nèi)容來源于鈦媒體鈦度號,文章內(nèi)容僅供參考、交流、學(xué)習(xí),不構(gòu)成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點和發(fā)現(xiàn),點擊這里投稿 。創(chuàng)業(yè)或融資尋求報道,點擊這里

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實名制要求,請綁定手機號后發(fā)表評論

登錄后輸入評論內(nèi)容

快報

更多

2026-03-28 23:01

澤連斯基稱與中東3國達成防務(wù)合作協(xié)議,涉聯(lián)合生產(chǎn)無人機

2026-03-28 22:35

山西太原一建筑發(fā)生火災(zāi),已致1人死亡25人受傷

2026-03-28 22:26

王文濤部長發(fā)表書面致辭,支持世貿(mào)組織《電子商務(wù)協(xié)定》達成臨時實施安排

2026-03-28 21:54

40余家單位聯(lián)盟,中國最大人形機器人訓(xùn)練基地在京揭牌

2026-03-28 21:41

周鴻祎與劉慈欣在科幻大會預(yù)判:百億智能體或成新物種,AI推動人類文明分化

2026-03-28 21:38

第五代宏光MINIEV上市,售價4.48萬-5.48萬元

2026-03-28 20:42

烏稱伊朗襲擊迪拜倉庫并致烏克蘭人傷亡消息不實

2026-03-28 20:23

3月28日新聞聯(lián)播速覽23條

2026-03-28 20:05

美國務(wù)卿和歐盟官員被曝就烏克蘭問題激烈交鋒

2026-03-28 19:44

“Token”這個詞的搜索量最高一天達到7.7萬次,比去年日均搜索量高出1850%

2026-03-28 19:39

飛捷科思發(fā)布中國首個可微分物理仿真引擎Fysics

2026-03-28 19:13

“網(wǎng)售產(chǎn)品質(zhì)量安全提升系列行動2026”在北京啟動

2026-03-28 19:03

國務(wù)院食安辦、市場監(jiān)管總局約談相關(guān)地方市級人民政府負責(zé)人,督辦“3?15”晚會曝光問題整改

2026-03-28 18:44

飛書 CLI 開源:AI 可直連飛書辦公套件

2026-03-28 18:36

馬來西亞說伊朗允許馬滯留油輪通行霍爾木茲海峽

2026-03-28 18:02

今年前三個月中國創(chuàng)新藥對外授權(quán)交易總額超600億美元

2026-03-28 17:39

中國和菲律賓舉行南海問題雙邊磋商機制第十一次會議

2026-03-28 17:30

印尼正式實施16歲以下社媒禁令,約7000萬人受影響

2026-03-28 17:04

美國加州禁止官員借內(nèi)幕消息在預(yù)測市場牟利

2026-03-28 17:02

北京“超現(xiàn)場”生態(tài)共同體建設(shè)暨全國覆蓋啟動

掃描下載App