就在這番豪言發(fā)布前夕,英偉達(dá)剛剛交出一份“無死角”的完美財報:
2026財年第四季度營收681億美元,同比增長73%,創(chuàng)歷史新高;GAAP凈利潤429.6億美元,同比增長94%;毛利率75%,同比增長2個百分點。
![]()
但資本市場的反應(yīng)卻異常冷淡,成績單公布后,英偉達(dá)股價在盤后短暫沖高后迅速回落,次日收跌。數(shù)千億美元市值,在超預(yù)期的業(yè)績中悄然蒸發(fā)。
一邊是創(chuàng)紀(jì)錄的財務(wù)數(shù)據(jù),一邊是反響平平的資本市場,裂痕背后,是華爾街對這家科技巨頭的懷疑:
英偉達(dá)的財報是一襲華美的長袍,上面爬滿了虱子。
面對重重壓力,英偉達(dá)自己也心知肚明,不能坐以待斃,基于此,憑借通用圖形處理器(GPU)統(tǒng)治了AI訓(xùn)練時代的英偉達(dá),正在以一場斥資200億美元、融合異質(zhì)架構(gòu)的豪賭,向AI戰(zhàn)爭的下一主戰(zhàn)場,推理,發(fā)起總攻。
這是一場決定英偉達(dá)能否在成本、架構(gòu)與生態(tài)的多重圍剿中,延續(xù)市場份額神話的“諾曼底登陸”。
英偉達(dá)的焦慮,根植于AI產(chǎn)業(yè)競爭重心的轉(zhuǎn)移。
此前,行業(yè)處于瘋狂堆砌參數(shù)的“訓(xùn)練軍備競賽”階段,而如今,已然集體轉(zhuǎn)向模型落地、智能體普及的“應(yīng)用絞殺賽”,游戲規(guī)則已然改變??蛻絷P(guān)心的核心指標(biāo),從“能否訓(xùn)練出最強(qiáng)大模型”,急轉(zhuǎn)為每個Token的推理成本是多少。
基于此,英偉達(dá)看似堅固的護(hù)城河,正面臨來自市場、客戶與技術(shù)的“三重圍剿”。
第一重圍剿,來自客戶對“極致性價比”的追求。
推理是AI模型實際產(chǎn)生價值的環(huán)節(jié),其成本直接決定商業(yè)模式的生死。OpenAI的動向極具標(biāo)志性,在承諾成為英偉達(dá)新芯片最大客戶之一的同時,其已與初創(chuàng)公司Cerebras達(dá)成數(shù)十億美元計算合作,并大規(guī)模使用亞馬遜自研的Trainium芯片。Cerebras CEO直言,其芯片在推理速度上已超越英偉達(dá)GPU。
無獨有偶,Meta在向英偉達(dá)下單僅一周后,便宣布向競爭對手AMD采購高達(dá)6吉瓦的算力訂單。
不難看到,當(dāng)客戶個個都變成了精算師,通用GPU的高溢價模式便岌岌可危。
第二重圍剿,來自客戶自身的“贏家通吃,垂直整合”野心,英偉達(dá)最大的客戶群,如今正變成其最危險的對手。
谷歌的TPU已從內(nèi)部工具成長為對外服務(wù)的核心算力,最新款Gemini模型完全基于TPU訓(xùn)練,亞馬遜的Trainium芯片則深度綁定其AWS云服務(wù),形成閉環(huán)生態(tài)……這些巨頭自研芯片的邏輯,不僅是為了降本,更是為了將算力這一最大利潤中心內(nèi)部化,構(gòu)建排他性優(yōu)勢。
英偉達(dá)CFO曾透露,超大規(guī)模企業(yè)貢獻(xiàn)了其數(shù)據(jù)中心收入的50%以上,但如今,尷尬的是,這根“輸血管”本身,正試圖自成循環(huán)。
第三重圍剿,是GPU架構(gòu)在推理場景的“天然不適”。
GPU為大規(guī)模并行計算而生,是訓(xùn)練時代的絕對王者。但在大模型推理,尤其是耗時最長的“解碼”(Decode)階段,其架構(gòu)并非最優(yōu),存在延遲高、能效比相對不足的問題。Groq設(shè)計的LPU,專為語言模型推理優(yōu)化,采用不同的內(nèi)存與計算架構(gòu),在特定場景下實現(xiàn)了數(shù)量級的延遲優(yōu)勢。這證明,在推理這片新大陸上,存在更高效的本土化工具。
英偉達(dá)的通用GPU,正背負(fù)著“全能”帶來的沉重包袱。
此外,對英偉達(dá)來說,中國市場正神不知鬼不覺地消失。
英偉達(dá)CFO此前坦言,雖然獲得對華出口H200的許可,但“迄今為止尚未產(chǎn)生任何收入”,且未來是否被允許進(jìn)口仍是未知數(shù)。
與此同時,中國本土生態(tài)正加速“去英偉達(dá)化”,有消息稱,DeepSeek將其最新模型V4代碼優(yōu)先向華為等國內(nèi)芯片商開放,而非英偉達(dá)或AMD。
這意味封鎖不僅在剝奪市場,更在催生一個可能并行、且最終會挑戰(zhàn)CUDA生態(tài)的“新標(biāo)準(zhǔn)”。
因此,英偉達(dá)的完美財報其實岌岌可危,前方,是充滿暗礁與魚雷的推理海峽。
收購Groq、推出新芯片,是這艘巨艦轉(zhuǎn)向、加速,并向潛在威脅發(fā)起的第一輪艦炮齊射。
面對立體圍剿,英偉達(dá)的應(yīng)對并非單點突破,而是一場同時在三條戰(zhàn)線上展開的、相互關(guān)聯(lián)的全面戰(zhàn)爭。其核心戰(zhàn)略是,在架構(gòu)上革命,彌補(bǔ)短板;在產(chǎn)品上分化,滿足需求;在生態(tài)上捆綁,構(gòu)筑壁壘。
第一條戰(zhàn)線,是關(guān)乎技術(shù)根基的“架構(gòu)革命”,以“LPU+GPU”的軟硬結(jié)合,正面迎戰(zhàn)專用芯片。
去年底,英偉達(dá)以200億美元現(xiàn)金,完成了對Groq核心技術(shù)授權(quán)及其核心團(tuán)隊的收購。這筆交易的戰(zhàn)略價值,遠(yuǎn)超財務(wù)數(shù)字,其核心在于快速獲取LPU這一“推理利器”,并將其作為“加速器”,深度整合進(jìn)英偉達(dá)的CUDA+TensorRT-LLM全棧軟件生態(tài)。
LPU的設(shè)計原理與GPU截然不同。它放棄了通用性,專為語言模型推理的確定性與低延遲優(yōu)化,通過極簡指令集、大規(guī)模片上SRAM集成,甚至可能采用3D堆疊等先進(jìn)封裝技術(shù),來攻克內(nèi)存帶寬與延遲瓶頸。
GTC即將亮相的新品,或基于下一代Feynman架構(gòu),目標(biāo)正是將LPU的高效與GPU的通用算力結(jié)合,打造單位Token成本與延遲均大幅降低的“推理怪獸”。
OpenAI承諾成為其最大客戶,也是對這一技術(shù)路線的首次、關(guān)鍵押注。
第二條戰(zhàn)線,是商業(yè)模式的“產(chǎn)品分化”,從“捆綁銷售”到“靈活配餐”,防止客戶流失。
英偉達(dá)歷史上首次為Meta大規(guī)模提供不捆綁高端GPU的純CPU服務(wù)器,用于其廣告推薦等AI工作負(fù)載。這一舉動看似微小,實則標(biāo)志著其商業(yè)邏輯的轉(zhuǎn)變,從強(qiáng)迫客戶購買“標(biāo)準(zhǔn)套餐”,轉(zhuǎn)向允許客戶根據(jù)負(fù)載按需“自助點餐”。
這本質(zhì)是一種“防御性降價”與生態(tài)鎖定策略,通過提供更靈活、更具性價比的產(chǎn)品組合,英偉達(dá)承認(rèn)了推理場景的多樣性,并以此滿足客戶對成本的極致追求,避免其因“過度消費(fèi)”,而徹底轉(zhuǎn)向亞馬遜Trainium或谷歌TPU等競品。
畢竟,沒有永恒的朋友,只有永恒的利益。在推理時代,留住客戶,比單次交易利潤最大化更重要。
第三條戰(zhàn)線,是最為隱秘也最牢固的“生態(tài)鐵幕”,用千億資本編織排他性聯(lián)盟。
英偉達(dá)正從一家芯片公司,演變?yōu)锳I生態(tài)的中樞與“規(guī)則制定者”,其以數(shù)百億美元巨資,深度投資OpenAI、Anthropic等頂尖模型公司,并接近達(dá)成戰(zhàn)略協(xié)議,確保這些定義行業(yè)方向的模型,在其Grace Blackwell、Vera Rubin架構(gòu)上進(jìn)行訓(xùn)練與推理。
更復(fù)雜的資本網(wǎng)絡(luò)正在展開,在OpenAI最新1100億美元融資中,英偉達(dá)與亞馬遜同為關(guān)鍵出資方。隨之達(dá)成的協(xié)議是,OpenAI在亞馬遜AWS上使用Trainium芯片,但其無狀態(tài)API獨家托管在微軟Azure,而英偉達(dá)則提供專屬推理算力。
![]()
這種“你中有我,我中有你”的交叉持股與業(yè)務(wù)綁定,構(gòu)成了一個極高的競爭壁壘。對手面對的已不只是一款芯片,而是一個由資本、協(xié)議與共同利益編織的復(fù)雜網(wǎng)絡(luò)。
至此,英偉達(dá)的戰(zhàn)爭藍(lán)圖完整浮現(xiàn):
在技術(shù)層,以“LPU+GPU”的融合架構(gòu),對抗專用芯片的效率顛覆;在產(chǎn)品層,以靈活組合的性價比方案,抵御客戶的價格倒逼;在生態(tài)層,以資本為紐帶構(gòu)筑聯(lián)盟,防御標(biāo)準(zhǔn)的碎片化與分裂。這是一場攻防一體、旨在統(tǒng)治下一個時代的系統(tǒng)戰(zhàn)役。
大西洋上的一只蝴蝶煽動翅膀,就能引起太平洋上的一場颶風(fēng),如今,英偉達(dá)的推理豪賭,影響遠(yuǎn)不止其自身財報。這場戰(zhàn)役將重構(gòu)全球AI算力供應(yīng)鏈的權(quán)力結(jié)構(gòu),并為中國算力產(chǎn)業(yè),帶來寶貴的的時間窗口。
首先,上游產(chǎn)業(yè)鏈將迎來新一輪技術(shù)博弈與訂單爭奪,若“LPU+GPU”的融合架構(gòu)成為主流,將對上游核心元器件產(chǎn)生顛覆性需求。
傳統(tǒng)的HBM需求可能被對更大規(guī)模、更快速度的SRAM需求部分替代或補(bǔ)充,這對三星、SK海力士等存儲巨頭意味著新的技術(shù)路線選擇。
同時,為實現(xiàn)LPU與GPU的高效集成,3D堆疊、CoWoS-L等先進(jìn)封裝技術(shù)的復(fù)雜度與需求將激增,臺積電的產(chǎn)能與技術(shù)領(lǐng)導(dǎo)地位將進(jìn)一步鞏固,但其面臨的產(chǎn)能壓力也將空前巨大。
此外,液冷散熱、高壓供電等基礎(chǔ)設(shè)施的需求標(biāo)準(zhǔn)也將水漲船高,拉動整個數(shù)據(jù)中心硬件產(chǎn)業(yè)鏈升級。
其次,競爭格局將演變?yōu)?ldquo;全棧能力”的終極比拼。
英偉達(dá)的“軟硬結(jié)合”模式,將迫使谷歌、亞馬遜等巨頭加速其從芯片、系統(tǒng)到軟件的全棧自研,競爭維度從單點性能擴(kuò)展到整體解決方案的效率與易用性。
與此同時,這也為聚焦極致場景的創(chuàng)業(yè)公司留下生存縫隙,只要能在某個垂直領(lǐng)域?qū)⒊杀净蛐阅軆?yōu)勢做到極致,仍可在巨頭戰(zhàn)爭的邊緣地帶建立“垂直王國”。
對于中國AI算力產(chǎn)業(yè),英偉達(dá)的困境與轉(zhuǎn)身,則帶來了寶貴的“機(jī)遇期”,市場替代窗口已經(jīng)打開。
英偉達(dá)高端芯片在中國市場的缺位,為華為昇騰、海光、沐曦、摩爾線程等國產(chǎn)算力企業(yè)提供了練兵場與試錯空間,DeepSeek等領(lǐng)先模型公司與國產(chǎn)芯片的深度合作,是構(gòu)建自主軟硬協(xié)同生態(tài)的關(guān)鍵一步。
國產(chǎn)算力的機(jī)會,或?qū)⑹紫瘸霈F(xiàn)在對尖端制程依賴相對較低、更強(qiáng)調(diào)軟件優(yōu)化和行業(yè)理解的推理側(cè),以及政務(wù)、金融、工業(yè)等特定行業(yè)的模型落地中。
所以,無論英偉達(dá)“諾曼底登陸”成功與否,它都標(biāo)志著一個新時代的開啟:
AI算力的競爭,已從GPU晶體管的堆砌,升維為涵蓋架構(gòu)創(chuàng)新、商業(yè)模式、資本聯(lián)盟與地緣角逐的復(fù)雜系統(tǒng)戰(zhàn)爭。
英偉達(dá)勝負(fù)未分,唯一可以確定的是,這場由巨頭掀起的推理戰(zhàn)爭,必將以更低的成本、更高的效率,加速智能體的普及,催生出一個遠(yuǎn)超你我今日想象的AI原生世界。
快報
根據(jù)《網(wǎng)絡(luò)安全法》實名制要求,請綁定手機(jī)號后發(fā)表評論