就在這番豪言發(fā)布前夕,英偉達(dá)剛剛交出一份“無死角”的完美財報:

2026財年第四季度營收681億美元,同比增長73%,創(chuàng)歷史新高;GAAP凈利潤429.6億美元,同比增長94%;毛利率75%,同比增長2個百分點。

但資本市場的反應(yīng)卻異常冷淡,成績單公布后,英偉達(dá)股價在盤后短暫沖高后迅速回落,次日收跌。數(shù)千億美元市值,在超預(yù)期的業(yè)績中悄然蒸發(fā)。

一邊是創(chuàng)紀(jì)錄的財務(wù)數(shù)據(jù),一邊是反響平平的資本市場,裂痕背后,是華爾街對這家科技巨頭的懷疑:
英偉達(dá)的財報是一襲華美的長袍,上面爬滿了虱子。

面對重重壓力,英偉達(dá)自己也心知肚明,不能坐以待斃,基于此,憑借通用圖形處理器(GPU)統(tǒng)治了AI訓(xùn)練時代的英偉達(dá),正在以一場斥資200億美元、融合異質(zhì)架構(gòu)的豪賭,向AI戰(zhàn)爭的下一主戰(zhàn)場,推理,發(fā)起總攻。

這是一場決定英偉達(dá)能否在成本、架構(gòu)與生態(tài)的多重圍剿中,延續(xù)市場份額神話的“諾曼底登陸”。

AI推理時代,英偉達(dá)面臨“三重圍剿” 

英偉達(dá)的焦慮,根植于AI產(chǎn)業(yè)競爭重心的轉(zhuǎn)移。

此前,行業(yè)處于瘋狂堆砌參數(shù)的“訓(xùn)練軍備競賽”階段,而如今,已然集體轉(zhuǎn)向模型落地、智能體普及的“應(yīng)用絞殺賽”,游戲規(guī)則已然改變??蛻絷P(guān)心的核心指標(biāo),從“能否訓(xùn)練出最強(qiáng)大模型”,急轉(zhuǎn)為每個Token的推理成本是多少。

基于此,英偉達(dá)看似堅固的護(hù)城河,正面臨來自市場、客戶與技術(shù)的“三重圍剿”。

第一重圍剿,來自客戶對“極致性價比”的追求。 

推理是AI模型實際產(chǎn)生價值的環(huán)節(jié),其成本直接決定商業(yè)模式的生死。OpenAI的動向極具標(biāo)志性,在承諾成為英偉達(dá)新芯片最大客戶之一的同時,其已與初創(chuàng)公司Cerebras達(dá)成數(shù)十億美元計算合作,并大規(guī)模使用亞馬遜自研的Trainium芯片。Cerebras CEO直言,其芯片在推理速度上已超越英偉達(dá)GPU。

無獨有偶,Meta在向英偉達(dá)下單僅一周后,便宣布向競爭對手AMD采購高達(dá)6吉瓦的算力訂單。

不難看到,當(dāng)客戶個個都變成了精算師,通用GPU的高溢價模式便岌岌可危。

第二重圍剿,來自客戶自身的“贏家通吃,垂直整合”野心,英偉達(dá)最大的客戶群,如今正變成其最危險的對手。

谷歌的TPU已從內(nèi)部工具成長為對外服務(wù)的核心算力,最新款Gemini模型完全基于TPU訓(xùn)練,亞馬遜的Trainium芯片則深度綁定其AWS云服務(wù),形成閉環(huán)生態(tài)……這些巨頭自研芯片的邏輯,不僅是為了降本,更是為了將算力這一最大利潤中心內(nèi)部化,構(gòu)建排他性優(yōu)勢。

英偉達(dá)CFO曾透露,超大規(guī)模企業(yè)貢獻(xiàn)了其數(shù)據(jù)中心收入的50%以上,但如今,尷尬的是,這根“輸血管”本身,正試圖自成循環(huán)。

第三重圍剿,是GPU架構(gòu)在推理場景的“天然不適”。 

GPU為大規(guī)模并行計算而生,是訓(xùn)練時代的絕對王者。但在大模型推理,尤其是耗時最長的“解碼”(Decode)階段,其架構(gòu)并非最優(yōu),存在延遲高、能效比相對不足的問題。Groq設(shè)計的LPU,專為語言模型推理優(yōu)化,采用不同的內(nèi)存與計算架構(gòu),在特定場景下實現(xiàn)了數(shù)量級的延遲優(yōu)勢。這證明,在推理這片新大陸上,存在更高效的本土化工具。

英偉達(dá)的通用GPU,正背負(fù)著“全能”帶來的沉重包袱。

此外,對英偉達(dá)來說,中國市場正神不知鬼不覺地消失。 

英偉達(dá)CFO此前坦言,雖然獲得對華出口H200的許可,但“迄今為止尚未產(chǎn)生任何收入”,且未來是否被允許進(jìn)口仍是未知數(shù)。

與此同時,中國本土生態(tài)正加速“去英偉達(dá)化”,有消息稱,DeepSeek將其最新模型V4代碼優(yōu)先向華為等國內(nèi)芯片商開放,而非英偉達(dá)或AMD。

這意味封鎖不僅在剝奪市場,更在催生一個可能并行、且最終會挑戰(zhàn)CUDA生態(tài)的“新標(biāo)準(zhǔn)”。

因此,英偉達(dá)的完美財報其實岌岌可危,前方,是充滿暗礁與魚雷的推理海峽。

收購Groq、推出新芯片,是這艘巨艦轉(zhuǎn)向、加速,并向潛在威脅發(fā)起的第一輪艦炮齊射。

三條戰(zhàn)線并進(jìn),英偉達(dá)打響突圍戰(zhàn)

面對立體圍剿,英偉達(dá)的應(yīng)對并非單點突破,而是一場同時在三條戰(zhàn)線上展開的、相互關(guān)聯(lián)的全面戰(zhàn)爭。其核心戰(zhàn)略是,在架構(gòu)上革命,彌補(bǔ)短板;在產(chǎn)品上分化,滿足需求;在生態(tài)上捆綁,構(gòu)筑壁壘。

第一條戰(zhàn)線,是關(guān)乎技術(shù)根基的“架構(gòu)革命”,以“LPU+GPU”的軟硬結(jié)合,正面迎戰(zhàn)專用芯片。

去年底,英偉達(dá)以200億美元現(xiàn)金,完成了對Groq核心技術(shù)授權(quán)及其核心團(tuán)隊的收購。這筆交易的戰(zhàn)略價值,遠(yuǎn)超財務(wù)數(shù)字,其核心在于快速獲取LPU這一“推理利器”,并將其作為“加速器”,深度整合進(jìn)英偉達(dá)的CUDA+TensorRT-LLM全棧軟件生態(tài)。

LPU的設(shè)計原理與GPU截然不同。它放棄了通用性,專為語言模型推理的確定性與低延遲優(yōu)化,通過極簡指令集、大規(guī)模片上SRAM集成,甚至可能采用3D堆疊等先進(jìn)封裝技術(shù),來攻克內(nèi)存帶寬與延遲瓶頸。

GTC即將亮相的新品,或基于下一代Feynman架構(gòu),目標(biāo)正是將LPU的高效與GPU的通用算力結(jié)合,打造單位Token成本與延遲均大幅降低的“推理怪獸”。

OpenAI承諾成為其最大客戶,也是對這一技術(shù)路線的首次、關(guān)鍵押注。

第二條戰(zhàn)線,是商業(yè)模式的“產(chǎn)品分化”,從“捆綁銷售”到“靈活配餐”,防止客戶流失。

英偉達(dá)歷史上首次為Meta大規(guī)模提供不捆綁高端GPU的純CPU服務(wù)器,用于其廣告推薦等AI工作負(fù)載。這一舉動看似微小,實則標(biāo)志著其商業(yè)邏輯的轉(zhuǎn)變,從強(qiáng)迫客戶購買“標(biāo)準(zhǔn)套餐”,轉(zhuǎn)向允許客戶根據(jù)負(fù)載按需“自助點餐”。

這本質(zhì)是一種“防御性降價”與生態(tài)鎖定策略,通過提供更靈活、更具性價比的產(chǎn)品組合,英偉達(dá)承認(rèn)了推理場景的多樣性,并以此滿足客戶對成本的極致追求,避免其因“過度消費(fèi)”,而徹底轉(zhuǎn)向亞馬遜Trainium或谷歌TPU等競品。

畢竟,沒有永恒的朋友,只有永恒的利益。在推理時代,留住客戶,比單次交易利潤最大化更重要。

第三條戰(zhàn)線,是最為隱秘也最牢固的“生態(tài)鐵幕”,用千億資本編織排他性聯(lián)盟。

英偉達(dá)正從一家芯片公司,演變?yōu)锳I生態(tài)的中樞與“規(guī)則制定者”,其以數(shù)百億美元巨資,深度投資OpenAI、Anthropic等頂尖模型公司,并接近達(dá)成戰(zhàn)略協(xié)議,確保這些定義行業(yè)方向的模型,在其Grace Blackwell、Vera Rubin架構(gòu)上進(jìn)行訓(xùn)練與推理。

更復(fù)雜的資本網(wǎng)絡(luò)正在展開,在OpenAI最新1100億美元融資中,英偉達(dá)與亞馬遜同為關(guān)鍵出資方。隨之達(dá)成的協(xié)議是,OpenAI在亞馬遜AWS上使用Trainium芯片,但其無狀態(tài)API獨家托管在微軟Azure,而英偉達(dá)則提供專屬推理算力。

這種“你中有我,我中有你”的交叉持股與業(yè)務(wù)綁定,構(gòu)成了一個極高的競爭壁壘。對手面對的已不只是一款芯片,而是一個由資本、協(xié)議與共同利益編織的復(fù)雜網(wǎng)絡(luò)。

至此,英偉達(dá)的戰(zhàn)爭藍(lán)圖完整浮現(xiàn):

在技術(shù)層,以“LPU+GPU”的融合架構(gòu),對抗專用芯片的效率顛覆;在產(chǎn)品層,以靈活組合的性價比方案,抵御客戶的價格倒逼;在生態(tài)層,以資本為紐帶構(gòu)筑聯(lián)盟,防御標(biāo)準(zhǔn)的碎片化與分裂。這是一場攻防一體、旨在統(tǒng)治下一個時代的系統(tǒng)戰(zhàn)役。

英偉達(dá)的推理豪賭將帶來蝴蝶效應(yīng)

大西洋上的一只蝴蝶煽動翅膀,就能引起太平洋上的一場颶風(fēng),如今,英偉達(dá)的推理豪賭,影響遠(yuǎn)不止其自身財報。這場戰(zhàn)役將重構(gòu)全球AI算力供應(yīng)鏈的權(quán)力結(jié)構(gòu),并為中國算力產(chǎn)業(yè),帶來寶貴的的時間窗口。

首先,上游產(chǎn)業(yè)鏈將迎來新一輪技術(shù)博弈與訂單爭奪,若“LPU+GPU”的融合架構(gòu)成為主流,將對上游核心元器件產(chǎn)生顛覆性需求。

傳統(tǒng)的HBM需求可能被對更大規(guī)模、更快速度的SRAM需求部分替代或補(bǔ)充,這對三星、SK海力士等存儲巨頭意味著新的技術(shù)路線選擇。

同時,為實現(xiàn)LPU與GPU的高效集成,3D堆疊、CoWoS-L等先進(jìn)封裝技術(shù)的復(fù)雜度與需求將激增,臺積電的產(chǎn)能與技術(shù)領(lǐng)導(dǎo)地位將進(jìn)一步鞏固,但其面臨的產(chǎn)能壓力也將空前巨大。

此外,液冷散熱、高壓供電等基礎(chǔ)設(shè)施的需求標(biāo)準(zhǔn)也將水漲船高,拉動整個數(shù)據(jù)中心硬件產(chǎn)業(yè)鏈升級。

其次,競爭格局將演變?yōu)?ldquo;全棧能力”的終極比拼。

英偉達(dá)的“軟硬結(jié)合”模式,將迫使谷歌、亞馬遜等巨頭加速其從芯片、系統(tǒng)到軟件的全棧自研,競爭維度從單點性能擴(kuò)展到整體解決方案的效率與易用性。

與此同時,這也為聚焦極致場景的創(chuàng)業(yè)公司留下生存縫隙,只要能在某個垂直領(lǐng)域?qū)⒊杀净蛐阅軆?yōu)勢做到極致,仍可在巨頭戰(zhàn)爭的邊緣地帶建立“垂直王國”。

對于中國AI算力產(chǎn)業(yè),英偉達(dá)的困境與轉(zhuǎn)身,則帶來了寶貴的“機(jī)遇期”,市場替代窗口已經(jīng)打開。  

英偉達(dá)高端芯片在中國市場的缺位,為華為昇騰、海光、沐曦、摩爾線程等國產(chǎn)算力企業(yè)提供了練兵場與試錯空間,DeepSeek等領(lǐng)先模型公司與國產(chǎn)芯片的深度合作,是構(gòu)建自主軟硬協(xié)同生態(tài)的關(guān)鍵一步。

國產(chǎn)算力的機(jī)會,或?qū)⑹紫瘸霈F(xiàn)在對尖端制程依賴相對較低、更強(qiáng)調(diào)軟件優(yōu)化和行業(yè)理解的推理側(cè),以及政務(wù)、金融、工業(yè)等特定行業(yè)的模型落地中。

所以,無論英偉達(dá)“諾曼底登陸”成功與否,它都標(biāo)志著一個新時代的開啟:

AI算力的競爭,已從GPU晶體管的堆砌,升維為涵蓋架構(gòu)創(chuàng)新、商業(yè)模式、資本聯(lián)盟與地緣角逐的復(fù)雜系統(tǒng)戰(zhàn)爭。

英偉達(dá)勝負(fù)未分,唯一可以確定的是,這場由巨頭掀起的推理戰(zhàn)爭,必將以更低的成本、更高的效率,加速智能體的普及,催生出一個遠(yuǎn)超你我今日想象的AI原生世界。

本文系作者 超前實驗室 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請注明出處、作者和本文鏈接。
本內(nèi)容來源于鈦媒體鈦度號,文章內(nèi)容僅供參考、交流、學(xué)習(xí),不構(gòu)成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點和發(fā)現(xiàn),點擊這里投稿 。創(chuàng)業(yè)或融資尋求報道,點擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實名制要求,請綁定手機(jī)號后發(fā)表評論

登錄后輸入評論內(nèi)容

快報

更多

2026-03-28 23:01

澤連斯基稱與中東3國達(dá)成防務(wù)合作協(xié)議,涉聯(lián)合生產(chǎn)無人機(jī)

2026-03-28 22:35

山西太原一建筑發(fā)生火災(zāi),已致1人死亡25人受傷

2026-03-28 22:26

王文濤部長發(fā)表書面致辭,支持世貿(mào)組織《電子商務(wù)協(xié)定》達(dá)成臨時實施安排

2026-03-28 21:54

40余家單位聯(lián)盟,中國最大人形機(jī)器人訓(xùn)練基地在京揭牌

2026-03-28 21:41

周鴻祎與劉慈欣在科幻大會預(yù)判:百億智能體或成新物種,AI推動人類文明分化

2026-03-28 21:38

第五代宏光MINIEV上市,售價4.48萬-5.48萬元

2026-03-28 20:42

烏稱伊朗襲擊迪拜倉庫并致烏克蘭人傷亡消息不實

2026-03-28 20:23

3月28日新聞聯(lián)播速覽23條

2026-03-28 20:05

美國務(wù)卿和歐盟官員被曝就烏克蘭問題激烈交鋒

2026-03-28 19:44

“Token”這個詞的搜索量最高一天達(dá)到7.7萬次,比去年日均搜索量高出1850%

2026-03-28 19:39

飛捷科思發(fā)布中國首個可微分物理仿真引擎Fysics

2026-03-28 19:13

“網(wǎng)售產(chǎn)品質(zhì)量安全提升系列行動2026”在北京啟動

2026-03-28 19:03

國務(wù)院食安辦、市場監(jiān)管總局約談相關(guān)地方市級人民政府負(fù)責(zé)人,督辦“3?15”晚會曝光問題整改

2026-03-28 18:44

飛書 CLI 開源:AI 可直連飛書辦公套件

2026-03-28 18:36

馬來西亞說伊朗允許馬滯留油輪通行霍爾木茲海峽

2026-03-28 18:02

今年前三個月中國創(chuàng)新藥對外授權(quán)交易總額超600億美元

2026-03-28 17:39

中國和菲律賓舉行南海問題雙邊磋商機(jī)制第十一次會議

2026-03-28 17:30

印尼正式實施16歲以下社媒禁令,約7000萬人受影響

2026-03-28 17:04

美國加州禁止官員借內(nèi)幕消息在預(yù)測市場牟利

2026-03-28 17:02

北京“超現(xiàn)場”生態(tài)共同體建設(shè)暨全國覆蓋啟動

掃描下載App