圖片系AI生成
英偉達CEO黃仁勛到訪中國,所過之處都是焦點,以至于有些原本的重點“失焦”了。
7月14日,英偉達宣布將恢復 H20 在中國的銷售,并宣布推出面向中國市場的全新且完全兼容的 GPU。H20攫取了絕大多數(shù)的關注,因其直接與大模型訓推相關,且此前被美國市場封禁。
相比之下,黃仁勛推出了一款全新且完全兼容的 NVIDIA RTX PRO GPU,并宣稱該產(chǎn)品“是為智能工廠和物流打造數(shù)字孿生 AI 的理想選擇”, RTX PRO 是專業(yè)領域產(chǎn)品,用戶群相對小眾,因此沒有得到應有的關注。
但在業(yè)內(nèi)人士看來,其重要性被大大低估了,畢竟值得黃仁勛都親自帶貨。據(jù)市場消息,該產(chǎn)品可能命名為RTX PRO 6000 D Blackwell,將于今年三季度啟動供應,到年底的出貨量目標是 100~200 萬片,對應價值約為數(shù)十億到上百億美元,比英偉達此前因H20被禁導致的45億美元資產(chǎn)減值還要多。
這款被H20遮住的RTX Pro,將如何影響市場?
黃仁勛在接受媒體采訪時表示,本周是第三屆國際供應鏈博覽會的開幕,供應鏈涵蓋了機器人、智能工廠等復雜系統(tǒng)。我們推出RTX Pro正是為這些數(shù)字工廠、數(shù)字雙胞胎、機器人等應用場景量身打造的。RTX Pro非常適合教機器人如何成為“機器人”,教智能工廠如何提高效率和質量。因此,本周的博覽會是一個非常合適的時機來宣布這一產(chǎn)品。
他還提到,新的產(chǎn)品RTX Pro專為數(shù)字孿生應用設計。數(shù)字孿生構建的是一個虛擬世界,一個數(shù)字機器人。之所以需要數(shù)字機器人,是因為要通過在數(shù)字世界中訓練,教會實體機器人如何出色完成任務。RTX Pro最初是為運行名為Omniverse的全新應用平臺所打造,該平臺對數(shù)字工廠、智能工廠及機器人等領域至關重要。因此RTX Pro是獨一無二的創(chuàng)新產(chǎn)品,堪稱全球首創(chuàng)。
![]()
“在中國這篇機器人創(chuàng)新如火如荼、智能工廠建設方興未艾、供應鏈體系極其完備的熱土上,RTX Pro必將大放異彩。對此我感到無比振奮。”他說。
正如黃仁勛所言,中國有廣闊且完備的制造業(yè),市場前景足夠誘人,這是英偉達推出RTX Pro的直接原因。
據(jù)IDC預測,2027年中國數(shù)字孿生市場規(guī)模將突破1200億元,年復合增長率達45%。其中,工業(yè)制造(汽車、電子、新能源)占比超60%,僅汽車行業(yè)就有超200家工廠計劃部署英偉達Omniverse數(shù)字孿生系統(tǒng),單廠投入從500萬到2000萬不等。
51WORLD AI平臺技術總監(jiān)王憶源對筆者表示,中國制造業(yè)正加速向“智能工廠”升級,數(shù)字孿生成為核心工具,RTX PRO特性正好匹配中國制造業(yè)升級中的數(shù)字孿生AI需求,工業(yè)制造(如汽車、航空)、建筑設計(BIM)、影視渲染等領域對高性能 GPU 的依賴日益增強,尤其在 AI 與 3D 可視化融合的背景下,RTX PRO 系列持續(xù)獲得穩(wěn)定采購需求。
在AI 應用方面,包括AI 推理、小模型訓練、視頻生成、數(shù)字人、AIGC 等業(yè)務,企業(yè)對具備通用計算能力的顯卡配置關注度顯著上升,RTX PRO 系列恰好滿足這些多樣化、復合型的算力需求。
“當然,作為算力消耗者,我們也比較關注它的價格,更準確的說是性價比。在獲得面向中國市場的全新RTX PRO 顯卡后,會馬上做一手評測,合適的話就可以展開部署,試試這款芯片到底能不能打。”
“我們非常關注這款芯片的落地時間。”王憶源表示,“比如實時渲染能力,支持構建高精度工廠虛擬模型(如生產(chǎn)線、倉儲系統(tǒng)),需強大圖形算力;輕量AI推理:優(yōu)化能耗、預測設備故障等場景無需頂級訓練芯片,RTX PRO的GDDR7顯存(帶寬1.1TB/s)與定制化AI核心正適配此需求。”
英偉達在今年3月的GTC 2025大會上,推出了專為工作站和服務器設計的RTX PRO系列Blackwell專業(yè)顯卡,但此前該產(chǎn)品同樣不被允許出口到中國市場,第三方價格在8萬元左右。
一位算力產(chǎn)業(yè)鏈人士表示,原計劃采購高性能算力卡如H100的用戶正加速向 NVIDIA RTX 系列轉向,進一步推動 RTX PRO 在專業(yè)市場的接受度和采購意愿。
新一代RTX PRO具備NVIDIA 流式多處理器、第四代 RT 核心、第五代 Tensor 核心、更大、更快的 GDDR7 顯存、第九代 NVIDIA NVENC、第六代 NVIDIA NVDEC、第五代 PCIe、DisplayPort 2.1等特性,適合于需要處理大量數(shù)據(jù)、進行高強度計算的專業(yè)領域。
黃仁勛也提到,新的RTX架構基于Blackwell,而之前的RTX架構基于Hopper。實際上,我們稱它為Beta Hopper。這款新GPU不同于H20,它有計算圖形和光線追蹤(Ray tracing)功能。光線追蹤對于傳感器模擬非常重要,比如激光雷達、雷達和計算機圖形學。我們可以模擬數(shù)字工廠中的傳感器,或者自動駕駛汽車中的傳感器,或者機器人身上的傳感器。
“RTX Pro 具備 H20 和其他 AI 產(chǎn)品所不具備的能力,它是一款同時具備計算圖形和 AI 功能的產(chǎn)品,專為數(shù)字雙胞胎設計。在應用中,我們有名為Omniverse的 AI 庫,所有操作都在Omniverse上運行。”他說。
RTX Pro是一款全功能GPU,既能支持圖形也能支持AI,而H20只適合AI計算,但是為了規(guī)避美國制裁風向,RTX PRO通過剝離高帶寬內(nèi)存(HBM)、移除NVLink互聯(lián)技術等敏感模塊,嚴格符合美國出口限制,確保長期對華供應合法性。
![]()
數(shù)字孿生本身也在朝著AI方向發(fā)展,王憶源介紹,以51WORLD的數(shù)字孿生AI平臺CLONOVA為例,核心在于“三維仿真場景”和“空間智能大模型”的結合,因此對芯片有三個方面的需求:
從RTX PRO的性能來看,RTX Cores (光線追蹤核心)專為實時光線追蹤設計,Tensor Cores (張量核心能以極高的效率執(zhí)行大模型的訓練和推理任務,CUDA Cores (統(tǒng)一計算核心)提供強大的通用并行計算能力,可以同時處理圖形渲染管線中的其他任務(如物理模擬、后處理)和AI計算中的輔助任務。
此外,RTX PRO系列顯卡提供了遠超消費級顯卡(如GeForce系列)的大容量顯存。用戶可以在同一時間,將復雜的、城市級別的三維場景和參數(shù)量巨大的數(shù)字孿生AI模型同時加載到一塊GPU顯存中。
這避免了因為顯存不足而頻繁在系統(tǒng)內(nèi)存和顯存之間交換數(shù)據(jù),從而保證了交互的流暢性和實時性。沒有大顯存,要么只能用簡化的場景,要么只能用小模型,數(shù)字孿生AI平臺發(fā)揮將大打折扣。
黃仁勛透露,中國已有數(shù)百個數(shù)字孿生項目基于Omniverse開發(fā),覆蓋汽車工廠、光伏電站等場景。
RTX PRO作為硬件入口,可深度綁定用戶至英偉達生態(tài)。此外,中國150萬CUDA開發(fā)者中,大量人員已熟悉英偉達工具鏈。RTX PRO支持CUDA并行計算,能夠降低工業(yè)AI應用開發(fā)門檻,延續(xù)開發(fā)生態(tài)黏性。
王憶源認為,RTX Pro跟其他芯片一樣,更大的粘性在于軟件生態(tài),包括CUDA以及基于CUDA的各種深度學習庫,Omniverse協(xié)作與仿真平臺,以及基于Omniverse的IsaacSim具身智能仿真平臺。
51WORLD推出了專門面向智能輔助駕駛和機器人的仿真平臺SimOne, 可以作為國內(nèi)的替代品,不過底層也是基于D3D/Vulkan圖形API和CUDA,使用的也是NVIDIA的顯卡。
![]()
圖片系AI生成
如上算力產(chǎn)業(yè)鏈人士提到,從生態(tài)壁壘看,AMD的ROCm和Intel的oneAPI雖然在努力追趕,但在軟件的廣度、深度、成熟度和開發(fā)者社區(qū)規(guī)模上,與CUDA存在差距。絕大多數(shù)AI框架(PyTorch, TensorFlow)、科學計算庫和專業(yè)圖形軟件(Adobe, Autodesk等公司產(chǎn)品)都是優(yōu)先為CUDA進行深度優(yōu)化的。這意味著即使競爭對手的硬件在理論峰值性能上接近,其實際應用性能也往往因為軟件優(yōu)化不足而打折扣。
對于開發(fā)者和企業(yè)來說,選擇RTX PRO意味著極低的學習成本和遷移成本,以及廣泛的軟件兼容性和很高的性能確定性。選擇競爭對手則可能意味著需要投入大量精力去解決軟件兼容性問題、性能優(yōu)化問題,甚至重寫部分代碼,這在商業(yè)應用中是難以接受的。
他還表示,從競品的性能看,偏圖形學的顯卡 (如 AMD Radeon PRO): 在傳統(tǒng)的CAD設計、視頻剪輯、三維建模等領域表現(xiàn)出色。但當用戶需要進行AI模型訓練、AI功能開發(fā)(如AI輔助渲染:深度學習超采樣、AI降噪,生成式內(nèi)容創(chuàng)作:在圖形軟件中直接調用AI模型,生成紋理、3D模型、環(huán)境背景等)時,其AI生態(tài)和硬件性能(缺少成熟的張量核心)就顯得力不從心,導致效率較低或功能無法實現(xiàn)。
偏AI的計算卡 (如一些純AI加速卡,或NVIDIA自家的A100/H100等): 擁有頂級的AI訓練和推理性能,但在圖形輸出和實時渲染方面能力為零或極弱。它們無法直接用于高保真的可視化交互。
對于既有圖形渲染能力,又有AI訓練和推理性能的RTX PRO來說,能為數(shù)字孿生AI提供一個“單卡解決方案”。用戶可以在同一臺工作站、同一個軟件環(huán)境中,無縫地完成從數(shù)據(jù)可視化、AI模型訓練/微調,到最終交互式渲染的全流程。這帶來的總體擁有成本和工作流效率的優(yōu)勢是巨大的。
在數(shù)字孿生領域,國產(chǎn)AI芯片的存在感不足,重視程度需進一步提高。只有全功能的GPU才能滿足數(shù)字孿生領域的需求,也淘汰了不少國產(chǎn)芯片玩家。
但國產(chǎn)芯片也在逐漸發(fā)力,例如摩爾線程,其全功能GPU芯片采用自主研發(fā)的MUSA架構,實現(xiàn)了單芯片架構同時支持 AI 計算加速、圖形渲染、物理仿真和科學計算、超高清視頻編解碼的技術突破。其s專業(yè)圖形加速產(chǎn)品,主要應用于工業(yè)設計、高清視頻編輯、數(shù)字孿生、AI云電腦等場景。
一位制造行業(yè)高管表示,相較于大模型訓推領域,國產(chǎn)芯片都看到并且投入了大量資源,國產(chǎn)芯片在數(shù)字孿生領域的存在感較低,RTX PRO轉向工業(yè)可視化與輕量AI推理,避開國產(chǎn)芯片優(yōu)勢領域,選擇數(shù)字孿生這一有待開發(fā)的藍海市場,也是英偉達有意為之的戰(zhàn)略選擇。
就目前來看,英偉達的產(chǎn)品短期內(nèi)具有不可替代性,它能夠最大程度的發(fā)揮軟件產(chǎn)品在圖形渲染上的性能和質量,以及支撐多并發(fā)多模態(tài)的數(shù)據(jù)融合驅動的任務。
但他也表示,在產(chǎn)品交付和部署的過程中,相關政策鼓勵和支持國產(chǎn)化硬件的替代,部分企業(yè)更希望以國產(chǎn)化的顯卡、芯片等產(chǎn)品實現(xiàn)數(shù)字孿生,但就實際測試效果來看,仍然存在一定性能和質量上的差異。此次RTX Pro的“特供版”有望能很好地平衡這個需求。(本文首發(fā)于鈦媒體APP,作者 | 張帥,編輯 | 蓋虹達)
9月11日-14日由鈦媒體集團、ITValue聯(lián)合主辦的2025 ITValue Summit 數(shù)字價值年會將以「AI落地場景真相」為主題,與新老朋友重聚三亞,并在全年圍繞1場年度演講,5大ToB明星IP持續(xù)內(nèi)容“造血”,設計N個場景的想象空間,打造1本《AI落地場景指南》,一同尋找AI實際落地應用難題背后的“10大真相”,探索數(shù)字經(jīng)濟時代的變革和機遇。(點擊進入了解更多大會報名信息)
同期,2025年度「創(chuàng)新場景 TOP 50」榜單評選征集啟動,可掃碼提交案例。
備注說明:場景案例對應的產(chǎn)品或服務需已實際落地,并具有創(chuàng)新性和示范性。
快報
根據(jù)《網(wǎng)絡安全法》實名制要求,請綁定手機號后發(fā)表評論