亚洲高清无码成人片,经典无码国产视频

收購Groq，其產(chǎn)品首次以“Groq 3 LPX”的身份嵌入英偉達(dá)的推理體系；

拉來Mistral、Perplexity、Cursor等一眾AI公司，組建Nemotron開源模型聯(lián)盟；

自動駕駛方面，比亞迪、吉利、日產(chǎn)、五十鈴接入英偉達(dá)的DRIVE Hyperion平臺，Uber宣布2028年前在28個城市部署英偉達(dá)全棧自動駕駛車隊；

但黃仁勛真正想傳達(dá)的信息，比任何一款產(chǎn)品都大。

他給出了一個數(shù)字：從2025年到2027年，AI芯片的營收將要超過1萬億美元。

黃仁勛說，在AI時代，token是新的貨幣，AI工廠是生產(chǎn)它們的基礎(chǔ)設(shè)施。

接下來，黃仁勛先講訓(xùn)練，再講推理，然后是智能體、物理 AI、機(jī)器人、自動駕駛，層層遞進(jìn)。

每一層都對應(yīng)更大的基礎(chǔ)設(shè)施需求，而如今的英偉達(dá)，每一層都有產(chǎn)品可以賣。

這場keynote看下來不像是一份產(chǎn)品報告，更像一張帝國版圖。

Vera Rubin：七顆芯片，一臺超級計算機(jī)

Vera Rubin是這場發(fā)布會的核心硬件。它由七顆芯片組成：Vera CPU、Rubin GPU、NVLink 6交換芯片、ConnectX-9 SuperNIC、BlueField-4 DPU、Spectrum-6以太網(wǎng)交換芯片，以及新整合的Groq 3 LPU。

這七顆芯片全部投產(chǎn)，設(shè)計目標(biāo)是組成一臺協(xié)同工作的超級計算機(jī)，從大規(guī)模預(yù)訓(xùn)練、后訓(xùn)練、測試時推理擴(kuò)展，到實時的agent推理，這一臺機(jī)器就可以覆蓋AI的所有流程。

核心產(chǎn)品是Vera Rubin NVL72機(jī)架，集成72顆Rubin GPU和36顆Vera CPU，通過NVLink 6互聯(lián)。

黃仁勛稱，相比上一代Blackwell平臺，NVL72訓(xùn)練大型混合專家模型所需的GPU數(shù)量減少到四分之一，推理吞吐量每瓦提升10倍，每token成本降至十分之一。

黃仁勛說，agent的拐點已經(jīng)到來，Vera Rubin正在開啟歷史上最大規(guī)模的基礎(chǔ)設(shè)施建設(shè)。

同時黃仁勛還預(yù)告了Vera Rubin之后的下一代架構(gòu)Kyber，采用垂直插入的計算托盤設(shè)計以提升密度和降低延遲，將搭載在2027年出貨的Vera Rubin Ultra上。

Groq LPU 登場

訓(xùn)練是英偉達(dá)發(fā)家之本，但推理才是接下來真正的戰(zhàn)場。

因為訓(xùn)練只是一次性的重活，推理才是永不停歇的日常。

每一次你向AI提問、每一次你讓AI幫你寫代碼，背后都是推理在運(yùn)轉(zhuǎn)。

黃仁勛提出的方案是把推理拆成兩個階段，分別用不同的芯片來處理。

大語言模型的推理分為兩步：prefill（預(yù)填充）和decode（解碼）。prefill階段處理你輸入的提示詞，屬于計算密集型任務(wù)，GPU擅長這個；decode階段則是逐個生成回答的token，屬于帶寬密集型任務(wù)，需要極高的內(nèi)存讀取速度。

或者我們換一種方式來理解黃仁勛的話，prefill是“讀題”，decode是“寫答案”。讀題可以一目十行并行處理，寫答案只能一個字一個字往外蹦。

LPU全稱Language Processing Unit（語言處理單元），由Groq公司開發(fā)。

這家公司由前谷歌TPU團(tuán)隊成員創(chuàng)立，英偉達(dá)在2025年底以200億美元收購了其核心資產(chǎn)。

每顆Groq 3 LPU內(nèi)置了500MB的SRAM（靜態(tài)隨機(jī)存取存儲器），帶寬達(dá)到150TB/s，是Rubin GPU中HBM帶寬（22TB/s）的近7倍。

SRAM可以理解為芯片內(nèi)部的“超高速緩存”，容量小但速度極快，特別適合decode階段對帶寬的極端需求。

英偉達(dá)將256顆Groq 3 LPU裝進(jìn)一個LPX機(jī)架，與Vera Rubin NVL72機(jī)架并排部署。Rubin GPU負(fù)責(zé)prefill的重計算，Groq LPU負(fù)責(zé)decode的高帶寬輸出。

黃仁勛說，這種組合在萬億參數(shù)模型上能實現(xiàn)每兆瓦推理吞吐量提升35倍。

NemoClaw

黃仁勛在臺上直接點名了Claude Code和OpenClaw，他說Claude Code和OpenClaw引起了agent的拐點。

黃仁勛夸贊OpenClaw，稱OpenClaw向所有人打開了AI的下一個前沿，成為歷史上增長最快的開源項目。Mac和Windows是個人電腦的操作系統(tǒng)，OpenClaw是個人AI的操作系統(tǒng)。這是整個行業(yè)一直在等待的時刻。

NemoClaw是通過NVIDIA Agent Toolkit優(yōu)化過后的OpenClaw，一條命令即可完成安裝。它的核心組件是OpenShell，這是一個提供開源模型和隔離沙箱的環(huán)境，為agent加上基于策略的安全、網(wǎng)絡(luò)和隱私護(hù)欄。

黃仁勛說，OpenShell為OpenClaw提供了下面缺失的基礎(chǔ)設(shè)施層，讓agent在獲得執(zhí)行權(quán)限的同時受到安全約束。

NemoClaw的模型調(diào)度采用混合架構(gòu)：本地運(yùn)行Nemotron等開源模型處理隱私敏感任務(wù)，通過隱私路由器（privacy router）調(diào)用云端前沿模型處理更復(fù)雜的請求。

NemoClaw可以運(yùn)行在GeForce RTX的電腦和筆記本、RTX PRO工作站，以及DGX Station和DGX Spark AI超級計算機(jī)上，提供7×24小時本地計算支持。

Nemotron聯(lián)盟

Nemotron聯(lián)盟是一個全新的合作機(jī)制，首批成員包括Black Forest Labs、Cursor、LangChain、Mistral AI、Perplexity、Reflection AI、Sarvam和Thinking Machines Lab（由前 OpenAI CTO Mira Murati 創(chuàng)立）。

聯(lián)盟的第一個項目是由Mistral AI和英偉達(dá)聯(lián)合訓(xùn)練一個基礎(chǔ)模型，其他成員貢獻(xiàn)數(shù)據(jù)、評估框架和領(lǐng)域?qū)I(yè)知識。模型將在英偉達(dá)DGX Cloud上訓(xùn)練，開源發(fā)布，并成為即將推出的Nemotron 4模型家族的基礎(chǔ)。

黃仁勛的潛臺詞就是，英偉達(dá)希望開源模型生態(tài)繁榮，因為開源模型的用戶最終需要英偉達(dá)的硬件來訓(xùn)練和部署。

一個由多家AI公司共同參與的開源模型聯(lián)盟，既能對抗閉源巨頭的壟斷趨勢，也能確保英偉達(dá)的基礎(chǔ)設(shè)施在開源生態(tài)中保持核心地位。

自動駕駛

比亞迪、吉利、日產(chǎn)、五十鈴宣布采用英偉達(dá)DRIVE Hyperion平臺開發(fā)L4級自動駕駛車輛。

Uber宣布與英偉達(dá)擴(kuò)大合作，計劃到2028年在28個城市、四個大陸部署全棧英偉達(dá)自動駕駛軟件驅(qū)動的自動駕駛車隊，首批城市是洛杉磯和舊金山灣區(qū)，2027年上半年啟動。

L4級自動駕駛意味著車輛在特定條件下可以完全自主駕駛，不需要人類隨時準(zhǔn)備接管。

目前大多數(shù)量產(chǎn)車上的L2級輔助駕駛?cè)匀灰篑{駛員時刻保持注意力，AI只是“輔助”；L4則是AI真正在開車，人類可以不管。

黃仁勛還借此機(jī)會發(fā)布了Alpamayo 1.5，這是一個可交互、可引導(dǎo)的自動駕駛推理模型，能接受視頻、自車運(yùn)動歷史、導(dǎo)航指引和自然語言提示作為輸入，輸出帶有推理鏈的駕駛軌跡。

AI 工廠的數(shù)字孿生

英偉達(dá)推出了DSX Air，一個用于在軟件中模擬AI工廠的SaaS平臺。

黃仁勛前幾年提出過一個叫“數(shù)字孿生”（Digital Twin）的概念，是指在虛擬環(huán)境中創(chuàng)建一個與真實物理系統(tǒng)完全對應(yīng)的數(shù)字副本。

工程師可以在這個虛擬副本上進(jìn)行測試、優(yōu)化和故障排查，而不需要碰真實的硬件。

就像你搬新家之前，先在3D軟件里把家具擺一遍，看看哪里不合適。

只不過這里“搬”的是一整座超大規(guī)模AI數(shù)據(jù)中心。

DSX Air允許客戶在硬件到貨之前，就在模擬環(huán)境中搭建完整的 AI 工廠。

計算、網(wǎng)絡(luò)、存儲、編排、安全，全部按照實際部署方案配置。

CoreWeave已經(jīng)在使用DSX Air來模擬和驗證其AI工廠環(huán)境。

黃仁勛稱，這種方式可以將“從部署到產(chǎn)出第一個token”的時間從數(shù)周甚至數(shù)月縮短到幾天甚至幾小時。

配合DSX Air的是Vera Rubin DSX AI工廠參考設(shè)計和Omniverse DSX藍(lán)圖。

前者是一份關(guān)于如何設(shè)計、建造和運(yùn)營 AI 工廠基礎(chǔ)設(shè)施的完整指南，后者則提供物理精確的數(shù)字孿生能力，用于大規(guī)模 AI 工廠的設(shè)計和仿真。

Cadence、達(dá)索系統(tǒng)、西門子、施耐德電氣等工業(yè)軟件巨頭都在接入這套體系。

黃仁勛還發(fā)布了DSX Max-Q動態(tài)功率分配技術(shù)，稱可在固定電力的數(shù)據(jù)中心內(nèi)多部署30%的AI基礎(chǔ)設(shè)施。

DSX Flex軟件則讓AI工廠成為電網(wǎng)靈活資產(chǎn)，黃仁勛說可以釋放100吉瓦的閑置電網(wǎng)容量。

存儲也要重新發(fā)明

傳統(tǒng)數(shù)據(jù)中心的存儲系統(tǒng)提供大容量通用存儲，但缺乏agent所需的實時響應(yīng)能力。

agent在實際工作中，需要跨多個步驟、工具和會話保持上下文記憶，傳統(tǒng)存儲的延遲會拖慢推理速度、降低GPU利用率。

STX架構(gòu)的首個落地產(chǎn)品是CMX上下文記憶存儲平臺，它在GPU內(nèi)存之外擴(kuò)展了一個高性能上下文層，用于可擴(kuò)展的推理和智能體系統(tǒng)。

黃仁勛稱，與傳統(tǒng)存儲相比，CMX可提供5倍的每秒token吞吐量、4倍的能效提升和2倍的數(shù)據(jù)攝取速度。

CoreWeave、Crusoe、Lambda、Mistral AI、Nebius、Oracle等計劃采用STX用于上下文記憶存儲。Dell、HPE、IBM、NetApp、VAST Data等存儲廠商正在基于STX參考設(shè)計構(gòu)建下一代AI存儲基礎(chǔ)設(shè)施。

DLSS 5：游戲畫面的“GPT 時刻”

黃仁勛在演講中提到，DLSS 5是自2018年推出實時光線追蹤以來最重大的圖形突破。

DLSS全稱Deep Learning Super Sampling（深度學(xué)習(xí)超級采樣），是英偉達(dá)用AI提升游戲畫面質(zhì)量和性能的技術(shù)。

此前的版本主要通過AI放大分辨率和生成中間幀來提升幀率。DLSS 5引入了一個實時神經(jīng)渲染模型，能夠為游戲畫面注入照片級真實的光照和材質(zhì)效果。

簡單來說，以前的DLSS是“讓畫面更流暢”，DLSS 5是“讓畫面更真實”。

它接收游戲每一幀的顏色和運(yùn)動向量作為輸入，用AI模型理解場景中的角色、頭發(fā)、布料、半透明皮膚等復(fù)雜元素，以及正面光、逆光、陰天等環(huán)境光照條件，然后生成視覺上精確的增強(qiáng)圖像。

Bethesda的《星空》《上古卷軸》、CAPCOM的《生化危機(jī)》、育碧的《刺客信條：影）、騰訊、網(wǎng)易等廠商已確認(rèn)支持。

太空計算：最后的邊疆

黃仁勛說，太空計算是最后的邊疆，現(xiàn)如今已經(jīng)到來。

“隨著英偉達(dá)部署衛(wèi)星星座、向更深的太空探索，智能必須存在于數(shù)據(jù)產(chǎn)生的任何地方。太空與地面系統(tǒng)之間的AI處理實現(xiàn)了實時感知、決策和自主運(yùn)行，將軌道數(shù)據(jù)中心變成發(fā)現(xiàn)的工具，將航天器變成自主導(dǎo)航的系統(tǒng)。與我們的合作伙伴一起，我們正在將英偉達(dá)延伸到地球之外——大膽地將智能帶到它從未到達(dá)的地方。”

于是黃仁勛拿出了Space-1 Vera Rubin Module，這是一個面向軌道數(shù)據(jù)中心的計算模塊。

采用緊密集成的CPU-GPU架構(gòu)和高帶寬互聯(lián)，專為尺寸、重量和功耗（SWaP）受限的太空環(huán)境設(shè)計。

黃仁勛稱，相比H100，Space-1在太空推理場景下提供25倍的AI算力提升，能夠在軌道上直接運(yùn)行大語言模型和高級基礎(chǔ)模型，處理來自太空儀器的海量實時數(shù)據(jù)流。

配合Space-1的還有兩款已經(jīng)可用的平臺：IGX Thor和Jetson Orin。

IGX Thor提供工業(yè)級耐久性和功能安全，適合任務(wù)關(guān)鍵型邊緣環(huán)境。

Jetson Orin則是超緊湊、高能效的AI推理模塊，已經(jīng)部署在衛(wèi)星上用于視覺、導(dǎo)航和傳感器數(shù)據(jù)的實時處理。

在地面端，RTX PRO 6000 Blackwell Server Edition GPU用于地理空間情報的大規(guī)模處理，英偉達(dá)稱其分析海量衛(wèi)星圖像檔案的速度是傳統(tǒng)CPU系統(tǒng)的100倍。

快報

2026-03-28 23:01

澤連斯基稱與中東3國達(dá)成防務(wù)合作協(xié)議，涉聯(lián)合生產(chǎn)無人機(jī)

2026-03-28 22:35

山西太原一建筑發(fā)生火災(zāi)，已致1人死亡25人受傷

2026-03-28 22:26

王文濤部長發(fā)表書面致辭，支持世貿(mào)組織《電子商務(wù)協(xié)定》達(dá)成臨時實施安排

2026-03-28 21:54

40余家單位聯(lián)盟，中國最大人形機(jī)器人訓(xùn)練基地在京揭牌

2026-03-28 21:41

周鴻祎與劉慈欣在科幻大會預(yù)判：百億智能體或成新物種，AI推動人類文明分化

2026-03-28 21:38

第五代宏光MINIEV上市，售價4.48萬-5.48萬元

2026-03-28 20:42

烏稱伊朗襲擊迪拜倉庫并致烏克蘭人傷亡消息不實

2026-03-28 20:23

3月28日新聞聯(lián)播速覽23條

2026-03-28 20:05

美國務(wù)卿和歐盟官員被曝就烏克蘭問題激烈交鋒

2026-03-28 19:44

“Token”這個詞的搜索量最高一天達(dá)到7.7萬次，比去年日均搜索量高出1850%

2026-03-28 19:39

飛捷科思發(fā)布中國首個可微分物理仿真引擎Fysics

2026-03-28 19:13

“網(wǎng)售產(chǎn)品質(zhì)量安全提升系列行動2026”在北京啟動

2026-03-28 19:03

國務(wù)院食安辦、市場監(jiān)管總局約談相關(guān)地方市級人民政府負(fù)責(zé)人，督辦“3?15”晚會曝光問題整改

2026-03-28 18:44

飛書 CLI 開源：AI 可直連飛書辦公套件

2026-03-28 18:36

馬來西亞說伊朗允許馬滯留油輪通行霍爾木茲海峽

2026-03-28 18:02

今年前三個月中國創(chuàng)新藥對外授權(quán)交易總額超600億美元

2026-03-28 17:39

中國和菲律賓舉行南海問題雙邊磋商機(jī)制第十一次會議

2026-03-28 17:30

印尼正式實施16歲以下社媒禁令，約7000萬人受影響

2026-03-28 17:04

美國加州禁止官員借內(nèi)幕消息在預(yù)測市場牟利

2026-03-28 17:02

北京“超現(xiàn)場”生態(tài)共同體建設(shè)暨全國覆蓋啟動

Vera Rubin：七顆芯片，一臺超級計算機(jī)

Groq LPU 登場

NemoClaw

Nemotron聯(lián)盟

自動駕駛

AI 工廠的數(shù)字孿生

存儲也要重新發(fā)明

DLSS 5：游戲畫面的“GPT 時刻”

太空計算：最后的邊疆

敬原創(chuàng)，有鈦度，得贊賞

Vera Rubin：七顆芯片，一臺超級計算機(jī)

敬原創(chuàng)，有鈦度，得贊賞