Grok 3的實(shí)力也的確證明了,在當(dāng)下這個(gè)時(shí)期,砸錢(qián)是一種巨大的優(yōu)勢(shì)。這一波Grok 3有滿血和mini兩個(gè)版本,在數(shù)學(xué)、科學(xué)、代碼等數(shù)據(jù)集上表現(xiàn)均超過(guò)了GPT-4o、DeepSeek-V3等非推理模型。
![]()
Grok-3 mini的性能基本上領(lǐng)先或媲美其他閉源/開(kāi)源模型。在著名大模型LMSYS Arena排行榜中,Grok-3刷榜,Elo評(píng)分超1400位列最高,沒(méi)有任何一個(gè)模型能與之相比,堪稱斷層式領(lǐng)先。
![]()
xAI團(tuán)隊(duì)還展示了Grok 3如何執(zhí)行有趣的任務(wù)。例如計(jì)算從地球到火星的航天器任務(wù)。Grok 3 生成了一張?zhí)瞻l(fā)射的動(dòng)畫(huà) 3D 軌跡圖(即從地球到火星然后再返回地球的可行軌跡)。這涉及一些復(fù)雜的物理知識(shí),Grok 3需要理解這些內(nèi)容。
![]()
Grok 3還展示了在自動(dòng)化游戲開(kāi)發(fā)方面的潛力。xAI團(tuán)隊(duì)要求Grok 3現(xiàn)場(chǎng)創(chuàng)造一款融合《俄羅斯方塊》和《寶石迷陣》的新游戲。Grok 3生成的Python腳本定義了游戲的常量、顏色、方塊形狀等元素,并呈現(xiàn)出獨(dú)特玩法:當(dāng)連接了至少三個(gè)相同顏色的方塊時(shí),會(huì)觸發(fā)重力機(jī)制使方塊消除,這種方式類似《寶石迷陣》。
此外,Grok 3包含一個(gè)名為Big Brain的功能,這是一個(gè)推理模型模式,允許在處理查詢時(shí)進(jìn)行更深入的思考。馬斯克指出,17個(gè)月前,最初的Grok模型幾乎不能解決高中問(wèn)題,而現(xiàn)在它已經(jīng)進(jìn)步了很多,他幽默地比喻“Grok已經(jīng)準(zhǔn)備好上大學(xué)了”。
眾所周知,DeepSeek通過(guò)獨(dú)特的算法優(yōu)化、架構(gòu)設(shè)計(jì)以及高效的資源利用方式,大幅降低了對(duì)英偉達(dá)高端GPU的依賴。這也致使英偉達(dá)股價(jià)暴跌16.97%,市值單日蒸發(fā)約5926.58億美元。
![]()
DeepSeek聲稱其模型訓(xùn)練成本僅為同類模型的1/5至1/10,這意味著其在擺脫英偉達(dá)硬件束縛的情況下,仍然在推理性能等方面都表現(xiàn)出與ChatGPT-o1接近的能力,部分領(lǐng)域還有所超越。
反觀馬斯克的Grok 3不僅砸進(jìn)去20萬(wàn)塊GPU,更是為了盡快推出Grok 3,在短短四個(gè)月內(nèi)建成數(shù)據(jù)中心。如此巨大的投入換來(lái)的也僅僅只是lmArena 排行榜中41分的提升,這真的值嗎?
![]()
事實(shí)上,馬斯克瘋狂砸錢(qián)的舉動(dòng)或許有著提前布局的考量。當(dāng)下,任何AI的訓(xùn)練都離不開(kāi)GPU,只不過(guò)DeepSeek走的是“精算師路線”——通過(guò)算法優(yōu)化,用行業(yè)1/10的成本實(shí)現(xiàn)90%的性能。而馬斯克的20萬(wàn)塊GPU不僅是為了快速推出Grok 3,更可能是為了后續(xù)依舊保持快速迭代的選擇。
誠(chéng)然,馬斯克的Grok 3的確超越了DeepSeek,但似乎更像是一個(gè)加強(qiáng)版,而非大跨度的領(lǐng)先。我們期待看到未來(lái)DeepSeek依舊能夠憑借超高的“性價(jià)比”再度震驚世界。
快報(bào)
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論
大模型發(fā)展路徑多樣,性能與成本平衡是企業(yè)關(guān)鍵考量
Grok 3靠大量GPU堆出高性能,展示砸錢(qián)在AI研發(fā)中的作用。
Grok 3領(lǐng)先但未大幅超越,反映大模型競(jìng)爭(zhēng)格局短期內(nèi)穩(wěn)定。
DeepSeek性價(jià)比高,其技術(shù)路線為大模型發(fā)展提供新方向。
馬斯克的布局或影響AI發(fā)展節(jié)奏,加速行業(yè)迭代與競(jìng)爭(zhēng)。