![]()
圖片來源:unsplash
年底,AI芯片領(lǐng)域的競爭愈發(fā)激烈。繼11月,谷歌發(fā)布自研TPU,引發(fā)市場廣泛關(guān)注,英偉達(dá)隨即入股新思科技加碼推廣自身GPU后,亞馬遜剛發(fā)布的新產(chǎn)品,也很有可能成為攪動市場的另一極。
美國時(shí)間12月2日,在拉斯維加斯舉辦的亞馬遜云科技re:Invent全球大會上,亞馬遜正式推出了新一代自研AI芯片Trainium 3。這是亞馬遜首款3nm制程的AI芯片,由臺積電代工生產(chǎn)。
根據(jù)亞馬遜AWS首席執(zhí)行官馬特·加曼(Matt Garman)的介紹,Trainium 3的計(jì)算能力較之Trainium 2大幅提升,是在當(dāng)前的人工智能浪潮中,專為滿足下一代生成式AI工作負(fù)載的高性能需求而設(shè)計(jì)打造的,能夠幫助客戶更快地建立更大的模型,并在部署模型時(shí)提供卓越的效能。
AWS方面同時(shí)拿出了集成144顆新一代芯片的Trainium3 UltraServer服務(wù)器。該公司給出的數(shù)據(jù)顯示,新服務(wù)器的計(jì)算能力是上一代產(chǎn)品的4.4倍,內(nèi)存帶寬是上一代產(chǎn)品的4倍,能夠?qū)⒛苄嵘?0%,同時(shí)大幅提高了產(chǎn)品部署能力上限,通過服務(wù)器之間的互聯(lián)互通,最多能部署多達(dá)百萬顆Trainium 3芯片,將此前的天花板提高了10倍。
從AWS披露的數(shù)據(jù)來看,Trainium 3的產(chǎn)品性能是更新?lián)Q代級別的存在,但市場更關(guān)注的,還是其與占據(jù)絕對主導(dǎo)地位的英偉達(dá)和正在崛起的谷歌之間的比較。
不過,AWS方面拒絕直接就其新一代芯片的性能與英偉達(dá)、谷歌進(jìn)行對比,沒有提供太多相關(guān)信息。
Barron's等提到,從內(nèi)存來看,每顆Trainium 3集成了144GB高帶寬內(nèi)存,而谷歌最新TPU是192GB,英偉達(dá)最新的Blackwell GB30更是高達(dá)288GB,同時(shí),性能更強(qiáng)的英偉達(dá)超級新品Rubin也即將走向市場。
從這方面來看,目前幾大巨頭之間的芯片在性能上仍有明顯差距。
科技媒體IMPLICATOR.ai撰文指出,與英偉達(dá)的GPU不同,亞馬遜的Trainium芯片是專為在AWS云服務(wù)中訓(xùn)練和運(yùn)行大模型而設(shè)計(jì)的定制化AI芯片,會針對AWS的云基礎(chǔ)設(shè)施和Bedrock平臺進(jìn)行針對性優(yōu)化。
AWS也在官方新聞中,著重強(qiáng)調(diào)了專用芯片的“性價(jià)比優(yōu)勢”,稱與同等GPU系統(tǒng)相比,Trainium在相關(guān)場景中可以將訓(xùn)練和推理成本降低50%。
實(shí)際上,谷歌的TPU是專為加速機(jī)器學(xué)習(xí)和深度學(xué)習(xí)任務(wù)而設(shè)計(jì)的。英偉達(dá)在這些競爭者冒頭時(shí)曾發(fā)聲表示,公司的產(chǎn)品領(lǐng)先業(yè)界一代,是唯一能夠運(yùn)行所有AI模型并應(yīng)用于計(jì)算場景的平臺。
與專為特定AI框架或功能設(shè)計(jì)的產(chǎn)品相比,英偉達(dá)芯片提供了更高的性能、多功能性和可互換性。
就在亞馬遜發(fā)布新品的同一時(shí)間,英偉達(dá)首席財(cái)務(wù)官科萊特·克雷斯(Colette Kress)在瑞銀全球技術(shù)與AI大會上表示,其他芯片競品絕無可能動搖英偉達(dá)的地位。
她還表示,英偉達(dá)的護(hù)城河不只芯片,而是標(biāo)準(zhǔn)和生態(tài),所有模型都運(yùn)行在英偉達(dá)的平臺上,市場地位非常穩(wěn)固。
不過,相較于競爭關(guān)系,亞馬遜與英偉達(dá)的合作同樣值得關(guān)注。
大會期間,AWS與英偉達(dá)共同宣布,前者將在下一代芯片Trainium 4中使用后者的NVLink Fusion技術(shù)。
該技術(shù)能夠?qū)崿F(xiàn)不同類型芯片之間的高速連接,以及不同服務(wù)器之間的快速通信。芯片領(lǐng)域的頭部企業(yè)英特爾、高通都是使用者。
通過引入該技術(shù),AWS得以構(gòu)建規(guī)模更大、適用性更強(qiáng)的AI服務(wù)器,進(jìn)一步提高互聯(lián)互通能力,再次推高部署能力的上限,幫助客戶更好地訓(xùn)練大模型。
IMPLICATOR.ai的文章分析稱,相較于“打不過就加入”,AWS引入英偉達(dá)技術(shù)更類似一種引流策略,在無法快速實(shí)現(xiàn)芯片替代的情況下,這種合作能夠幫助那些依賴英偉達(dá)工作負(fù)載的企業(yè)更輕松地逐步遷移到Trainium基礎(chǔ)設(shè)施中。
英偉達(dá)CEO黃仁勛則表示,英偉達(dá)和AWS將攜手打造AI產(chǎn)業(yè)革命的計(jì)算架構(gòu),加速世界邁向智能化的道路。
令人好奇的是,誰成為亞馬遜新AI芯片第一批擁躉?
亞馬遜強(qiáng)調(diào),新一代的芯片和服務(wù)器都是為了讓云服務(wù)客戶能以更低成本享受更好的服務(wù),訓(xùn)練出質(zhì)量更高的大模型來實(shí)現(xiàn)自身的AI雄心。
事實(shí)上,除了自用外,Trainium 3目前的市場前景仍然成疑。
以往,Trainium的主要客戶是Anthropic、理光(Ricoh)等公司,用戶基礎(chǔ)本就不多。其中,Anthropic一直是最大客戶。實(shí)際上,AWS方面此前就曾表示,計(jì)劃在今年底之前向Anthropic提供100萬個(gè)Trainium芯片。
摩根大通分析師道格?安穆斯(Doug Anmuth)稱,考慮到亞馬遜對Anthropic的投資及兩者歷來的緊密關(guān)系,Trainium最新芯片預(yù)計(jì)仍會首先供應(yīng)這家打造出了Claude的公司。
未來,只要電力等供應(yīng)充足,AWS可以在新的服務(wù)器上復(fù)制為Anthropic打造的架構(gòu),吸引其他大型客戶,讓自己的芯片被更廣泛地使用。
不過,就算是Anthropic,這家公司對芯片也有多種選擇。除了英偉達(dá)的主流產(chǎn)品,該公司去年還曾表示與谷歌達(dá)成協(xié)議,將采購后者100萬顆TPU芯片。
另外,在今年的re:Invent大會中,AWS還發(fā)布了包括推理模型、語音模型、純文本模型在內(nèi)的Nova 2系列模型,并推出了“開放式訓(xùn)練”服務(wù)Nova Forge,允許使用者在訓(xùn)練的各階段注入自己的數(shù)據(jù),支持更多行業(yè)為特定知識定制大模型,同時(shí)通過Nova Act進(jìn)軍代理服務(wù)市場,幫助使用者構(gòu)建自動化網(wǎng)頁操作智能體。
從基礎(chǔ)設(shè)施、自研芯片,再到大模型、代理服務(wù),這家云服務(wù)巨頭已愈發(fā)凸顯出全面押注AI垂直一體化的趨勢。
而資本市場還無法明確判斷該公司相關(guān)戰(zhàn)略的前景。12月2日亞馬遜股價(jià)收盤微漲0.23%,今年以來漲幅為6.85%,在“美股科技七巨頭”中與特斯拉相近,低于其他公司。(作者|胡珈萌,編輯|李程程)

快報(bào)
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請綁定手機(jī)號后發(fā)表評論