12月6日-7日,2024 T-EDGE創(chuàng)新大會暨鈦媒體財經(jīng)年會在北京市大興區(qū)舉辦,以“ALL-in on Globalization ,ALL-in on AI”為主題,匯聚全球科技和商業(yè)領導者,共同探討人工智能對全球各行業(yè)的巨大影響,以及企業(yè)全球化增長新格局新趨勢。作為鈦媒體集團每年年終舉辦的科技和財經(jīng)領域的頂級盛會,T-EDGE一直代表了鈦媒體在科技與經(jīng)濟前瞻性,以及推動國際創(chuàng)新交流上的高質(zhì)量追求。
12月7日,T-EDGE 全球AI論壇:All-in On AI會議上,商湯科技董事長&CEO徐立博士以“AI 2.0的思考與挑戰(zhàn)”主題,圍繞 AI 大模型發(fā)展背后的算力、模型和應用“三位一體”等話題展開深入演講。
AI的每一次突破,真正能夠改變行業(yè)的,總是伴隨著“超級時刻”的出現(xiàn)。徐立以今年諾貝爾獎這一超級時刻為例,一方面人工智能作為工具助力化學領域?qū)崿F(xiàn)突破;另一方面,物理學作為工具反向推動了AI技術的發(fā)展。他指出,學科作為工具與目標同時被驗證的現(xiàn)象通常需要長時間積累,而這一現(xiàn)象在同一年出現(xiàn),反映了人工智能加速學科交叉迭代的強大力量,也證明了AI技術發(fā)展速度的迅猛。
AI 2.0的下一階段怎么走?徐立認為,“我們正加速構(gòu)建一個全新產(chǎn)業(yè),輸入能源,輸出數(shù)字智能。”今年尤其是下半年,全球發(fā)生了諸多與“AI能源”相關的巨大投入,無論是OpenAI、馬斯克的xAI、或是谷歌、微軟、甲骨文等全球領先科技企業(yè),均在算力板塊進行快速且重量級的布局。
徐立舉例稱,甚至是以善于從第一性原理出發(fā)降本增效而聞名的馬斯克為例,他的公司特斯拉在今年10月發(fā)布的三季報顯示,GPU數(shù)量一年內(nèi)增長了9倍,預計年底將達到9萬塊H100。而近期更是宣布計劃將 Colossus 超算擴大十倍,集成超 100 萬塊 GPU。
這一現(xiàn)象背后的核心原因,就在于尺度定律(Scaling Laws)被發(fā)現(xiàn)并且連續(xù)在大語言模型、跨模態(tài)任務以及慢思考推理中持續(xù)得到驗證,成為AI 2.0的理論基石。
“不管哪個維度的‘尺度定律’,計算資源的投入都是更大的規(guī)模。”在徐立看來,AI 2.0背后的關鍵,還是在于如何進行資源的衡量。通過對LeNet-5、AlexNet和GPT-4三代經(jīng)典模型的數(shù)據(jù)對比,呈現(xiàn)出AI發(fā)展過程中成本結(jié)構(gòu)的巨大變化。從參數(shù)數(shù)量、連接數(shù)量到訓練時間,GPT-4的資源需求已達到數(shù)千倍至百萬倍的增長。
“1.0和2.0最大的差別不在于專用或通用,而差別在于成本結(jié)構(gòu)形成非常大的變化。”假設需要10萬PFlops(每秒所執(zhí)行的浮點運算次數(shù))來做大模型,也就是要每年花費120億美金構(gòu)建基礎設施完成任務,這是一個范式變化。
在這樣的背景下,徐立強調(diào),這不僅是技術優(yōu)化的問題,更是新基礎設施建設的時代命題。未來十年,除了構(gòu)造高階思維鏈數(shù)據(jù),實現(xiàn)真正模型的差異化外,更重要的在于如何進一步優(yōu)化算力成本、形成行業(yè)核心壁壘,這將決定AI的普及速度和商業(yè)化潛力。
相較諸多新創(chuàng)企業(yè),AI 1.0時代十年的摸爬滾打,讓商湯更加清晰地認知到“可持續(xù)”的重要性,在面對AI 2.0的快速變化中更加“老練”。徐立表示,近期公司確立了“大裝置-大模型-應用”的三位一體戰(zhàn)略,助力于解決訓練和推理成本大幅下降、如何用好模型,從而指導下一個階段的算力發(fā)展,賦能AGI的長遠未來。
截至目前,商湯AI大裝置 SenseCore擁有超過 5.4 萬塊 GPU,總算力規(guī)模高達 20000 petaFLOPS(每秒2000億億次浮點運算),能夠支撐超過 20 個千億超大模型同時訓練,并支持萬億參數(shù)大模型的全生命周期生成。去年,商湯成為中國第三大智算服務商,與騰訊、字節(jié)、阿里、百度一同提供 AI 智算服務。
“AI算力本身不止是芯片。事實上,芯片的核心是做軟件,算力的關鍵是做模型。如果不了解模型,光講底層架構(gòu),實際上非常難。”徐立舉例稱,新的MoE(混合專家)架構(gòu)模型的推理效率有差異化能力,如何通過應用驅(qū)動模型,以模型帶動算力的優(yōu)化,并最終提升算力資源的使用效率,這種“三位一體”是商湯科技在做算力、模型、應用層面的思考。面向AI 2.0時代,商湯致力于成為最懂算力的大模型服務商,和最懂大模型的算力服務商。
徐立指出,2025年將成為“數(shù)據(jù)中心之年”。AI基礎設施建設將以更高效、更普惠的方式推動社會進步。通過不斷突破技術與認知的邊界,AI將助力人類探索更多未知的可能性。
(本文首發(fā)于鈦媒體App,作者|林志佳,編輯|胡潤峰)
![]()
快報
根據(jù)《網(wǎng)絡安全法》實名制要求,請綁定手機號后發(fā)表評論