AI 分為訓(xùn)練與推理兩大環(huán)節(jié)。

訓(xùn)練如同“學(xué)生學(xué)習(xí)知識(shí)”,需海量數(shù)據(jù)和超強(qiáng)算力;推理則像“學(xué)生考試答題”,要求快速響應(yīng)現(xiàn)實(shí)問題。隨著AI應(yīng)用場(chǎng)景的普及,推理算力需求不斷提升,據(jù)IDC數(shù)據(jù)顯示,2022年云端推理算力占比已達(dá)58.5%,預(yù)計(jì)2026年將升至62.2%。

如今,一家上市公司在11年間研發(fā)端側(cè)AI芯片之后,選擇發(fā)力大模型推理算力。

7月25日消息,2025年世界人工智能大會(huì)(WAIC)前夕,AI上市公司云天勵(lì)飛(688343.SH)對(duì)外發(fā)布深穹Edge200芯片,以及全新深穹X6000 Mesh推理計(jì)算卡等產(chǎn)品。

據(jù)悉,深穹X6000 Mesh推理加速卡的算力達(dá)256Tops,主要定位于AI推理計(jì)算,支持30fps的1080p 256路的視頻解碼,可實(shí)現(xiàn)千億參數(shù)大模型推理應(yīng)用。

同時(shí),基于深穹X6000 Mesh加速卡,云天勵(lì)飛提供深目6203視頻高密2U推理一體機(jī)、天舟6408大模型4U推理一體機(jī),以及天舟680G大模型滿血版8U推理一體機(jī)等產(chǎn)品,最高可達(dá)4PFlops(每秒執(zhí)行4千萬億次浮點(diǎn)運(yùn)算)推理算力,助力AI模型商業(yè)落地。

云天勵(lì)飛董事長兼CEO陳寧對(duì)筆者表示,公司全面聚焦AI推理芯片。2025年是AI發(fā)展的重要轉(zhuǎn)折點(diǎn),大模型技術(shù)不斷成熟,模型調(diào)用成本顯著降低。同時(shí),當(dāng)前AI推理芯片市場(chǎng)仍處于藍(lán)海階段,其市場(chǎng)規(guī)模相較于數(shù)千億美元的訓(xùn)練芯片市場(chǎng)尚顯微小,但預(yù)計(jì)未來三至五年內(nèi),AI推理芯片的增長速度將大幅超越訓(xùn)練芯片。這不僅意味著AI從訓(xùn)練時(shí)代邁入推理時(shí)代,也預(yù)示推理算力需求將迎來爆發(fā)式增長。

陳寧稱,未來五年(2030年),AI將重塑所有機(jī)器人、AI眼鏡等終端硬件產(chǎn)品,推理算力網(wǎng)絡(luò)將無處不在。而作為底層算力設(shè)施,AI推理芯片將貫穿端、邊、云,形成無處不在算力網(wǎng)絡(luò),從而讓各類Agent能夠服務(wù)人類的工作和生活。

陳寧強(qiáng)調(diào),未來云端推理算力會(huì)率先迎來爆發(fā),并不斷探索新的應(yīng)用場(chǎng)景。一旦新場(chǎng)景通過云服務(wù)形成價(jià)值閉環(huán),實(shí)現(xiàn)從1到100的大規(guī)模復(fù)制,同時(shí)在性價(jià)比提升、成本降低上取得突破,市場(chǎng)就有望向更大規(guī)模的邊緣推理計(jì)算拓展。最終,必然會(huì)形成終端、邊緣、云端全棧式的協(xié)同分工模式,推動(dòng)AI大規(guī)模落地并具備最優(yōu)的性價(jià)比。

研發(fā)11年NPU之后,這次為何要發(fā)力模型推理算力卡?

云天勵(lì)飛成立于2014年,擁有大模型和AI芯片兩大技術(shù)平臺(tái),打造了面向消費(fèi)級(jí)、企業(yè)級(jí)、行業(yè)級(jí)三大類場(chǎng)景的業(yè)務(wù)。

2023年,云天勵(lì)飛成功在上交所科創(chuàng)板上市,曾一度被稱為“深圳AI第一股”。

技術(shù)方面,云天勵(lì)飛自研“算力積木”架構(gòu),以及神經(jīng)網(wǎng)絡(luò)處理器核心IP和芯片,聚焦大模型高效推理,為AI的普惠應(yīng)用提供算力支撐,滿足多樣化應(yīng)用場(chǎng)景對(duì)AI算力的需求。

早在2020年,云天勵(lì)飛全面轉(zhuǎn)向國產(chǎn)工藝,成為首家采用國產(chǎn)Chiplet工藝的AI芯片公司。

2023年,云天勵(lì)飛正式發(fā)布基于“算力積木”架構(gòu)打造的DeepEdge10芯片平臺(tái),并推出DeepEdge10C、DeepEdge10標(biāo)準(zhǔn)版、DeepEdge10Max和DeepEdge200四款芯片,提供算力范圍覆蓋8T至256T,可滿足從小型邊緣設(shè)備到智算中心高性能計(jì)算的需求。

2025年初,云天勵(lì)飛提供部署DeepSeek-R1全尺寸模型的大模型訓(xùn)推一體機(jī)。

經(jīng)過11年發(fā)展,云天勵(lì)飛已經(jīng)推出五代NPU(神經(jīng)網(wǎng)絡(luò)芯片),并推出產(chǎn)品矩陣。

其中,DeepEdge10芯片平臺(tái)已成功適配DeepSeek系列模型、QwQ-32B模型及國產(chǎn)鴻蒙操作系統(tǒng),可為客戶提供全國產(chǎn)的軟硬一體化產(chǎn)品和解決方案?;谧匝?AI 推理芯片,云天勵(lì)飛聯(lián)合生態(tài)合作伙伴推出面向云、邊、端的 AI 推理產(chǎn)品系列,包括模組、邊緣智能盒子、AI 推理加速卡、大模型推理一體機(jī),以及智算服務(wù)器等。

隨著AI熱潮興起,云天勵(lì)飛業(yè)績持續(xù)向好。財(cái)報(bào)顯示,2024年,云天勵(lì)飛營業(yè)收入超9億元,同比增長81.3%。截至2025年第一季度,公司營收2.64億元,同比大增168.23%,創(chuàng)歷史同期新高。

今年上半年,云天勵(lì)飛公司與德元方惠簽署的約4000PFLOPS的AI訓(xùn)練及推理異構(gòu)算力服務(wù)協(xié)議(預(yù)計(jì)未來3年貢獻(xiàn)約16億營收)已于2025年4月完成全部驗(yàn)收工作并開始回款,預(yù)計(jì)上半年將貢獻(xiàn)約2億元營收;天府智算中心項(xiàng)目收益層面,公司已完成天府智算中心的交付,并于2024年第四季度確認(rèn)相關(guān)收入。

消費(fèi)級(jí)業(yè)務(wù)方面,2024年,云天勵(lì)飛消費(fèi)級(jí)場(chǎng)景業(yè)務(wù)通過岍丞技術(shù)的智能穿戴設(shè)備(已進(jìn)入華為、榮耀、OPPO等供應(yīng)鏈)和嚕咔博士的AI硬件產(chǎn)品線,預(yù)計(jì)2025年上半年消費(fèi)級(jí)業(yè)務(wù)將保持50%以上增速。

如今,研發(fā)11年NPU之后,云天勵(lì)飛再進(jìn)一步,全面發(fā)力大模型推理算力,發(fā)布針對(duì)于推理算力的AI芯片以及算力卡,布局一體機(jī)、智算中心等方案,產(chǎn)品將廣泛應(yīng)用于智算中心、智慧城市和具身智能等領(lǐng)域。

對(duì)于為何從邊緣AI計(jì)算戰(zhàn)略,轉(zhuǎn)變?yōu)锳I模型推理算力,陳寧表示,美國絕大部分90%以上的科技發(fā)明停留在實(shí)驗(yàn)室里面,但對(duì)于中國,AI推理芯片則是推動(dòng)AI產(chǎn)業(yè)大規(guī)模落地的關(guān)鍵領(lǐng)域和關(guān)鍵技術(shù),中國一定要把握新機(jī)遇。

他提到,未來五年,大模型、算法和推理芯片為核心的AI技術(shù)將重新定義人類所有的電子產(chǎn)品;未來五到十年,以推理芯片為核心的AI算力網(wǎng)絡(luò)會(huì)無處不在。

“這種戰(zhàn)略轉(zhuǎn)變?cè)从贏I產(chǎn)業(yè)的發(fā)展:2014 至 2022 年小模型時(shí)代,需開發(fā)邊緣 AI 芯片解決細(xì)分場(chǎng)景問題,形成‘行業(yè)+AI’模式;2022年11月后,大模型重塑格局,推動(dòng)AI+行業(yè),催生消費(fèi)類與企業(yè)級(jí)新賽道,產(chǎn)業(yè)進(jìn)入行業(yè)AI、企業(yè)AI、消費(fèi)者 AI并行階段。我們持續(xù)跟蹤技術(shù),2023 年推出兼容大模型部署的‘算力積木’,快速升級(jí)戰(zhàn)略聚焦 AI 推理芯片,經(jīng)過兩年多儲(chǔ)備,今年正式提出打造該領(lǐng)域領(lǐng)軍企業(yè)的核心戰(zhàn)略。”

“中國和歐美之間最大的差異,在于我們(中國)擁有人口的紅利,擁有更加豐富的應(yīng)用場(chǎng)景,這樣一個(gè)背景之下,云天勵(lì)飛是2014年我?guī)ьI(lǐng)一支海歸技術(shù)團(tuán)隊(duì)回到深圳創(chuàng)立了一家中國的AI推理芯片企業(yè)。如今,我們打造了一條應(yīng)用生產(chǎn)數(shù)據(jù),數(shù)據(jù)訓(xùn)練算法,算法定義芯片,芯片規(guī)?;瘧?yīng)用的數(shù)據(jù)飛輪,通過應(yīng)用數(shù)據(jù)算法芯片這樣一個(gè)數(shù)據(jù)飛輪,依托中國豐富的應(yīng)用場(chǎng)景,不斷推動(dòng)著AI算法和大算力推理芯片技術(shù)發(fā)展動(dòng)力。我們堅(jiān)信,云天勵(lì)飛會(huì)進(jìn)一步加大在AI推理芯片領(lǐng)域的研發(fā)和投入,抓住這樣一個(gè)市場(chǎng)的機(jī)遇,尤其未來五年AI智能體應(yīng)用的爆發(fā),帶來國產(chǎn)AI推理芯片和算力市場(chǎng)機(jī)遇,推動(dòng)中國搶占第四次工業(yè)革命的第一張入場(chǎng)券。”陳寧稱。

具體來說,相比其他算力卡,云天勵(lì)飛深穹X6000 Mesh加速卡有以下核心技術(shù)特點(diǎn):

陳寧對(duì)筆者表示,目前基于深穹X6000 Mesh推理加速卡的推理一體機(jī)正逐步量產(chǎn)落地。另外,云天勵(lì)飛在智算中心中也有布局。“智算中心會(huì)有四類客戶:城市級(jí)參與的智算中心建設(shè),科研院所對(duì)國產(chǎn)芯片需求,運(yùn)營商以及互聯(lián)網(wǎng)大廠,他們都在各地建設(shè)智算中心,這里面我們都有布局。”

陳寧強(qiáng)調(diào),DeepSeek一體機(jī)的本質(zhì)在于,打破各個(gè)行業(yè)最后一公里的AI應(yīng)用閉環(huán)。如今熱潮消退,并不一定代表一體機(jī)的“退場(chǎng)”,而是大家理性思考如何把一體機(jī)真正做到應(yīng)用閉環(huán)。他認(rèn)為,未來很長一段時(shí)間,一體機(jī)和云端推理集群將并行發(fā)展。

AI算力需求每年增超80%,云天下一代AI芯片2026年推出

2025年,隨著DeepSeek等開源模型大幅降低企業(yè)使用門檻,推理算力成本不斷降低,以及從智能客服到自動(dòng)駕駛的AI應(yīng)用快速擴(kuò)展,推理算力需求也不斷增長。

今年6月,AMD CEO蘇姿豐(Lisa Su)表示,去年AMD預(yù)測(cè),到2028年,全球數(shù)據(jù)中心 AI 加速芯片規(guī)模達(dá)到5000億美元,年增長速度超過60%。而如今隨著推理模型的興起,這個(gè)數(shù)字甚至更高。

蘇姿豐稱,未來幾年,AI 推理算力需求預(yù)計(jì)將每年增長超過80%,有望超過訓(xùn)練成為數(shù)據(jù)中心計(jì)算的主要驅(qū)動(dòng)力。

顯然,AI推理算力需求正加速增長。

陳寧也同意這一觀點(diǎn)。他認(rèn)為,AI訓(xùn)練是一個(gè)確定性市場(chǎng),英偉達(dá)已經(jīng)定義這一市場(chǎng),但推理方面,云天勵(lì)飛從創(chuàng)業(yè)之初堅(jiān)定不移定義AI推理,最近兩年很多企業(yè)正在從訓(xùn)練市場(chǎng)逐步轉(zhuǎn)型到訓(xùn)推一體的市場(chǎng),探索未來推理成長空間,但這一過程中,“我們認(rèn)為云天勵(lì)飛有些差異化競(jìng)爭(zhēng)力”。

針對(duì)于下一代“算力積木”架構(gòu)和AI推理芯片進(jìn)展,云天勵(lì)飛CTO李愛軍透露有五個(gè)方面的重要升級(jí):

李愛軍表示,第二代“算力積木”通過上述五個(gè)創(chuàng)新,打造新型大模型推理計(jì)算平臺(tái),滿足嵌入式物聯(lián)網(wǎng)、邊緣端、云推理對(duì)邊緣大模型、MoE大模型的極致推理效率、能效比、性價(jià)比需求。

據(jù)悉,基于第二代“算力積木”架構(gòu)的云天勵(lì)飛下一代AI推理芯片,預(yù)計(jì)將于2026年底陸續(xù)推出,包括深界、深擎、深穹三個(gè)系列將分別推出相應(yīng)的產(chǎn)品;到2028年,云天勵(lì)飛會(huì)推出第三代“算力積木”。

對(duì)于下半年業(yè)績預(yù)期和國產(chǎn)芯片發(fā)展,陳寧表示,基于AI推理算法、算力和AI應(yīng)用需求增長,公司相信會(huì)繼續(xù)保持一個(gè)高速增長趨勢(shì)。同時(shí),云天勵(lì)飛用五年的時(shí)間迎接機(jī)遇和挑戰(zhàn),如今已實(shí)現(xiàn)全面國產(chǎn)芯片的商用量產(chǎn)。

陳寧表示,作為一家國產(chǎn)AI芯片公司,確實(shí)是面臨著巨大的挑戰(zhàn),主要是起步晚、生態(tài)不完善、國際復(fù)雜環(huán)境等一系列挑戰(zhàn),但很多機(jī)遇其實(shí)都是在挑戰(zhàn)之下的。云天勵(lì)飛一直在做基于矩陣類的并行計(jì)算芯片,團(tuán)隊(duì)有這樣一個(gè)基因、決心和信念,可以克服各種挑戰(zhàn)。同時(shí),云天勵(lì)飛持續(xù)擁抱國產(chǎn)工藝,擁有市場(chǎng)差異化競(jìng)爭(zhēng)優(yōu)勢(shì)。

“國產(chǎn)芯片公司最核心的‘財(cái)富’,其實(shí)就是你的團(tuán)隊(duì),只要有了這個(gè)團(tuán)隊(duì),這些問題我相信都可以解決。”陳寧稱。(本文首發(fā)于鈦媒體App,作者|林志佳,編輯|蓋虹達(dá))

本文系作者 林志佳 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請(qǐng)注明出處、作者和本文鏈接
本內(nèi)容來源于鈦媒體鈦度號(hào),文章內(nèi)容僅供參考、交流、學(xué)習(xí),不構(gòu)成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點(diǎn)和發(fā)現(xiàn),點(diǎn)擊這里投稿 。創(chuàng)業(yè)或融資尋求報(bào)道,點(diǎn)擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評(píng)論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論

請(qǐng) 登錄后輸入評(píng)論內(nèi)容
  • 陳寧對(duì)下半年有信心,看來訂單不少啊。

    回復(fù) 2025.07.26 · via h5
  • 推理芯片成藍(lán)海,就看誰能先搶占市場(chǎng)了。

    回復(fù) 2025.07.26 · via pc
  • 邊緣推理計(jì)算之后會(huì)火,云天勵(lì)飛提前布局了。

    回復(fù) 2025.07.26 · via h5
  • 云天勵(lì)飛從端側(cè)芯片轉(zhuǎn)向推理算力,這步轉(zhuǎn)型夠及時(shí)的。

    回復(fù) 2025.07.26 · via android
  • 下一代芯片 2026 年底出,還有五個(gè)大升級(jí),期待。

    回復(fù) 2025.07.26 · via iphone
  • 智算中心布局加上推理產(chǎn)品,業(yè)務(wù)夠全的。

    回復(fù) 2025.07.26 · via iphone
  • 千億參數(shù)模型推理,對(duì)算力要求真不是一般高。

    回復(fù) 2025.07.26 · via iphone
  • 國產(chǎn)芯片的競(jìng)爭(zhēng)優(yōu)勢(shì),就看性價(jià)比和適配了。

    回復(fù) 2025.07.26 · via android
  • 推理算力網(wǎng)絡(luò)無處不在,這場(chǎng)景想想就帶勁。

    回復(fù) 2025.07.26 · via android
  • 邊緣到云端推理協(xié)同,這全棧模式挺有想法。

    回復(fù) 2025.07.26 · via android
更多評(píng)論

快報(bào)

更多

2026-03-28 23:01

澤連斯基稱與中東3國達(dá)成防務(wù)合作協(xié)議,涉聯(lián)合生產(chǎn)無人機(jī)

2026-03-28 22:35

山西太原一建筑發(fā)生火災(zāi),已致1人死亡25人受傷

2026-03-28 22:26

王文濤部長發(fā)表書面致辭,支持世貿(mào)組織《電子商務(wù)協(xié)定》達(dá)成臨時(shí)實(shí)施安排

2026-03-28 21:54

40余家單位聯(lián)盟,中國最大人形機(jī)器人訓(xùn)練基地在京揭牌

2026-03-28 21:41

周鴻祎與劉慈欣在科幻大會(huì)預(yù)判:百億智能體或成新物種,AI推動(dòng)人類文明分化

2026-03-28 21:38

第五代宏光MINIEV上市,售價(jià)4.48萬-5.48萬元

2026-03-28 20:42

烏稱伊朗襲擊迪拜倉庫并致烏克蘭人傷亡消息不實(shí)

2026-03-28 20:23

3月28日新聞聯(lián)播速覽23條

2026-03-28 20:05

美國務(wù)卿和歐盟官員被曝就烏克蘭問題激烈交鋒

2026-03-28 19:44

“Token”這個(gè)詞的搜索量最高一天達(dá)到7.7萬次,比去年日均搜索量高出1850%

2026-03-28 19:39

飛捷科思發(fā)布中國首個(gè)可微分物理仿真引擎Fysics

2026-03-28 19:13

“網(wǎng)售產(chǎn)品質(zhì)量安全提升系列行動(dòng)2026”在北京啟動(dòng)

2026-03-28 19:03

國務(wù)院食安辦、市場(chǎng)監(jiān)管總局約談相關(guān)地方市級(jí)人民政府負(fù)責(zé)人,督辦“3?15”晚會(huì)曝光問題整改

2026-03-28 18:44

飛書 CLI 開源:AI 可直連飛書辦公套件

2026-03-28 18:36

馬來西亞說伊朗允許馬滯留油輪通行霍爾木茲海峽

2026-03-28 18:02

今年前三個(gè)月中國創(chuàng)新藥對(duì)外授權(quán)交易總額超600億美元

2026-03-28 17:39

中國和菲律賓舉行南海問題雙邊磋商機(jī)制第十一次會(huì)議

2026-03-28 17:30

印尼正式實(shí)施16歲以下社媒禁令,約7000萬人受影響

2026-03-28 17:04

美國加州禁止官員借內(nèi)幕消息在預(yù)測(cè)市場(chǎng)牟利

2026-03-28 17:02

北京“超現(xiàn)場(chǎng)”生態(tài)共同體建設(shè)暨全國覆蓋啟動(dòng)

44

掃描下載App