愛芯元智創(chuàng)始人、董事長 仇肖莘
7月5日舉行的2024世界人工智能大會(huì)暨人工智能全球治理高級(jí)別會(huì)議(WAIC 2024)分論壇上,國內(nèi) AI 算力公司愛芯元智創(chuàng)始人、董事長仇肖莘正式發(fā)布用于 AI 端側(cè)模型推理的“愛芯通元AI處理器”。
據(jù)悉,愛芯通元AI處理器的核心是算子指令集和數(shù)據(jù)流微架構(gòu),底層采用可編程數(shù)據(jù)流的微架構(gòu),有高中低三檔算力,支持原生transformer模型,已經(jīng)在智慧城市和輔助駕駛兩個(gè)領(lǐng)域?qū)崿F(xiàn)規(guī)?;慨a(chǎn),可應(yīng)用于以文搜圖、通用檢測(cè)、以圖生文、AI Agent等模型場景。
仇肖莘表示,大模型真正大規(guī)模落地需要云-邊-端三級(jí)緊密結(jié)合,而邊緣側(cè)和端側(cè)結(jié)合的關(guān)鍵在于AI計(jì)算與感知。愛芯元智基于愛芯智眸AI-ISP和愛芯通元混合精度NPU兩大自研核心技術(shù),確立以“AIoT+ADAS”為主的一體兩翼戰(zhàn)略路線,并向邊緣計(jì)算、AI推理領(lǐng)域縱深發(fā)展,加速推動(dòng)智慧城市、智能駕駛等應(yīng)用場景落地。
會(huì)后對(duì)話中,仇肖莘向鈦媒體App等表示,團(tuán)隊(duì)正關(guān)注行業(yè)伙伴在AI 領(lǐng)域的端側(cè)大模型應(yīng)用布局。她認(rèn)為,大模型的Scaling Law(規(guī)律效應(yīng))并非“鐵律”,不會(huì)以“線性”方式持續(xù)增長,一定會(huì)出現(xiàn)穩(wěn)定的平滑優(yōu)化時(shí)期。
“人們都在談?wù)?lsquo;摩爾定律’(Moore’s Law)已經(jīng)到達(dá)極限,但是從單芯片的角度來看,摩爾確實(shí)在發(fā)展,但同時(shí)增速也已經(jīng)平緩了。事實(shí)上,當(dāng)前的半導(dǎo)體行業(yè),是通過系統(tǒng)解決方案將整體性能再往上提升。所以,今年GTC強(qiáng)調(diào)的并不是單芯片,而是系統(tǒng)。整個(gè)系統(tǒng)的調(diào)度、優(yōu)化、管理,是核心。至于scaling law的未來走向,會(huì)是以某種形式再更進(jìn)一步優(yōu)化。任何事物不可能永遠(yuǎn)linear(線性),它一定會(huì)在某個(gè)時(shí)間點(diǎn)進(jìn)行非線性的增速。當(dāng)那個(gè)臨界點(diǎn)到來的時(shí)候,是否仍舊是現(xiàn)在的優(yōu)化方式,是需要重新評(píng)估的。”仇肖莘表示。
據(jù)悉,愛芯元智成立于2019年5月,主要為不同行業(yè)提供 AI 的基礎(chǔ)算力平臺(tái)。愛芯元智目前已成功研發(fā)并量產(chǎn)了高中低端多顆端側(cè)、邊緣側(cè)AI芯片,聚焦智慧城市,智能駕駛,機(jī)器人及創(chuàng)新業(yè)務(wù)三大場景。
融資層面,截至目前,愛芯元智已完成B輪融資。投資方包括騰訊、啟明創(chuàng)投、美團(tuán)及美團(tuán)龍珠資本、韋豪創(chuàng)芯、聯(lián)想之星、耀途資本等產(chǎn)業(yè)和風(fēng)險(xiǎn)投資機(jī)構(gòu)。
此次公布的“愛芯通元AI處理器”,主要定位于AI模型的推理。通過模型算法和芯片設(shè)計(jì)的協(xié)同,以及模型小型化,實(shí)現(xiàn)最優(yōu)算力配置,進(jìn)一步加快大模型行業(yè)落地。
一個(gè)多小時(shí)的交流中,仇肖莘坦言,其他 AI 芯片企業(yè)在做的智算中心,目前不是愛芯的業(yè)務(wù)重點(diǎn),現(xiàn)階段更希望把邊緣側(cè)和端側(cè)的海量市場先做好。因?yàn)?,在她看來,AI大模型落地一定是個(gè)云、邊、端三位一體的市場。
“這種有生成式 AI 的底座大模型,一定是在云端;但大模型是不是能夠通過微調(diào),或者某些優(yōu)化等方式,形成行業(yè)大模型,落到邊緣側(cè),而非這種幾萬億的參數(shù)量,還是有可能的。”仇肖莘認(rèn)為,大模型的落地現(xiàn)在還處于非常原始的階段——broke force(亂局)。
仇肖莘指出,大模型在端側(cè)落地的場景首先可能是車,隨后是手機(jī)、AI PC等等,因?yàn)檐囀切枰袑?shí)時(shí)響應(yīng)的一個(gè)應(yīng)用場景,而車的算力,實(shí)際上是端側(cè)大模型的一個(gè)剛需,比如智能駕駛、智能駕艙、人機(jī)交互、AI Agent等。
“應(yīng)用場景非常多樣。一個(gè)3.2T的小芯片,如果集成到手機(jī)芯片里,手機(jī)就可以在本地完成很多應(yīng)用的運(yùn)行,而無需上云。”仇肖莘認(rèn)為,生成式 AI 未來可能的一個(gè)應(yīng)用場景是“智能家居”,通過家用 AI 服務(wù)器中樞,形成算力中心,入口將有可能是手機(jī)、機(jī)器人和“具身智能”、攝像和語音控制設(shè)備等極具想象力的方式。
談到愛芯AI能力落地的商業(yè)模式,仇肖莘表示,目前來看行業(yè)主要有兩種:一是客戶SoC自身算力不夠或不能原生支持大模型,可以通過愛芯的NPU IP 集成到客戶芯片里,給客戶帶來高效的NPU 能力;二是通過愛芯的芯片和軟件棧,實(shí)現(xiàn)規(guī)模化落地解決方案。
仇肖莘強(qiáng)調(diào),半導(dǎo)體其實(shí)是一個(gè)長周期的行業(yè),需要與投資人雙向選擇,那種快進(jìn)快出的機(jī)構(gòu)不適合半導(dǎo)體行業(yè)。
“選擇合適的投資人很重要。第一,投資人一定要理解半導(dǎo)體的整個(gè)的邏輯和它的周期;第二,作為芯片公司來講,需要努力做到商業(yè)閉環(huán)。所以這也是我們?yōu)槭裁匆?guī)?;l(fā)力量產(chǎn),繼而形成生態(tài)。一個(gè)健康的芯片公司平均在7~10年內(nèi)可以實(shí)現(xiàn)收支平衡和盈利,希望我們能夠穩(wěn)健發(fā)展,盡快進(jìn)入正循環(huán)。”仇肖莘表示。
(本文首發(fā)于鈦媒體App,作者|林志佳,編輯|胡潤峰)
![]()
快報(bào)
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論