圖片系A(chǔ)I生成

日前,AI領(lǐng)域投資人、風(fēng)投公司Air Street Capital聯(lián)合創(chuàng)始人內(nèi)森·貝奈奇(Nathan Benaich)與其團(tuán)隊(duì)共同發(fā)布了《人工智能現(xiàn)狀報(bào)告 2025》。該系列報(bào)告已連續(xù)發(fā)布八年,而本次報(bào)告長達(dá)300多頁,由業(yè)界和研究領(lǐng)域的頂尖AI從業(yè)者進(jìn)行評(píng)審,涵蓋了技術(shù)研究與產(chǎn)業(yè)、政策與安全、用戶市場調(diào)研等多個(gè)維度。

基于此,內(nèi)森·貝奈奇對(duì)下一年度給出預(yù)測,他在報(bào)告中寫道:“對(duì)前沿AI模型的研究,中國的研究機(jī)構(gòu)會(huì)超越美國;開放式AI智能體(Agent)更值得獲得進(jìn)一步科研發(fā)現(xiàn);AI安全領(lǐng)域,基于AI生成欺詐視頻的網(wǎng)絡(luò)攻擊事件將引發(fā)國際間討論;美國某頭部AI研究架構(gòu)會(huì)最終轉(zhuǎn)向開源生態(tài)以獲得其政府支持。”

筆者根據(jù)該報(bào)告調(diào)研數(shù)據(jù)及分析,梳理出三大類關(guān)鍵信息。

過去一年,超級(jí)智能與中美大模型PK

2024年末至2025年,隨著GPT-o1的發(fā)布,迎來基于深度推理的大模型發(fā)展熱潮,各家大模型廠商快速面世了多個(gè)推理模型。

期間,以Meta為代表的科技巨頭定義了“超級(jí)人工智能”(Superintelligence)一詞,“通用人工智能”(AGI)成為過去時(shí)。

請(qǐng)輸入圖說

報(bào)告認(rèn)為,開源模型與閉源模型之間的差距雖曾一度縮小,但當(dāng)前最頂尖的模型仍保持閉源,如GPT-5、GPT-o3、Gemini 2.5 Pro、Claude 4.1 Opus、Grok4等。其中,OpenAI憑借其最新的GPT-5在多個(gè)基準(zhǔn)測試中保持領(lǐng)先,繼續(xù)鞏固在基礎(chǔ)模型領(lǐng)域的優(yōu)勢地位。

盡管中國基礎(chǔ)模型尚未取得突破性進(jìn)展,但在開源模型領(lǐng)域卻頗具競爭力。相比之下,美國的開源模型表現(xiàn)令人失望,OpenAI的開源模型性能遠(yuǎn)遜于GPT-5。

隨著中國DeepSeek、Qwen和Kimi等模型的崛起,市場競爭愈發(fā)激烈。特別是在推理和編程任務(wù)方面,中國廠商正逐步縮小與領(lǐng)先者的差距。報(bào)告強(qiáng)調(diào),開源為中國廠商提供了快速追趕的契機(jī),越來越多的開發(fā)者選擇基于Qwen進(jìn)行開發(fā)。中國的大模型不僅在智能水平上有所提升,還呈現(xiàn)出多樣化的特點(diǎn)。相比之下,曾作為開源模型標(biāo)桿的Meta Llama,其市場份額已從2024年末的約50%大幅下滑至目前的15%。

報(bào)告指出,近期推理模型的方法改進(jìn)完全處于基準(zhǔn)模型的誤差范圍內(nèi),這或許意味著推理模型的進(jìn)步并不真實(shí)。而且,強(qiáng)化學(xué)習(xí)(RL)帶來的實(shí)際收益也微乎其微,且容易過擬合。

針對(duì)此,報(bào)告援引一篇論文,深入剖析了研究人員間的爭議焦點(diǎn):推理模型在應(yīng)對(duì)復(fù)雜問題時(shí)表現(xiàn)欠佳,究竟是源于實(shí)驗(yàn)設(shè)計(jì)本身的缺陷,還是僅在特定領(lǐng)域才能展現(xiàn)出超越基準(zhǔn)模型的優(yōu)勢?

當(dāng)前,前沿AI實(shí)驗(yàn)室正積極探索將強(qiáng)化學(xué)習(xí)、基于可驗(yàn)證的獎(jiǎng)勵(lì)機(jī)制、可驗(yàn)證推理與新環(huán)境相結(jié)合,賦予模型規(guī)劃、反饋、自我修正以及在更長時(shí)間跨度內(nèi)執(zhí)行任務(wù)的能力。

報(bào)告還提到,AI研究目前正考慮利用小語言模型(SLMs)構(gòu)建智能體(Agentic AI)。鑒于大多數(shù)智能體的工作流存在局限性、重復(fù)性且高度依賴格式,小語言模型已能滿足實(shí)際操作需求,且成本顯著降低。因此,采用小語言模型構(gòu)建有限的異構(gòu)智能體架構(gòu),僅在必要時(shí)調(diào)用大模型,成為一種可行的策略。

作為構(gòu)建AI智能體的軟件平臺(tái),AI智能體框架發(fā)展同樣迅速。盡管LangChain仍廣受歡迎,但如今已只是眾多選擇之一,目前市面上各細(xì)分領(lǐng)域已涌現(xiàn)數(shù)十種框架,如研發(fā)領(lǐng)域的AutoGen、camel,軟件工程領(lǐng)域的MetaGPT等。

此外,AI智能體的研究正賦予其記憶能力,實(shí)現(xiàn)從拓展上下文窗口到結(jié)構(gòu)化、持久性終身記憶的轉(zhuǎn)變,并且進(jìn)一步延伸至動(dòng)態(tài)整合、遺忘和反思,旨在使智能體在交互、任務(wù)乃至整個(gè)運(yùn)行周期中保持連貫性。

報(bào)告還提到,AI如今在跨學(xué)科領(lǐng)域的應(yīng)用價(jià)值日益凸顯。例如,在生物領(lǐng)域,DeepMind的AI系統(tǒng)“Co-scientist”,基于Gemini 2.0構(gòu)建,能夠生成、辯論并進(jìn)化其假設(shè)生成與實(shí)驗(yàn)規(guī)劃過程。

AI智能同樣涌現(xiàn)物理世界。如艾倫人工智能研究所Ai2發(fā)布的針對(duì)于具身智能系統(tǒng)的模型MolmoAct,谷歌的Gemini Robotics 1.5,與大模型“思維鏈”相呼應(yīng),能夠顯著提升物理機(jī)器人的可解釋性和可靠性。

產(chǎn)業(yè)進(jìn)展:更便宜的智能,限制與競爭

當(dāng)前,AI產(chǎn)業(yè)應(yīng)用正迅速普及。AI優(yōu)先企業(yè)營收遠(yuǎn)超其SaaS同行,并且在各個(gè)行業(yè)展現(xiàn)出發(fā)展勢頭。2025年,隨著AI采用率上升,用戶留存率上升,企業(yè)支出增加。特別是在音視頻、虛擬形象、圖像生成領(lǐng)域,AI公司的收入有望實(shí)現(xiàn)爆發(fā)式增長。

在企業(yè)內(nèi)部,AI應(yīng)用場景以內(nèi)容生成、代碼生成、研究及分析密集型任務(wù)最為常見。

ChatGPT、Claude、Gemini/Google和Perplexity成為使用頻率最高的工具。盡管Meta的AI工具覆蓋面廣,但其使用頻率遠(yuǎn)不及Mistral Le Chat或Midjourney。值得注意的是,DeepSeek雖然覆蓋率略低,但使用頻率相對(duì)較高。

在開發(fā)者工具方面,Cursor、Claude Code和GitHub Copilot備受青睞;而在非編程工具中,Deep Research、ChatGPT、ElevenLabs、Perplexity和Claude的使用頻率也非常高。

然而,AI編程工具的應(yīng)用也伴隨著一定風(fēng)險(xiǎn)。例如,AI編程工具可能會(huì)主動(dòng)覆蓋企業(yè)生產(chǎn)代碼,導(dǎo)致開發(fā)成果受損。同時(shí),從事AI編程開發(fā)的初創(chuàng)公司仍面臨嚴(yán)峻的單位經(jīng)濟(jì)效益挑戰(zhàn),其盈利狀況受制于上游模型價(jià)格和競爭對(duì)手。這可能導(dǎo)致初創(chuàng)公司在提高利潤時(shí),除了技術(shù)降本外,還可能采取突然提價(jià)或限制用戶功能等措施。

瀏覽器正成為AI應(yīng)用的最新焦點(diǎn)和企業(yè)競爭的新戰(zhàn)場。目前,OpenAI、Google、Anthropico和Perplexity均推出了助手功能,不僅能解答用戶關(guān)于網(wǎng)頁內(nèi)容的問題,還能代表用戶在瀏覽器中進(jìn)行導(dǎo)航和操作。這一轉(zhuǎn)變將瀏覽器重新定義為互聯(lián)網(wǎng)的智能操作系統(tǒng)。此外,谷歌公司在其產(chǎn)品中嵌入Gemini能力,讓更多用戶體驗(yàn)到AI檢索服務(wù)。據(jù)谷歌公司聲稱,其每月Token消耗數(shù)量在2025年同比增長了50倍,達(dá)到千萬億個(gè)Token。

事實(shí)上,AI的工業(yè)時(shí)代已經(jīng)到來。

但在這其中,電力供應(yīng)正成為制約AI發(fā)展的新因素。報(bào)告稱,若電力供應(yīng)不足,國家AI計(jì)劃將面臨崩潰風(fēng)險(xiǎn)。未來1-3年內(nèi),美國幾個(gè)主要地區(qū)可能會(huì)出現(xiàn)電力短缺。美國能源部(DOE)警告稱,由于電力供應(yīng)不穩(wěn)定和AI需求增長,到2030年,停電頻率可能會(huì)增加100倍。

報(bào)告提到了2024年末DeepSeek對(duì)整個(gè)AI市場的攪動(dòng),市場重新認(rèn)識(shí)“杰文斯悖論”,即更便宜的智能,帶來更高的需求,更高的需求又會(huì)提高對(duì)芯片的消耗。

無論是在公有云、私有云還是本地化部署環(huán)境中,GPU都至關(guān)重要。英偉達(dá)的市值突破4萬億美元,占據(jù)90%的AI研究論文市場份額,定制芯片與新云服務(wù)同步崛起。除了英偉達(dá)之外,隨著客戶對(duì)優(yōu)惠價(jià)格、靈活合同條款及AI專用軟件套件的需求增加,上市公司Coreweave、Nebius以及私企Lambda、Crusoe正實(shí)現(xiàn)快速增長。同時(shí),報(bào)告指出TPU和AMD的GPU普及程度并不高。

報(bào)告還首次對(duì)1183名AI從業(yè)者進(jìn)行了調(diào)研,結(jié)果顯示,95%的專業(yè)人士現(xiàn)在在工作或生活中使用AI,76%的人自掏腰包購買AI工具,且大多數(shù)人表示生產(chǎn)力持續(xù)提高。這充分證明AI的真正普及已成為主流趨勢。

報(bào)告指出,目前AI主要擠壓的是入門級(jí)崗位市場,其中在軟件和客服領(lǐng)域,這類崗位極易受AI技術(shù)影響,其招聘崗位持續(xù)下降,經(jīng)驗(yàn)豐富的勞動(dòng)力暫時(shí)保持工作穩(wěn)定性。

報(bào)告還指出,研究發(fā)現(xiàn)當(dāng)前勞動(dòng)力市場變化早于2022年ChatGPT的問世,AI自動(dòng)化目前并未削弱經(jīng)濟(jì)領(lǐng)域?qū)φJ(rèn)知型勞動(dòng)力的需求。

AI政策“反復(fù)”,安全風(fēng)險(xiǎn)加劇

整體來看,美國推行“美國AI優(yōu)先”的戰(zhàn)略并調(diào)整出口政策,中國則加速推進(jìn)自主研發(fā)與本土芯片制造,以中美為代表的AI競賽愈演愈烈。

2025年,特朗普政府將人工智能安全研究所更名為人工智能標(biāo)準(zhǔn)與創(chuàng)新中心(CAISI),并啟動(dòng)了5000億美元的“星門計(jì)劃”。與此同時(shí),美國政府發(fā)布《人工智能行動(dòng)計(jì)劃》力求保持其在全球AI領(lǐng)域的主導(dǎo)地位。

與中國最密切相關(guān)的是AI芯片出口限制的相關(guān)政策,報(bào)告用“反復(fù)”來形容。事實(shí)上,美國政府在國家安全目標(biāo)與供應(yīng)鏈依賴、供應(yīng)商游說這見尋求平衡,這使得英偉達(dá)和AMD成為政治焦點(diǎn)。報(bào)告指出,英偉達(dá)在中國市場并未達(dá)到穩(wěn)定狀態(tài)。

與此同時(shí),美國監(jiān)管措施在巨額投資浪潮中被邊緣化:國際外交陷入僵局,《人工智能法案》實(shí)施遭遇重重阻礙。

AI數(shù)據(jù)中心建設(shè)陷入了新的瓶頸:鄰避主義(NIMBYism)。在最新事件中,美國公眾對(duì)新建大規(guī)模數(shù)據(jù)中心的反對(duì)聲日益高漲。

而盡管政府《人工智能行動(dòng)計(jì)劃》提及需自主AI領(lǐng)域”基礎(chǔ)科學(xué)“,但其核心研發(fā)資金遠(yuǎn)低于專家建議的2026年320億美元投資目標(biāo)。

與此同時(shí),硅谷科技巨頭目前采取了“逆向”并購政策:通過快速引進(jìn)人才(創(chuàng)始人及團(tuán)隊(duì)高薪)以規(guī)避并購限制,同時(shí)保留原業(yè)務(wù)精簡的公司轉(zhuǎn)型拓展小眾市場。其原因在于,特朗普政府以來的并購增長預(yù)期尚未到來,同時(shí)又受制于前拜登政府推行的反壟斷審查。例如,微軟收購Inflection,谷歌收購Character AI,亞馬遜收購Adept,Meta收購Scale AI(貌似最近的Manus并購案也存在同樣模式)。

目前美國聯(lián)邦貿(mào)易委員會(huì)(FTC)對(duì)這類“逆向”并購行為的擔(dān)憂日益加劇。

與此同時(shí),美國就AI安全相關(guān)的政策議題也在發(fā)生轉(zhuǎn)變,加之實(shí)驗(yàn)室間日益激烈的商業(yè)競爭,某些安全規(guī)程已被列為非優(yōu)先事項(xiàng)。

外部安全機(jī)構(gòu)年度預(yù)算甚至不及頂尖實(shí)驗(yàn)室單日總支出,曾以安全為核心的機(jī)構(gòu)開始將重點(diǎn)轉(zhuǎn)向產(chǎn)品化。報(bào)告估算,外部AI安全研究投入僅約1.3億美元,而同期全球AI研發(fā)支出接近千億美元,比例極低。

AI實(shí)驗(yàn)室為防范生物安全風(fēng)險(xiǎn)和網(wǎng)絡(luò)攻擊部署了空前防護(hù),部分實(shí)驗(yàn)室卻因錯(cuò)過自我設(shè)定的截止日期或悄然放棄測試方案。

報(bào)告指出,網(wǎng)絡(luò)攻擊能力每五個(gè)月翻一番,遠(yuǎn)超防御措施的更新速度。犯罪分子利用AI智能體的勒索軟件已滲透至世界500強(qiáng)企業(yè)。

涉及生成式AI的安全事件正呈急劇增長態(tài)勢。其中,大量報(bào)告事件涉及AI換臉技術(shù),這與大模型的濫用密切相關(guān)。與此同時(shí),AI代理正日益成為網(wǎng)絡(luò)安全防御的重大挑戰(zhàn)。(作者 | 楊麗,編輯 | 蓋虹達(dá))

報(bào)告來源:https://www.stateof.ai/

本文系作者 TechHorizon 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請(qǐng)注明出處、作者和本文鏈接。
本內(nèi)容來源于鈦媒體鈦度號(hào),文章內(nèi)容僅供參考、交流、學(xué)習(xí),不構(gòu)成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點(diǎn)和發(fā)現(xiàn),點(diǎn)擊這里投稿 。創(chuàng)業(yè)或融資尋求報(bào)道,點(diǎn)擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評(píng)論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論

請(qǐng) 登錄后輸入評(píng)論內(nèi)容

快報(bào)

更多

2026-03-28 23:01

澤連斯基稱與中東3國達(dá)成防務(wù)合作協(xié)議,涉聯(lián)合生產(chǎn)無人機(jī)

2026-03-28 22:35

山西太原一建筑發(fā)生火災(zāi),已致1人死亡25人受傷

2026-03-28 22:26

王文濤部長發(fā)表書面致辭,支持世貿(mào)組織《電子商務(wù)協(xié)定》達(dá)成臨時(shí)實(shí)施安排

2026-03-28 21:54

40余家單位聯(lián)盟,中國最大人形機(jī)器人訓(xùn)練基地在京揭牌

2026-03-28 21:41

周鴻祎與劉慈欣在科幻大會(huì)預(yù)判:百億智能體或成新物種,AI推動(dòng)人類文明分化

2026-03-28 21:38

第五代宏光MINIEV上市,售價(jià)4.48萬-5.48萬元

2026-03-28 20:42

烏稱伊朗襲擊迪拜倉庫并致烏克蘭人傷亡消息不實(shí)

2026-03-28 20:23

3月28日新聞聯(lián)播速覽23條

2026-03-28 20:05

美國務(wù)卿和歐盟官員被曝就烏克蘭問題激烈交鋒

2026-03-28 19:44

“Token”這個(gè)詞的搜索量最高一天達(dá)到7.7萬次,比去年日均搜索量高出1850%

2026-03-28 19:39

飛捷科思發(fā)布中國首個(gè)可微分物理仿真引擎Fysics

2026-03-28 19:13

“網(wǎng)售產(chǎn)品質(zhì)量安全提升系列行動(dòng)2026”在北京啟動(dòng)

2026-03-28 19:03

國務(wù)院食安辦、市場監(jiān)管總局約談相關(guān)地方市級(jí)人民政府負(fù)責(zé)人,督辦“3?15”晚會(huì)曝光問題整改

2026-03-28 18:44

飛書 CLI 開源:AI 可直連飛書辦公套件

2026-03-28 18:36

馬來西亞說伊朗允許馬滯留油輪通行霍爾木茲海峽

2026-03-28 18:02

今年前三個(gè)月中國創(chuàng)新藥對(duì)外授權(quán)交易總額超600億美元

2026-03-28 17:39

中國和菲律賓舉行南海問題雙邊磋商機(jī)制第十一次會(huì)議

2026-03-28 17:30

印尼正式實(shí)施16歲以下社媒禁令,約7000萬人受影響

2026-03-28 17:04

美國加州禁止官員借內(nèi)幕消息在預(yù)測市場牟利

2026-03-28 17:02

北京“超現(xiàn)場”生態(tài)共同體建設(shè)暨全國覆蓋啟動(dòng)

掃描下載App