圖片由AI生成

如果一個(gè)AI每次對(duì)話結(jié)束后,都會(huì)把與你的全部交流清空,那么無論它多聰明,都只能算是一個(gè)“高級(jí)聊天工具”,而不是一個(gè)真正意義上的智能體(Agent)。

這正是當(dāng)下Agentic AI面臨的核心瓶頸之一:失憶。

近日,由盛大集團(tuán)全資孵化的AI技術(shù)團(tuán)隊(duì)EverMind,正式對(duì)外系統(tǒng)性地展示了他們給出的解法——EverMemOS,最新版本在四大記憶基準(zhǔn)上實(shí)現(xiàn)了最先進(jìn)(SOTA)準(zhǔn)確率。

伴隨而來的,還有 EverMemOS 云服務(wù)的內(nèi)測(cè),以及一項(xiàng)總獎(jiǎng)金高達(dá) 8 萬美元的全球開發(fā)者大賽 ——Memory Genesis Competition 2026。

這背后是陳天橋?qū)?ldquo;基礎(chǔ)性技術(shù)長(zhǎng)期投入”的一貫判斷,也是EverMind聯(lián)合創(chuàng)始人鄧亞峰在AI記憶基礎(chǔ)設(shè)施方向上的一次正面下注。

在產(chǎn)品發(fā)布之外,這也更像是一次針對(duì)“AI是否能真正成為長(zhǎng)期智能體”的底層挑戰(zhàn)。

為什么Agent一定需要長(zhǎng)期記憶?

在大模型能力突飛猛進(jìn)的這兩年里,行業(yè)幾乎把所有注意力都集中在參數(shù)規(guī)模、多模態(tài)、推理能力和算力效率上。

但在真實(shí)應(yīng)用中,開發(fā)者很快發(fā)現(xiàn)了一個(gè)殘酷事實(shí):模型會(huì)“忘事”。

無論是對(duì)用戶偏好的理解、對(duì)歷史決策的追溯,還是跨時(shí)間跨度的復(fù)雜推理,只要上下文窗口結(jié)束,一切都得從頭來過。RAG可以緩解一部分問題,但它更像是“臨時(shí)查資料”,而不是“真正記住”。

如果說大模型負(fù)責(zé)“思考”,那么記憶系統(tǒng)決定的,其實(shí)是智能體是否具備連續(xù)自我。

鄧亞峰認(rèn)為,“如果模型每次會(huì)話后都會(huì)重置理解,真正的Agentic AI就無從談起。”

EverMind正在從靜態(tài)的上下文窗口邁向動(dòng)態(tài)、自組織的記憶,借助EverMemOS,為智能體提供了一段“活的、會(huì)演化的歷史”。

基準(zhǔn)結(jié)果表明:EverMind能夠以遠(yuǎn)低于全上下文模型的算力成本,實(shí)現(xiàn)更高的準(zhǔn)確率。

正是在這一判斷下,EverMind把研發(fā)重心從模型能力本身,轉(zhuǎn)向了一個(gè)更底層,也更難的方向——AI Memory Infra。

EverMemOS:打破行業(yè)基準(zhǔn),點(diǎn)擊即用

在EverMind最新發(fā)布的論文EverMemOS: A Self-Organizing Memory Operating System for Structured Long-Horizon Reasoning中,團(tuán)隊(duì)對(duì)現(xiàn)有主流方案進(jìn)行了清晰區(qū)分。

截圖來自:《EverMemOS: A Self-Organizing Memory Operating System for Structured Long-Horizon Reasoning》

截圖來源:EverMemOS: A Self-Organizing Memory Operating System for Structured Long-Horizon Reasoning

EverMind詳細(xì)闡述了其技術(shù)提出的一套受engram啟發(fā)的生命周期機(jī)制,用以模擬生物認(rèn)知過程。與傳統(tǒng)RAG或成本高昂的超長(zhǎng)上下文窗口不同,EverMemOS能將經(jīng)驗(yàn)組織為連貫、可演化的結(jié)構(gòu)。

它試圖構(gòu)建的,是一個(gè)類似生物認(rèn)知系統(tǒng)的記憶生命周期,靈感直接來自神經(jīng)科學(xué)中的engram理論。

在這套架構(gòu)中,記憶不是靜態(tài)存儲(chǔ),而是會(huì)被不斷壓縮、重組、強(qiáng)化和遺忘的動(dòng)態(tài)系統(tǒng)。

EverMemOS的核心機(jī)制,被概括為三個(gè)連續(xù)但可循環(huán)的階段。

第一階段:情景痕跡形成(Episodic Trace Formation)。

將對(duì)話流轉(zhuǎn)換為MemCells,用于捕捉情景痕跡、原子事實(shí)以及有時(shí)間邊界的前瞻信息。

第二階段:語義鞏固(Semantic Consolidation)。

把MemCells動(dòng)態(tài)組織為主題化的MemScenes,提煉穩(wěn)定的語義結(jié)構(gòu),并持續(xù)更新持久化的用戶畫像。

第三階段:重建式回憶(Reconstructive Recollection)。

通過agentic檢索組合“必要且充分”的推理上下文,在優(yōu)化算力成本的同時(shí)保證高準(zhǔn)確率。

這也是EverMemOS能在大幅降低token消耗的同時(shí),維持甚至提升準(zhǔn)確率的關(guān)鍵。

基準(zhǔn)成績(jī),是硬指標(biāo)

在AI基礎(chǔ)設(shè)施領(lǐng)域,架構(gòu)是否成立,最終要看基準(zhǔn)測(cè)試。

EverMind在四個(gè)主流記憶評(píng)測(cè)基準(zhǔn)上,給出了極具說服力的數(shù)據(jù)。

LoCoMo(93.05%準(zhǔn)確率):超越全部現(xiàn)有記憶系統(tǒng)與全上下文模型;在多跳推理(+19.7%)與時(shí)序任務(wù)(+16.1%)上優(yōu)勢(shì)顯著,同時(shí)大幅降低token使用與計(jì)算成本。

LongMemEval(83.00%準(zhǔn)確率):在知識(shí)更新與時(shí)序推理方面位居第一;其中知識(shí)更新任務(wù)提升20.6%,體現(xiàn)出系統(tǒng)可通過持續(xù)語義鞏固不斷“進(jìn)化”的能力。

HaluMem(90.04%召回):在記憶完整性方面建立新的行業(yè)標(biāo)準(zhǔn),顯著減少長(zhǎng)時(shí)程任務(wù)中的幻覺。

PersonaMem v2:在9個(gè)復(fù)雜場(chǎng)景中,在深度個(gè)性化與行為一致性維度取得最佳綜合表現(xiàn)。

這說明EverMind不需要犧牲效率,去換取長(zhǎng)期記憶。結(jié)構(gòu)本身,就是效率。

從論文到云服務(wù):記憶能力的產(chǎn)品化

如果EverMemOS只停留在論文階段,它的意義仍然是學(xué)術(shù)層面的。

但是,EverMind顯然希望更快地進(jìn)入真實(shí)應(yīng)用場(chǎng)景。

此次同步推出的EverMemOS Cloud Service,正是為開發(fā)者和企業(yè)提供“即插即用”的記憶增強(qiáng)能力。通過簡(jiǎn)單API調(diào)用,原本無狀態(tài)的聊天機(jī)器人,可以在數(shù)分鐘內(nèi)升級(jí)為具備長(zhǎng)期上下文感知的智能體。

在設(shè)計(jì)上,該云服務(wù)強(qiáng)調(diào)三點(diǎn):

目前,該服務(wù)已對(duì)候補(bǔ)名單(waitlist)用戶開放內(nèi)測(cè),也可以通過官網(wǎng)申請(qǐng)加入內(nèi)測(cè):console.evermind.ai。

Memory Genesis:把基礎(chǔ)設(shè)施交到生態(tài)手里

與產(chǎn)品發(fā)布同樣重要的,是EverMind對(duì)生態(tài)的態(tài)度。

Memory Genesis Competition 2026,并不想做成一次常規(guī)的應(yīng)用開發(fā)大賽,而是圍繞“記憶原生應(yīng)用”展開的系統(tǒng)性共創(chuàng)。
圖片來源:EverMind

圖片來源:EverMind

賽事設(shè)置了Memory+Agent、Plugin和Infra三大賽道,覆蓋從應(yīng)用到基礎(chǔ)設(shè)施的不同層級(jí)。初始獎(jiǎng)金池為8萬美元,并提供后續(xù)收入分成與職業(yè)機(jī)會(huì)。

優(yōu)秀開發(fā)者不僅能獲得獎(jiǎng)金,還可能直接進(jìn)入EverMind工程團(tuán)隊(duì),或獲得長(zhǎng)期技術(shù)支持。

開發(fā)者可在2月線上參賽并提交作品,3月份將在社區(qū)逐步公布優(yōu)秀項(xiàng)目,并將邀請(qǐng)優(yōu)秀團(tuán)隊(duì)參加4月初在硅谷舉辦的線下活動(dòng)。

開發(fā)者可在evermind.ai/activities注冊(cè)。

Memory Genesis Competition的舉辦,延續(xù)了陳天橋一貫的邏輯:真正的基礎(chǔ)設(shè)施,必須交由生態(tài)來驗(yàn)證和放大。

從更大的時(shí)間尺度看,EverMemOS的出現(xiàn)并不偶然。

當(dāng)模型能力趨同、算力成本成為瓶頸,長(zhǎng)期記憶正在成為Agent競(jìng)爭(zhēng)的分水嶺。誰能讓AI “記得住、記得準(zhǔn)、記得久”,誰就更接近真正的智能體。

EverMind選擇在這個(gè)節(jié)點(diǎn)押注記憶基礎(chǔ)設(shè)施,既是技術(shù)判斷,也是戰(zhàn)略選擇。

對(duì)陳天橋和鄧亞峰而言,這是一次對(duì)“長(zhǎng)期價(jià)值”的再次下注,為Agentic AI補(bǔ)上一塊關(guān)鍵拼圖的嘗試。

多數(shù)AI應(yīng)用的失敗,也許并不是因?yàn)槟P筒粔蚵斆鳎且驗(yàn)橄到y(tǒng)不夠完整。

EverMemOS至少回答了一個(gè)長(zhǎng)期被忽視的問題:如果AI沒有記憶,它到底是誰?

而這,或許正是下一階段智能競(jìng)爭(zhēng)真正開始的地方。(作者|李程程,編輯|李玉鵬)

本文系作者 LCC_Beta版 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請(qǐng)注明出處、作者和本文鏈接。
本內(nèi)容來源于鈦媒體鈦度號(hào),文章內(nèi)容僅供參考、交流、學(xué)習(xí),不構(gòu)成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點(diǎn)和發(fā)現(xiàn),點(diǎn)擊這里投稿 。創(chuàng)業(yè)或融資尋求報(bào)道,點(diǎn)擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評(píng)論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論

請(qǐng) 登錄后輸入評(píng)論內(nèi)容

快報(bào)

更多

23:01

澤連斯基稱與中東3國達(dá)成防務(wù)合作協(xié)議,涉聯(lián)合生產(chǎn)無人機(jī)

22:35

山西太原一建筑發(fā)生火災(zāi),已致1人死亡25人受傷

22:26

王文濤部長(zhǎng)發(fā)表書面致辭,支持世貿(mào)組織《電子商務(wù)協(xié)定》達(dá)成臨時(shí)實(shí)施安排

21:54

40余家單位聯(lián)盟,中國最大人形機(jī)器人訓(xùn)練基地在京揭牌

21:41

周鴻祎與劉慈欣在科幻大會(huì)預(yù)判:百億智能體或成新物種,AI推動(dòng)人類文明分化

21:38

第五代宏光MINIEV上市,售價(jià)4.48萬-5.48萬元

20:42

烏稱伊朗襲擊迪拜倉庫并致烏克蘭人傷亡消息不實(shí)

20:23

3月28日新聞聯(lián)播速覽23條

20:05

美國務(wù)卿和歐盟官員被曝就烏克蘭問題激烈交鋒

19:44

“Token”這個(gè)詞的搜索量最高一天達(dá)到7.7萬次,比去年日均搜索量高出1850%

19:39

飛捷科思發(fā)布中國首個(gè)可微分物理仿真引擎Fysics

19:13

“網(wǎng)售產(chǎn)品質(zhì)量安全提升系列行動(dòng)2026”在北京啟動(dòng)

19:03

國務(wù)院食安辦、市場(chǎng)監(jiān)管總局約談相關(guān)地方市級(jí)人民政府負(fù)責(zé)人,督辦“3?15”晚會(huì)曝光問題整改

18:44

飛書 CLI 開源:AI 可直連飛書辦公套件

18:36

馬來西亞說伊朗允許馬滯留油輪通行霍爾木茲海峽

18:02

今年前三個(gè)月中國創(chuàng)新藥對(duì)外授權(quán)交易總額超600億美元

17:39

中國和菲律賓舉行南海問題雙邊磋商機(jī)制第十一次會(huì)議

17:30

印尼正式實(shí)施16歲以下社媒禁令,約7000萬人受影響

17:04

美國加州禁止官員借內(nèi)幕消息在預(yù)測(cè)市場(chǎng)牟利

17:02

北京“超現(xiàn)場(chǎng)”生態(tài)共同體建設(shè)暨全國覆蓋啟動(dòng)

掃描下載App