這東西就跟概念車(chē)一樣。

先說(shuō)說(shuō)安全方面吧,很多人以為殺毒軟件還是靠“病毒庫(kù)”——就像警察拿著通緝犯照片挨個(gè)比對(duì)。但實(shí)際上,現(xiàn)代殺毒軟件和EDR(端點(diǎn)檢測(cè)與響應(yīng))系統(tǒng)早就不是這么干了。

它們會(huì)看文件結(jié)構(gòu)、監(jiān)控進(jìn)程行為、分析API調(diào)用模式、追蹤橫向移動(dòng)軌跡,甚至用機(jī)器學(xué)習(xí)判斷“這個(gè)行為像不像攻擊”。

換句話(huà)說(shuō),現(xiàn)代安全系統(tǒng)已經(jīng)不只是在找“已知的壞人”,而是在識(shí)別“可疑的行為模式”。

Mythos可能把這個(gè)邏輯又往前推了一步。它能理解攻擊的語(yǔ)義。

通過(guò)理解一段代碼、一串工具調(diào)用、一段對(duì)話(huà),判斷是不是在構(gòu)造一條真實(shí)可執(zhí)行的攻擊鏈。

比如它能分辨出:這不是普通的壓縮腳本,而是在做規(guī)避掃描、自啟動(dòng)、憑據(jù)竊取這一整套動(dòng)作;這不是正常的滲透測(cè)試問(wèn)答,而是在拼接exploit、持久化、橫移、出網(wǎng)這幾個(gè)步驟。

Mythos很可能具備“漏洞泛化發(fā)現(xiàn)”能力。

Anthropic 在今年2月的博客中提到,Opus 4.6找零日漏洞的方式不像傳統(tǒng)fuzzing那樣亂撞,而是通過(guò)理解代碼語(yǔ)義、歷史修復(fù)模式和相似bug特征,去找“還沒(méi)被修掉的同類(lèi)漏洞”。

看到一個(gè)漏洞后,它就能立刻聯(lián)想到“其他地方是不是也存在類(lèi)似的漏洞”。

Mythos在推理方面的提升,可能也不單單是說(shuō)benchmark分?jǐn)?shù)又高了幾分。

比如它可能在思考過(guò)程中更少出現(xiàn)中途漂移,更少為了迎合用戶(hù)而過(guò)度自信,更會(huì)顯式區(qū)分“已知、推斷、未知”,更會(huì)在不確定時(shí)保守行動(dòng)等等。

這和安全是同一類(lèi)底層能力。因?yàn)楹玫哪P筒恢皇歉鼤?huì)生成答案,而是更會(huì)管理自己的不確定性。

Claude的一大重點(diǎn)就是編程。所以我覺(jué)得在編程能力上,Mythos可能不只是“把代碼寫(xiě)地更好”,而是從“會(huì)寫(xiě)代碼”變成“會(huì)經(jīng)營(yíng)代碼庫(kù)”。

Mythos可能會(huì)把模塊邊界、依賴(lài)關(guān)系、歷史patch風(fēng)格、測(cè)試習(xí)慣放在一起進(jìn)行建模。

它會(huì)先拆改動(dòng)圖、再分批落patch,而不是想到哪改到哪;寫(xiě)完代碼后會(huì)主動(dòng)補(bǔ)測(cè)試、跑靜態(tài)檢查,根據(jù)失敗日志回滾到更穩(wěn)的方案。

這種能力對(duì)真實(shí)工程項(xiàng)目的價(jià)值,遠(yuǎn)超在測(cè)試集上多做對(duì)幾道題。

當(dāng)然最終要落到的地方,肯定是在線(xiàn)束(harness)上,Mythos很可能實(shí)現(xiàn)了從“單次回答強(qiáng)”到“整條執(zhí)行鏈穩(wěn)”的跨越。

它會(huì)把大任務(wù)拆成可驗(yàn)證的小階段,多個(gè)子任務(wù)并行執(zhí)行再匯總結(jié)果,在長(zhǎng)鏈條里保留關(guān)鍵狀態(tài)、丟掉噪聲。某一步報(bào)錯(cuò)時(shí)不需要從頭來(lái)過(guò),只要找到問(wèn)題發(fā)生地,對(duì)其局部進(jìn)行修復(fù),就可以繼續(xù)執(zhí)行任務(wù)。

就像游戲里的檢查點(diǎn),如果你沒(méi)有通過(guò)某一個(gè)BOSS,你不需要從頭開(kāi)始打整個(gè)章節(jié),你會(huì)被傳送到上一個(gè)檢查點(diǎn)。

這就像工業(yè)控制里的“線(xiàn)束管理”——不是某一根線(xiàn)更粗,而是整個(gè)連接、隔離、容錯(cuò)、標(biāo)記、回路設(shè)計(jì)更合理。

長(zhǎng)上下文能力的提升可能也不只是“窗口更大”,而是“上下文利用率更高”。

現(xiàn)在的大模型,一說(shuō)上下文窗口,每個(gè)都說(shuō)自己能裝下幾十萬(wàn)字,但是一問(wèn)它全文重點(diǎn)或者文檔關(guān)系,立刻就啞巴了。

Mythos如果真有進(jìn)步,可能體現(xiàn)在更強(qiáng)的重點(diǎn)檢測(cè)、更好的層級(jí)摘要、更準(zhǔn)的跨文檔對(duì)齊,以及更有效的持續(xù)記憶寫(xiě)回機(jī)制。

在工具使用上,Mythos可能從“會(huì)調(diào)工具”升級(jí)到“會(huì)設(shè)計(jì)實(shí)驗(yàn)”。

Anthropic已經(jīng)在推computer use、terminal、browser這套能力,但真正的跨越不是UI自動(dòng)化更強(qiáng),而是知道什么時(shí)候該讀代碼、什么時(shí)候該跑測(cè)試、什么時(shí)候該查文檔。

如何設(shè)計(jì)最小驗(yàn)證閉環(huán)、避免無(wú)效探索、控制成本。

通俗說(shuō),就是從“會(huì)操作電腦”升級(jí)到“會(huì)像工程師那樣做排障實(shí)驗(yàn)”,甚至于是說(shuō)“碰到問(wèn)題時(shí),會(huì)原地掏出一個(gè)機(jī)床自己制造一個(gè)特化對(duì)口的工具來(lái)處理問(wèn)題”。

還有呢?

反正都猜這么多了,不妨咱們就再往深了猜猜,我覺(jué)得Mythos的提升很可能來(lái)自幾種訓(xùn)練和推理技巧的疊加。

第一是更重的測(cè)試時(shí)計(jì)算,也就是模型會(huì)根據(jù)任務(wù)難度動(dòng)態(tài)分配更多“思考預(yù)算”,在關(guān)鍵步驟上做更長(zhǎng)、更深的推理,而不是一口氣線(xiàn)性吐完答案。

就像考試,普通的AI都是閉卷快答選手,不管是1分的選擇題,還是20分的壓軸大題,都是掃一眼就動(dòng)筆,寫(xiě)一步不回頭,勻速寫(xiě)完拉倒,哪怕題很難,也是順嘴瞎編湊數(shù)。

Mythos是學(xué)霸,拿到題先分難度,簡(jiǎn)單題秒答不浪費(fèi)時(shí)間;遇到復(fù)雜大題、關(guān)鍵步驟,就多打草稿、多琢磨幾遍,算對(duì)了再往下寫(xiě),卡殼了就停下來(lái)多想一層,絕不會(huì)張嘴就來(lái)。

第二是更偏向agent軌跡的強(qiáng)化學(xué)習(xí),訓(xùn)練目標(biāo)不再只是“最后一句話(huà)答對(duì)了沒(méi)有”,而是“整條任務(wù)鏈有沒(méi)有成功完成”,包括怎么拆計(jì)劃、何時(shí)調(diào)用工具、何時(shí)停下來(lái)驗(yàn)證、出錯(cuò)后如何回退。

原來(lái)的訓(xùn)練方式是只看“項(xiàng)目最后有沒(méi)有交差”,哪怕實(shí)習(xí)生中間瞎搞、找別人代做、步驟全錯(cuò),最后蒙對(duì)了結(jié)果,就發(fā)獎(jiǎng)金。

要是中間全對(duì),最后一步手抖錯(cuò)了,直接扣錢(qián),完全不管過(guò)程。

Mythos是全程盯流程,不僅看最后項(xiàng)目成沒(méi)成,還要看你會(huì)不會(huì)把大項(xiàng)目拆成一步一步的小計(jì)劃,什么時(shí)候該查資料、用工具,什么時(shí)候該停下來(lái)核對(duì)前面的內(nèi)容,做錯(cuò)了會(huì)不會(huì)回頭修正。

第三是更強(qiáng)的verifier,也就是某種內(nèi)置的審稿人或質(zhì)檢員,在代碼場(chǎng)景里檢查patch是否真的成立,在安全場(chǎng)景里檢查輸出是否顯著增加攻擊可執(zhí)行性。

這個(gè)你就當(dāng)成是公眾號(hào)發(fā)文章。普通AI是作者寫(xiě)完了直接發(fā),不管有沒(méi)有錯(cuò)別字、事實(shí)錯(cuò)誤、合規(guī)風(fēng)險(xiǎn),發(fā)出去出問(wèn)題再說(shuō)。

Mythos就和字母AI一樣,要有提綱、要有多道審核、還要去求證等等。這篇文章除外。

第四是更細(xì)粒度的風(fēng)險(xiǎn)監(jiān)控,不只看最終文本,而是看模型內(nèi)部表征和中間軌跡,判斷它是不是正在形成一條危險(xiǎn)的攻擊鏈。

這也是為什么我一直拿現(xiàn)代殺毒軟件和EDR來(lái)類(lèi)比。過(guò)去的殺毒軟件更像“對(duì)照病毒庫(kù)”,今天的安全系統(tǒng)更像“識(shí)別可疑行為模式”。

如果把這個(gè)邏輯搬到大模型里,Mythos的安全能力就可能不是靠硬編碼關(guān)鍵詞,而是靠對(duì)任務(wù)語(yǔ)義、工具調(diào)用順序、代碼行為和中間狀態(tài)的綜合判斷。

它識(shí)別的不是“某個(gè)壞答案”,而是“這個(gè)請(qǐng)求會(huì)造成怎樣的后果”。一旦這種能力成熟,安全就不再只是一個(gè)外掛過(guò)濾器,而會(huì)變成模型推理過(guò)程本身的一部分。

如果把這些能力串起來(lái)看,Mythos可能會(huì)是一個(gè)將語(yǔ)義泛化、長(zhǎng)任務(wù)穩(wěn)定性、工具編排、風(fēng)險(xiǎn)控制這幾件事給融合起來(lái)的新產(chǎn)品。

這也解釋了為什么Anthropic對(duì)Mythos如此謹(jǐn)慎。

一個(gè)能理解攻擊語(yǔ)義、能泛化發(fā)現(xiàn)漏洞、能編排長(zhǎng)鏈條任務(wù)、能自主使用工具的AI,這已經(jīng)是敲響AGI的防盜門(mén)了。

但這里有個(gè)更深層的問(wèn)題:當(dāng)AI的攻擊能力開(kāi)始系統(tǒng)性地超過(guò)防御能力,整個(gè)網(wǎng)絡(luò)安全的平衡會(huì)不會(huì)被打破?

如果未來(lái)幾個(gè)月Anthropic真的正式發(fā)布Mythos或者Capybara,那么最應(yīng)該盯緊的是它在computer use、terminal、browser這類(lèi)長(zhǎng)任務(wù)環(huán)境里的穩(wěn)定性。

因?yàn)檫@類(lèi)場(chǎng)景最能暴露一個(gè)模型到底只是“單輪回答強(qiáng)”,還是已經(jīng)具備“持續(xù)執(zhí)行”的系統(tǒng)能力。真正的階躍式變化,最后都會(huì)反映在這些難以偽裝美化的指標(biāo)上。

從這個(gè)角度看,Mythos泄密事件的真正意義,是揭示了AI發(fā)展的下一個(gè)臨界點(diǎn)。

而這個(gè)臨界點(diǎn),可能比我們想象的來(lái)得更快。

本文系作者 字母AI 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請(qǐng)注明出處、作者和本文鏈接。
本內(nèi)容來(lái)源于鈦媒體鈦度號(hào),文章內(nèi)容僅供參考、交流、學(xué)習(xí),不構(gòu)成投資建議。
想和千萬(wàn)鈦媒體用戶(hù)分享你的新奇觀(guān)點(diǎn)和發(fā)現(xiàn),點(diǎn)擊這里投稿 。創(chuàng)業(yè)或融資尋求報(bào)道,點(diǎn)擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評(píng)論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論

請(qǐng) 登錄后輸入評(píng)論內(nèi)容

快報(bào)

更多

2026-03-28 23:01

澤連斯基稱(chēng)與中東3國(guó)達(dá)成防務(wù)合作協(xié)議,涉聯(lián)合生產(chǎn)無(wú)人機(jī)

2026-03-28 22:35

山西太原一建筑發(fā)生火災(zāi),已致1人死亡25人受傷

2026-03-28 22:26

王文濤部長(zhǎng)發(fā)表書(shū)面致辭,支持世貿(mào)組織《電子商務(wù)協(xié)定》達(dá)成臨時(shí)實(shí)施安排

2026-03-28 21:54

40余家單位聯(lián)盟,中國(guó)最大人形機(jī)器人訓(xùn)練基地在京揭牌

2026-03-28 21:41

周鴻祎與劉慈欣在科幻大會(huì)預(yù)判:百億智能體或成新物種,AI推動(dòng)人類(lèi)文明分化

2026-03-28 21:38

第五代宏光MINIEV上市,售價(jià)4.48萬(wàn)-5.48萬(wàn)元

2026-03-28 20:42

烏稱(chēng)伊朗襲擊迪拜倉(cāng)庫(kù)并致烏克蘭人傷亡消息不實(shí)

2026-03-28 20:23

3月28日新聞聯(lián)播速覽23條

2026-03-28 20:05

美國(guó)務(wù)卿和歐盟官員被曝就烏克蘭問(wèn)題激烈交鋒

2026-03-28 19:44

“Token”這個(gè)詞的搜索量最高一天達(dá)到7.7萬(wàn)次,比去年日均搜索量高出1850%

2026-03-28 19:39

飛捷科思發(fā)布中國(guó)首個(gè)可微分物理仿真引擎Fysics

2026-03-28 19:13

“網(wǎng)售產(chǎn)品質(zhì)量安全提升系列行動(dòng)2026”在北京啟動(dòng)

2026-03-28 19:03

國(guó)務(wù)院食安辦、市場(chǎng)監(jiān)管總局約談相關(guān)地方市級(jí)人民政府負(fù)責(zé)人,督辦“3?15”晚會(huì)曝光問(wèn)題整改

2026-03-28 18:44

飛書(shū) CLI 開(kāi)源:AI 可直連飛書(shū)辦公套件

2026-03-28 18:36

馬來(lái)西亞說(shuō)伊朗允許馬滯留油輪通行霍爾木茲海峽

2026-03-28 18:02

今年前三個(gè)月中國(guó)創(chuàng)新藥對(duì)外授權(quán)交易總額超600億美元

2026-03-28 17:39

中國(guó)和菲律賓舉行南海問(wèn)題雙邊磋商機(jī)制第十一次會(huì)議

2026-03-28 17:30

印尼正式實(shí)施16歲以下社媒禁令,約7000萬(wàn)人受影響

2026-03-28 17:04

美國(guó)加州禁止官員借內(nèi)幕消息在預(yù)測(cè)市場(chǎng)牟利

2026-03-28 17:02

北京“超現(xiàn)場(chǎng)”生態(tài)共同體建設(shè)暨全國(guó)覆蓋啟動(dòng)

掃描下載App