這東西就跟概念車(chē)一樣。
先說(shuō)說(shuō)安全方面吧,很多人以為殺毒軟件還是靠“病毒庫(kù)”——就像警察拿著通緝犯照片挨個(gè)比對(duì)。但實(shí)際上,現(xiàn)代殺毒軟件和EDR(端點(diǎn)檢測(cè)與響應(yīng))系統(tǒng)早就不是這么干了。
它們會(huì)看文件結(jié)構(gòu)、監(jiān)控進(jìn)程行為、分析API調(diào)用模式、追蹤橫向移動(dòng)軌跡,甚至用機(jī)器學(xué)習(xí)判斷“這個(gè)行為像不像攻擊”。
換句話(huà)說(shuō),現(xiàn)代安全系統(tǒng)已經(jīng)不只是在找“已知的壞人”,而是在識(shí)別“可疑的行為模式”。
Mythos可能把這個(gè)邏輯又往前推了一步。它能理解攻擊的語(yǔ)義。
通過(guò)理解一段代碼、一串工具調(diào)用、一段對(duì)話(huà),判斷是不是在構(gòu)造一條真實(shí)可執(zhí)行的攻擊鏈。
比如它能分辨出:這不是普通的壓縮腳本,而是在做規(guī)避掃描、自啟動(dòng)、憑據(jù)竊取這一整套動(dòng)作;這不是正常的滲透測(cè)試問(wèn)答,而是在拼接exploit、持久化、橫移、出網(wǎng)這幾個(gè)步驟。
Mythos很可能具備“漏洞泛化發(fā)現(xiàn)”能力。
Anthropic 在今年2月的博客中提到,Opus 4.6找零日漏洞的方式不像傳統(tǒng)fuzzing那樣亂撞,而是通過(guò)理解代碼語(yǔ)義、歷史修復(fù)模式和相似bug特征,去找“還沒(méi)被修掉的同類(lèi)漏洞”。
看到一個(gè)漏洞后,它就能立刻聯(lián)想到“其他地方是不是也存在類(lèi)似的漏洞”。
Mythos在推理方面的提升,可能也不單單是說(shuō)benchmark分?jǐn)?shù)又高了幾分。
比如它可能在思考過(guò)程中更少出現(xiàn)中途漂移,更少為了迎合用戶(hù)而過(guò)度自信,更會(huì)顯式區(qū)分“已知、推斷、未知”,更會(huì)在不確定時(shí)保守行動(dòng)等等。
這和安全是同一類(lèi)底層能力。因?yàn)楹玫哪P筒恢皇歉鼤?huì)生成答案,而是更會(huì)管理自己的不確定性。
Claude的一大重點(diǎn)就是編程。所以我覺(jué)得在編程能力上,Mythos可能不只是“把代碼寫(xiě)地更好”,而是從“會(huì)寫(xiě)代碼”變成“會(huì)經(jīng)營(yíng)代碼庫(kù)”。
Mythos可能會(huì)把模塊邊界、依賴(lài)關(guān)系、歷史patch風(fēng)格、測(cè)試習(xí)慣放在一起進(jìn)行建模。
它會(huì)先拆改動(dòng)圖、再分批落patch,而不是想到哪改到哪;寫(xiě)完代碼后會(huì)主動(dòng)補(bǔ)測(cè)試、跑靜態(tài)檢查,根據(jù)失敗日志回滾到更穩(wěn)的方案。
這種能力對(duì)真實(shí)工程項(xiàng)目的價(jià)值,遠(yuǎn)超在測(cè)試集上多做對(duì)幾道題。
當(dāng)然最終要落到的地方,肯定是在線(xiàn)束(harness)上,Mythos很可能實(shí)現(xiàn)了從“單次回答強(qiáng)”到“整條執(zhí)行鏈穩(wěn)”的跨越。
它會(huì)把大任務(wù)拆成可驗(yàn)證的小階段,多個(gè)子任務(wù)并行執(zhí)行再匯總結(jié)果,在長(zhǎng)鏈條里保留關(guān)鍵狀態(tài)、丟掉噪聲。某一步報(bào)錯(cuò)時(shí)不需要從頭來(lái)過(guò),只要找到問(wèn)題發(fā)生地,對(duì)其局部進(jìn)行修復(fù),就可以繼續(xù)執(zhí)行任務(wù)。
就像游戲里的檢查點(diǎn),如果你沒(méi)有通過(guò)某一個(gè)BOSS,你不需要從頭開(kāi)始打整個(gè)章節(jié),你會(huì)被傳送到上一個(gè)檢查點(diǎn)。
這就像工業(yè)控制里的“線(xiàn)束管理”——不是某一根線(xiàn)更粗,而是整個(gè)連接、隔離、容錯(cuò)、標(biāo)記、回路設(shè)計(jì)更合理。
長(zhǎng)上下文能力的提升可能也不只是“窗口更大”,而是“上下文利用率更高”。
現(xiàn)在的大模型,一說(shuō)上下文窗口,每個(gè)都說(shuō)自己能裝下幾十萬(wàn)字,但是一問(wèn)它全文重點(diǎn)或者文檔關(guān)系,立刻就啞巴了。
Mythos如果真有進(jìn)步,可能體現(xiàn)在更強(qiáng)的重點(diǎn)檢測(cè)、更好的層級(jí)摘要、更準(zhǔn)的跨文檔對(duì)齊,以及更有效的持續(xù)記憶寫(xiě)回機(jī)制。
在工具使用上,Mythos可能從“會(huì)調(diào)工具”升級(jí)到“會(huì)設(shè)計(jì)實(shí)驗(yàn)”。
Anthropic已經(jīng)在推computer use、terminal、browser這套能力,但真正的跨越不是UI自動(dòng)化更強(qiáng),而是知道什么時(shí)候該讀代碼、什么時(shí)候該跑測(cè)試、什么時(shí)候該查文檔。
如何設(shè)計(jì)最小驗(yàn)證閉環(huán)、避免無(wú)效探索、控制成本。
通俗說(shuō),就是從“會(huì)操作電腦”升級(jí)到“會(huì)像工程師那樣做排障實(shí)驗(yàn)”,甚至于是說(shuō)“碰到問(wèn)題時(shí),會(huì)原地掏出一個(gè)機(jī)床自己制造一個(gè)特化對(duì)口的工具來(lái)處理問(wèn)題”。
反正都猜這么多了,不妨咱們就再往深了猜猜,我覺(jué)得Mythos的提升很可能來(lái)自幾種訓(xùn)練和推理技巧的疊加。
第一是更重的測(cè)試時(shí)計(jì)算,也就是模型會(huì)根據(jù)任務(wù)難度動(dòng)態(tài)分配更多“思考預(yù)算”,在關(guān)鍵步驟上做更長(zhǎng)、更深的推理,而不是一口氣線(xiàn)性吐完答案。
就像考試,普通的AI都是閉卷快答選手,不管是1分的選擇題,還是20分的壓軸大題,都是掃一眼就動(dòng)筆,寫(xiě)一步不回頭,勻速寫(xiě)完拉倒,哪怕題很難,也是順嘴瞎編湊數(shù)。
Mythos是學(xué)霸,拿到題先分難度,簡(jiǎn)單題秒答不浪費(fèi)時(shí)間;遇到復(fù)雜大題、關(guān)鍵步驟,就多打草稿、多琢磨幾遍,算對(duì)了再往下寫(xiě),卡殼了就停下來(lái)多想一層,絕不會(huì)張嘴就來(lái)。
第二是更偏向agent軌跡的強(qiáng)化學(xué)習(xí),訓(xùn)練目標(biāo)不再只是“最后一句話(huà)答對(duì)了沒(méi)有”,而是“整條任務(wù)鏈有沒(méi)有成功完成”,包括怎么拆計(jì)劃、何時(shí)調(diào)用工具、何時(shí)停下來(lái)驗(yàn)證、出錯(cuò)后如何回退。
原來(lái)的訓(xùn)練方式是只看“項(xiàng)目最后有沒(méi)有交差”,哪怕實(shí)習(xí)生中間瞎搞、找別人代做、步驟全錯(cuò),最后蒙對(duì)了結(jié)果,就發(fā)獎(jiǎng)金。
要是中間全對(duì),最后一步手抖錯(cuò)了,直接扣錢(qián),完全不管過(guò)程。
Mythos是全程盯流程,不僅看最后項(xiàng)目成沒(méi)成,還要看你會(huì)不會(huì)把大項(xiàng)目拆成一步一步的小計(jì)劃,什么時(shí)候該查資料、用工具,什么時(shí)候該停下來(lái)核對(duì)前面的內(nèi)容,做錯(cuò)了會(huì)不會(huì)回頭修正。
第三是更強(qiáng)的verifier,也就是某種內(nèi)置的審稿人或質(zhì)檢員,在代碼場(chǎng)景里檢查patch是否真的成立,在安全場(chǎng)景里檢查輸出是否顯著增加攻擊可執(zhí)行性。
這個(gè)你就當(dāng)成是公眾號(hào)發(fā)文章。普通AI是作者寫(xiě)完了直接發(fā),不管有沒(méi)有錯(cuò)別字、事實(shí)錯(cuò)誤、合規(guī)風(fēng)險(xiǎn),發(fā)出去出問(wèn)題再說(shuō)。
Mythos就和字母AI一樣,要有提綱、要有多道審核、還要去求證等等。這篇文章除外。
第四是更細(xì)粒度的風(fēng)險(xiǎn)監(jiān)控,不只看最終文本,而是看模型內(nèi)部表征和中間軌跡,判斷它是不是正在形成一條危險(xiǎn)的攻擊鏈。
這也是為什么我一直拿現(xiàn)代殺毒軟件和EDR來(lái)類(lèi)比。過(guò)去的殺毒軟件更像“對(duì)照病毒庫(kù)”,今天的安全系統(tǒng)更像“識(shí)別可疑行為模式”。
如果把這個(gè)邏輯搬到大模型里,Mythos的安全能力就可能不是靠硬編碼關(guān)鍵詞,而是靠對(duì)任務(wù)語(yǔ)義、工具調(diào)用順序、代碼行為和中間狀態(tài)的綜合判斷。
它識(shí)別的不是“某個(gè)壞答案”,而是“這個(gè)請(qǐng)求會(huì)造成怎樣的后果”。一旦這種能力成熟,安全就不再只是一個(gè)外掛過(guò)濾器,而會(huì)變成模型推理過(guò)程本身的一部分。
如果把這些能力串起來(lái)看,Mythos可能會(huì)是一個(gè)將語(yǔ)義泛化、長(zhǎng)任務(wù)穩(wěn)定性、工具編排、風(fēng)險(xiǎn)控制這幾件事給融合起來(lái)的新產(chǎn)品。
這也解釋了為什么Anthropic對(duì)Mythos如此謹(jǐn)慎。
一個(gè)能理解攻擊語(yǔ)義、能泛化發(fā)現(xiàn)漏洞、能編排長(zhǎng)鏈條任務(wù)、能自主使用工具的AI,這已經(jīng)是敲響AGI的防盜門(mén)了。
但這里有個(gè)更深層的問(wèn)題:當(dāng)AI的攻擊能力開(kāi)始系統(tǒng)性地超過(guò)防御能力,整個(gè)網(wǎng)絡(luò)安全的平衡會(huì)不會(huì)被打破?
如果未來(lái)幾個(gè)月Anthropic真的正式發(fā)布Mythos或者Capybara,那么最應(yīng)該盯緊的是它在computer use、terminal、browser這類(lèi)長(zhǎng)任務(wù)環(huán)境里的穩(wěn)定性。
因?yàn)檫@類(lèi)場(chǎng)景最能暴露一個(gè)模型到底只是“單輪回答強(qiáng)”,還是已經(jīng)具備“持續(xù)執(zhí)行”的系統(tǒng)能力。真正的階躍式變化,最后都會(huì)反映在這些難以偽裝美化的指標(biāo)上。
從這個(gè)角度看,Mythos泄密事件的真正意義,是揭示了AI發(fā)展的下一個(gè)臨界點(diǎn)。
而這個(gè)臨界點(diǎn),可能比我們想象的來(lái)得更快。
快報(bào)
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論