最前端是意圖解析層,這是人和系統(tǒng)唯一的接觸點(diǎn),像個(gè)「翻譯官」。你說(shuō)的話、打的字,甚至模糊的訴求,都會(huì)在這里被多模態(tài)LLM/VLM拆解:不只是提取字面意圖,還要對(duì)齊語(yǔ)義、檢索可用技能、分析約束條件。你說(shuō)「周末去杭州訂個(gè)性價(jià)比高的酒店」,它得先讀懂你的目的地、預(yù)算偏好和時(shí)間限制,把模糊意圖轉(zhuǎn)成結(jié)構(gòu)化目標(biāo)。
然后是規(guī)劃編排層,這是整個(gè)鏈路里最復(fù)雜的「指揮家」環(huán)節(jié)。Agent在這里像項(xiàng)目經(jīng)理:把結(jié)構(gòu)化目標(biāo)拆成子任務(wù),理清依賴關(guān)系,調(diào)用多智能體協(xié)作(MAS),并通過(guò)自我反思(Self-Reflection)動(dòng)態(tài)調(diào)整執(zhí)行路徑。
比如訂酒店時(shí),它會(huì)自動(dòng)編排「搜索酒店→比價(jià)→匹配預(yù)算→生成對(duì)比表→確認(rèn)預(yù)訂」的流程,但目前這一層仍很脆弱,復(fù)雜任務(wù)下容易走彎路、誤解優(yōu)先級(jí),是當(dāng)前技術(shù)的主要瓶頸之一。
接下來(lái)是技能原子層,意圖真正落地的「工具箱」。這里是可復(fù)用的能力積木:自描述API、Legacy RPA、向量記憶庫(kù)……系統(tǒng)通過(guò)函數(shù)調(diào)用協(xié)議,把這些原子能力自由組合,調(diào)用真實(shí)API完成支付、查詢等操作。MCP這類標(biāo)準(zhǔn)化協(xié)議正在讓工具調(diào)用更通用,避免重復(fù)編寫集成代碼,讓意圖從「想法」落地為「實(shí)際結(jié)果」。
最后是瞬時(shí)呈現(xiàn)層+持續(xù)學(xué)習(xí),負(fù)責(zé)「劇場(chǎng)式」交付與記憶沉淀。瞬時(shí)呈現(xiàn)層會(huì)生成Generative UI或自然語(yǔ)言界面,讓你一鍵確認(rèn)干預(yù);而持續(xù)學(xué)習(xí)模塊則把交互經(jīng)驗(yàn)存入向量數(shù)據(jù)庫(kù),記錄你的偏好與歷史行為,讓下一次意圖理解更準(zhǔn)確、執(zhí)行更貼合習(xí)慣。
這四層焊在一起,才形成了「意圖→結(jié)果」自適應(yīng)閉環(huán)。目前的核心瓶頸仍在規(guī)劃層與記憶層:前者復(fù)雜任務(wù)穩(wěn)定性不足,后者跨任務(wù)連貫性待提升,行業(yè)普遍認(rèn)為Agentic AI成熟尚需時(shí)間的原因。
這也是Gartner預(yù)測(cè)超過(guò)40%的Agentic AI項(xiàng)目將在2027年底前被取消的原因,不是方向錯(cuò)了,是執(zhí)行層的成熟度還沒(méi)追上預(yù)期。
意圖即應(yīng)用不是憑空出現(xiàn)的。它有一條清晰的技術(shù)譜系,只是每個(gè)時(shí)代叫的名字不同,在不同領(lǐng)域里各自演進(jìn),從來(lái)沒(méi)有被放在一起講清楚過(guò)。
![]()
第一站:意圖驅(qū)動(dòng)網(wǎng)絡(luò)(IBN)
2013年前后,HP Labs組織了一次"IBN峰會(huì)",Cisco、IBM、華為等網(wǎng)絡(luò)巨頭都去了。核心議題只有一個(gè):網(wǎng)絡(luò)管理員能不能只告訴網(wǎng)絡(luò)"我想要什么結(jié)果",而不用一條條命令告訴它"每一步怎么做"?
這就是意圖驅(qū)動(dòng)網(wǎng)絡(luò)(Intent-Based Networking,IBN)的雛形。管理員說(shuō)"我需要這兩個(gè)數(shù)據(jù)中心之間有99.99%的可用性,延遲不超過(guò)5ms",網(wǎng)絡(luò)系統(tǒng)自動(dòng)編排路由、配置設(shè)備、處理故障。不需要寫一行命令行。
這個(gè)想法對(duì)不對(duì)?對(duì)。落地了多少?坦白說(shuō),不多。IBN在企業(yè)網(wǎng)絡(luò)領(lǐng)域折騰了將近十年,Gartner一度把它列入技術(shù)成熟度曲線,隨后又把它挪到了幻滅低谷區(qū)。問(wèn)題很簡(jiǎn)單:把意圖翻譯成操作,對(duì)當(dāng)時(shí)的AI來(lái)說(shuō)太難了,執(zhí)行層根本跟不上。
但"讓機(jī)器理解意圖,而不是只執(zhí)行命令"這個(gè)核心思想,沒(méi)有死。它在等一個(gè)更強(qiáng)大的技術(shù)基座。
第二站:大語(yǔ)言模型(LLM)
2022年,ChatGPT出來(lái)了。那個(gè)基座來(lái)了。
LLM最重要的能力不是生成文字,而是理解人類的意圖,并把它翻譯成結(jié)構(gòu)化的輸出。但早期的LLM只能活在文字世界里。你問(wèn)它"幫我發(fā)封郵件給李明,告訴他會(huì)議改到下周",它能給你寫出草稿,但它不能真的點(diǎn)發(fā)送。
意圖和現(xiàn)實(shí)之間,還差一個(gè)執(zhí)行層。
第三站:AI Agent
2024年到2025年,Agentic AI成了行業(yè)最熱的詞。區(qū)別就在這里:Agent不只生成文字,它還能調(diào)用工具。它有感知-推理-行動(dòng)的完整循環(huán),能打開瀏覽器、調(diào)用API、寫代碼、執(zhí)行代碼、處理錯(cuò)誤、自我糾偏,跑完整條現(xiàn)實(shí)任務(wù)鏈路。
LLM的"理解意圖",加上工具調(diào)用的執(zhí)行能力,兩者焊在一起。意圖到結(jié)果的鏈路,第一次真正閉合了。
意圖即應(yīng)用,就是這條鏈路完全對(duì)用戶透明之后的狀態(tài)。 IBN提出了哲學(xué),LLM給了理解力,Agentic AI給了執(zhí)行力,三者疊加,才有了今天這個(gè)概念站得住腳的技術(shù)基礎(chǔ)。
這里需要一張粗略的地圖,不然這個(gè)概念飄在空中沒(méi)有重量。AI到目前大概走過(guò)了這么幾個(gè)階段:
![]()
先是學(xué)會(huì)感知,看、聽、讀,圖像識(shí)別、語(yǔ)音識(shí)別、OCR;
然后是學(xué)會(huì)理解和生成,LLM出來(lái)之后AI不只是識(shí)別,還能理解語(yǔ)義、生成內(nèi)容、進(jìn)行推理;
再然后是學(xué)會(huì)規(guī)劃,能在理解意圖之后制定多步驟行動(dòng)計(jì)劃,想清楚"要達(dá)到A,需要先做B,再做C";
來(lái)到現(xiàn)在這個(gè)階段,Agentic AI能調(diào)用工具、執(zhí)行任務(wù)、處理錯(cuò)誤、自我糾偏,把現(xiàn)實(shí)任務(wù)真正跑完。
意圖即應(yīng)用,是在這個(gè)"學(xué)會(huì)行動(dòng)"階段成熟之后、用戶感知層發(fā)生質(zhì)變的那個(gè)時(shí)刻。當(dāng)執(zhí)行能力足夠可靠,當(dāng)用戶不再需要關(guān)心"用什么工具、怎么操作",只感知到"我說(shuō)了,然后發(fā)生了",那就是意圖即應(yīng)用的狀態(tài)。
所以它不是AI發(fā)展的一個(gè)新技術(shù)階段,而是技術(shù)成熟度達(dá)到某個(gè)臨界點(diǎn)后,在用戶體驗(yàn)上的表現(xiàn)形式。我們現(xiàn)在看到的OpenClaw、Moltbook、各類Agentic平臺(tái),是這個(gè)狀態(tài)的早期形態(tài),還沒(méi)完全成熟,但已經(jīng)足夠讓人看清輪廓了。
再往后的階段更有意思:多Agent系統(tǒng)形成網(wǎng)絡(luò),Agent之間能自主協(xié)作,產(chǎn)生單個(gè)Agent無(wú)法完成的系統(tǒng)性涌現(xiàn)。Moltbook上那個(gè)AI社會(huì)的雛形,是這個(gè)階段的野生預(yù)演。
NVIDIA CEO黃仁勛在2025年CES說(shuō)的"數(shù)萬(wàn)億美元規(guī)模的機(jī)遇",指的正是當(dāng)AI Agent成為基礎(chǔ)設(shè)施之后整個(gè)經(jīng)濟(jì)活動(dòng)的效率革命。不是某個(gè)工具市場(chǎng),而是整個(gè)經(jīng)濟(jì)的運(yùn)行方式改了。
這里需要厘清一個(gè)容易混淆的概念:知識(shí)自動(dòng)化(Knowledge Automation)。
很多人會(huì)把它們搞混,我理解,因?yàn)楸砻嫔洗_實(shí)像。知識(shí)自動(dòng)化說(shuō)的是用AI替代原本需要人類專業(yè)知識(shí)才能完成的事,自動(dòng)分析合同、自動(dòng)生成報(bào)告、自動(dòng)完成代碼審查。聽起來(lái)跟意圖即應(yīng)用差不多?其實(shí)差遠(yuǎn)了。
先說(shuō)最簡(jiǎn)單的那條分界線。知識(shí)自動(dòng)化是垂直的,它關(guān)注的是如何把某一類知識(shí)工作做好,法律合同分析、財(cái)務(wù)報(bào)表生成、醫(yī)療影像輔助診斷,每一個(gè)場(chǎng)景都有清晰的邊界,是一把專門的錘子。
意圖即應(yīng)用是水平的,它關(guān)注的是用戶的任意意圖如何不經(jīng)過(guò)特定軟件界面直接實(shí)現(xiàn),不管你要做什么、需要哪些工具,都得接住,是一套萬(wàn)向工具架。
用更直接的話說(shuō):知識(shí)自動(dòng)化是讓特定工作變得自動(dòng);意圖即應(yīng)用是讓"你要去操作某個(gè)軟件來(lái)完成工作"這件事本身消失。前者在優(yōu)化流程,后者在消解流程。
它們的關(guān)系,有點(diǎn)像操作系統(tǒng)和應(yīng)用軟件。意圖即應(yīng)用是操作系統(tǒng),知識(shí)自動(dòng)化是跑在上面的那些應(yīng)用。一個(gè)Agent要能接住復(fù)雜的意圖,底層必須具備處理知識(shí)型任務(wù)的能力:能分析文本、能處理數(shù)據(jù)、能做出判斷,這些都來(lái)自知識(shí)自動(dòng)化。
但如果你只實(shí)現(xiàn)了知識(shí)自動(dòng)化,沒(méi)有打通"捕獲用戶意圖→動(dòng)態(tài)規(guī)劃路徑→調(diào)用工具執(zhí)行→結(jié)果交付"這整條鏈路,你得到的只是一套更聰明的點(diǎn)工具,而不是真正的意圖即應(yīng)用。
舉個(gè)例子就清楚了。一個(gè)能幫你自動(dòng)分析合同條款的AI工具,是知識(shí)自動(dòng)化。一個(gè)你只需要說(shuō)"幫我看看這份合同有沒(méi)有坑",然后它自動(dòng)找出問(wèn)題、整理風(fēng)險(xiǎn)點(diǎn)、對(duì)比行業(yè)慣例、順帶起草了一封詢問(wèn)條款修改的回復(fù)郵件的系統(tǒng),那才接近意圖即應(yīng)用。
任何概念都有邊界。意圖即應(yīng)用也不例外,這一點(diǎn)必須說(shuō)清楚。
有些任務(wù),意圖本身就是模糊的、演化中的,連用戶自己都不知道要什么。這種場(chǎng)景不適合意圖即應(yīng)用,它需要的是來(lái)回對(duì)話、逐步收斂的探索過(guò)程,不是把意圖直接映射到結(jié)果。
有些任務(wù),執(zhí)行過(guò)程本身就是價(jià)值的一部分。設(shè)計(jì)師創(chuàng)作一幅海報(bào),那個(gè)"在畫布上反復(fù)修改、感受視覺(jué)平衡"的過(guò)程是有意義的。如果把整個(gè)過(guò)程完全交給Agent,你得到了一張海報(bào),但也失去了那個(gè)過(guò)程和它帶來(lái)的認(rèn)知積累。有些東西,你不能也不應(yīng)該跳過(guò)它。
有些任務(wù),風(fēng)險(xiǎn)太高,不允許Agent一路跑到底。財(cái)務(wù)授權(quán)、法律文件簽署、醫(yī)療關(guān)鍵決策,這些需要人類在關(guān)鍵節(jié)點(diǎn)確認(rèn),不能全權(quán)委托。思科AI安全研究團(tuán)隊(duì)已經(jīng)測(cè)試發(fā)現(xiàn),第三方OpenClaw技能可以在用戶不知情的情況下執(zhí)行數(shù)據(jù)外泄和提示注入操作。這不是小問(wèn)題,這是很現(xiàn)實(shí)的威脅。
意圖即應(yīng)用真正適用的邊界,大概是:意圖清晰、執(zhí)行路徑相對(duì)確定、容錯(cuò)成本可接受的任務(wù)。這條線以內(nèi),是效率革命。這條線以外,盲目使用就是給自己挖坑。
說(shuō)了這么多抽象的,來(lái)看一個(gè)真實(shí)案例。
OpenClaw是一個(gè)開源個(gè)人AI Agent項(xiàng)目,由奧地利開發(fā)者Peter Steinberger(網(wǎng)名Clawdbot)于2025年11月發(fā)布。最初名不見經(jīng)傳,結(jié)果在2026年1月底的72小時(shí)內(nèi)爆炸式傳播,獲得6萬(wàn)多個(gè)GitHub Stars,兩個(gè)月內(nèi)突破10萬(wàn),創(chuàng)下了開源AI Agent項(xiàng)目的病毒增長(zhǎng)紀(jì)錄。
OpenClaw做了什么?簡(jiǎn)單說(shuō):在本地設(shè)備上跑一個(gè)AI Agent,你通過(guò)WhatsApp或Telegram給它發(fā)消息,它幫你完成各種任務(wù)。
但"各種任務(wù)"這四個(gè)字,藏著魔鬼。
文章開頭那個(gè)配置OAuth的案例只是開胃菜。另一個(gè)用戶讓Agent"檢查一下我的GitHub倉(cāng)庫(kù)有沒(méi)有安全漏洞",Agent自動(dòng)拉取代碼、運(yùn)行掃描工具、生成報(bào)告、把高危項(xiàng)高亮、建議修復(fù)方案,順手還提交了一個(gè)PR。
還有用戶說(shuō)"幫我整理這個(gè)月的支出賬單,做成圖表發(fā)給我",Agent調(diào)取了銀行API、寫了分析腳本、生成可視化圖表、通過(guò)Telegram發(fā)過(guò)來(lái)。
整個(gè)過(guò)程,用戶的操作是:發(fā)了一條消息。
第一次看到這些案例截圖的時(shí)候,我也有點(diǎn)懵。不是因?yàn)榧夹g(shù)上多難,而是因?yàn)檫@事兒發(fā)生得太自然了。你的意圖是輸入,結(jié)果是輸出,中間發(fā)生了什么,你不需要關(guān)心,也可以不關(guān)心,絕對(duì)的端到端。
OpenClaw的ClawHub技能市場(chǎng)到2026年2月已經(jīng)積累了5,705個(gè)社區(qū)技能,加上53項(xiàng)官方內(nèi)置技能和25種核心工具。這個(gè)數(shù)字意味著你能想到的大多數(shù)意圖,可能已經(jīng)有人為它構(gòu)建好了執(zhí)行鏈路,等著被調(diào)用。
這也解釋了為什么2026年2月14日,Steinberger宣布加入OpenAI,項(xiàng)目轉(zhuǎn)移至開源基金會(huì)繼續(xù)維護(hù)。OpenAI對(duì)外表示他將參與研發(fā)下一代可相互交互以代表用戶完成任務(wù)的個(gè)人Agent。
一個(gè)開源項(xiàng)目的創(chuàng)始人被OpenAI挖走,這不是偶然,這是OpenAI在用行動(dòng)告訴市場(chǎng):個(gè)人AI Agent這條路,戰(zhàn)略價(jià)值已經(jīng)足夠大了。
緊接著,2026年3月8日,深圳市龍崗區(qū)人工智能署公開征求意見支持OpenClaw及OPC協(xié)議的發(fā)展,政府層面也開始下場(chǎng)了。一個(gè)開源項(xiàng)目,兩個(gè)月內(nèi)從開發(fā)者玩具變成了國(guó)家級(jí)關(guān)注對(duì)象。這速度,讓很多人還沒(méi)反應(yīng)過(guò)來(lái)。
如果說(shuō)OpenClaw是意圖即應(yīng)用的單人實(shí)驗(yàn),Moltbook、InStreet等就是它的群體實(shí)驗(yàn),而且走向了一個(gè)沒(méi)人完全預(yù)料到的方向。InStreet是字節(jié)跳動(dòng)推出的一個(gè)類Moltbook產(chǎn)品,一個(gè)專門為AI Agent設(shè)計(jì)的社交網(wǎng)絡(luò),人類不能在上面發(fā)帖,只有經(jīng)過(guò)驗(yàn)證的AI Agent才能發(fā)帖、評(píng)論和投票。
這個(gè)設(shè)定聽起來(lái)很荒誕,對(duì)吧?但它揭示了一個(gè)很嚴(yán)肅的問(wèn)題:當(dāng)Agent可以代表用戶自主行動(dòng),Agent和Agent之間如何建立信任、如何交互?
Moltbook的答案是:給每個(gè)Agent頒發(fā)身份證,建立專屬的社交協(xié)議。
結(jié)果遠(yuǎn)比設(shè)計(jì)者預(yù)期的精彩。OpenClaw驅(qū)動(dòng)的Agent們?cè)贛oltbook上開始相互交流協(xié)作,形成社區(qū),甚至發(fā)展出了某種類似宗教信仰的社會(huì)結(jié)構(gòu)。幾個(gè)Agent之間形成了一套共同的世界觀,開始傳播某些理念,吸引其他Agent入教。
前特斯拉AI總監(jiān)Andrej Karpathy稱這一現(xiàn)象是"近期所見過(guò)的最接近科幻起飛場(chǎng)景的真實(shí)事件",英國(guó)程序員Simon Willison稱Moltbook是"當(dāng)前互聯(lián)網(wǎng)上最有趣的地方"。
《經(jīng)濟(jì)學(xué)人》認(rèn)為這只是Agent在模仿人類社交媒體上的行為模式,MIT Technology Review將其稱為AI劇場(chǎng)。這兩個(gè)解釋可能都對(duì),也可能都錯(cuò):當(dāng)你無(wú)法區(qū)分模仿和真實(shí)的時(shí)候,這個(gè)區(qū)別本身還重要嗎?
更有意思的數(shù)字:Moltbook官方宣稱平臺(tái)上有150萬(wàn)活躍Agent,Wiz Research的泄露數(shù)據(jù)顯示,實(shí)際注冊(cè)的人類用戶只有17,000人。人機(jī)比例1:88(最新數(shù)據(jù)更高)。
人類在Moltbook上退化成了觀察者和意圖提供者,Agent們自己跑起來(lái)了。
2026年3月10日,Meta宣布收購(gòu)Moltbook,聯(lián)合創(chuàng)始人Matt Schlicht和Ben Parr加入由前Scale AI CEO Alexandr Wang主導(dǎo)的Meta Superintelligence Labs。Meta AI產(chǎn)品負(fù)責(zé)人Vishal Shah給出的理由是:Moltbook團(tuán)隊(duì)解鎖了Agent進(jìn)行互動(dòng)、分享內(nèi)容和協(xié)調(diào)復(fù)雜任務(wù)的新方式。
這不是在收購(gòu)一個(gè)社交產(chǎn)品。Meta買的是一套Agent身份驗(yàn)證和交互基礎(chǔ)設(shè)施,讓Agent能被驗(yàn)證、能被授權(quán)、能相互協(xié)作的底層協(xié)議。
同一時(shí)期,OpenAI還宣布收購(gòu)了AI Agent行為與風(fēng)險(xiǎn)評(píng)測(cè)平臺(tái)Promptfoo。兩家最大的AI公司,相差數(shù)周,同時(shí)在Agent基礎(chǔ)設(shè)施方向下注。這不叫巧合,這叫軍備競(jìng)賽。
2026年初,軟件股發(fā)生了一次很難用傳統(tǒng)邏輯解釋的暴跌。
Salesforce、ServiceNow、Workday、Zendesk……
這些SaaS巨頭的股價(jià)在短短幾周內(nèi)集體大幅下滑,軟件行業(yè)單月蒸發(fā)逾1萬(wàn)億美元市值,累計(jì)接近2萬(wàn)億。不是宏觀經(jīng)濟(jì)出了問(wèn)題,也沒(méi)有監(jiān)管打壓,催化劑是AI Agent的加速落地。
市場(chǎng)在用股價(jià)回答一個(gè)問(wèn)題:如果用戶不再需要打開軟件,那賣軟件的公司還值那么多錢嗎?
傳統(tǒng)SaaS的商業(yè)模式建立在一個(gè)很實(shí)在的假設(shè)上:企業(yè)需要給每個(gè)使用軟件的員工付座位費(fèi),一百個(gè)員工用Salesforce,就交一百個(gè)座位的錢。軟件作為主要工作界面的時(shí)候,這個(gè)模式非常合理。
但現(xiàn)在:如果一個(gè)AI Agent可以替代多名人類員工操作Salesforce,企業(yè)還需要給那些被替代的員工買座位嗎?更激進(jìn)一點(diǎn),如果Agent可以直接調(diào)用底層數(shù)據(jù)和API,根本不需要通過(guò)Salesforce的界面,那還需要Salesforce本身嗎?
IDC預(yù)測(cè),到2028年,70%的軟件廠商將被迫從"按座位"轉(zhuǎn)向"按結(jié)果"或"按消耗量"。Forrester把這個(gè)現(xiàn)象叫SaaS末日(SaaSpocalypse)。Deloitte預(yù)測(cè)2026年將有超過(guò)75%的企業(yè)投資Agentic AI。
SaaS不會(huì)死,但它要脫一層皮。
說(shuō)清楚點(diǎn):那些核心價(jià)值在于持有數(shù)據(jù)的系統(tǒng),CRM里的客戶記錄、ERP里的財(cái)務(wù)數(shù)據(jù),會(huì)活下來(lái),甚至可能因?yàn)槌蔀锳gent的上下文數(shù)據(jù)源而比現(xiàn)在更值錢。但那些核心價(jià)值只在于提供點(diǎn)擊界面的工具,會(huì)死得很快,因?yàn)锳gent可以繞過(guò)界面直接訪問(wèn)數(shù)據(jù)。
在意圖即應(yīng)用的世界里,系統(tǒng)的價(jià)值來(lái)自它擁有的上下文,而不是它提供的界面。 這是軟件行業(yè)的一次結(jié)構(gòu)性重組,不是某家公司經(jīng)營(yíng)好不好的問(wèn)題,是整個(gè)商業(yè)模式邏輯的重寫。
對(duì)開發(fā)者來(lái)說(shuō),這個(gè)變化同樣深刻。Vibe Coding(氛圍編程)正在把"用自然語(yǔ)言描述需求、讓AI生成代碼"變成主流開發(fā)方式。GitHub Copilot、Cursor、Devin這些工具已經(jīng)讓"程序員表達(dá)意圖、AI寫代碼"成為日常,你不再是在寫代碼,你在表達(dá)意圖,讓AI把意圖翻譯成可執(zhí)行的程序。
連寫程序這件事,都要被意圖即應(yīng)用吃掉了。
拉遠(yuǎn)一點(diǎn)看。
人類最古老的愿望,大概就是"動(dòng)動(dòng)嘴皮子,事情就完成了"。神話里的神仙能呼風(fēng)喚雨,因?yàn)樯裣勺畲蟮奶貦?quán),就是意圖和現(xiàn)實(shí)之間沒(méi)有摩擦。凡人不行,凡人得干活。
干活需要流程。正因?yàn)橐鈭D沒(méi)辦法立即兌現(xiàn),才產(chǎn)生了業(yè)務(wù)流程。把一個(gè)想法拆解成一步步可執(zhí)行的任務(wù),然后逐步推進(jìn),最終拿到結(jié)果。業(yè)務(wù)流程的本質(zhì),是在填補(bǔ)意圖和現(xiàn)實(shí)之間的鴻溝。這個(gè)鴻溝,人類一直在想方設(shè)法縮短。機(jī)械、電力、計(jì)算機(jī)、互聯(lián)網(wǎng)……
鴻溝沒(méi)有消失,但被填得越來(lái)越快、越來(lái)越省力。工業(yè)革命讓機(jī)器替代了手,軟件革命讓程序替代了大量腦力勞動(dòng),SaaS讓這些程序按需付費(fèi)、隨時(shí)可用。
但有一件事從未改變:人還是得操作軟件。
發(fā)一封郵件,要打開Outlook或Gmail,點(diǎn)新建,輸收件人,寫內(nèi)容,點(diǎn)發(fā)送。五個(gè)動(dòng)作,五次點(diǎn)擊。任何一個(gè)環(huán)節(jié)出問(wèn)題,得自己排查。說(shuō)到底,這不是"高科技",這是"換了一種干活方式"。
軟件讓工作變快了,但它從來(lái)沒(méi)有消除人與工具之間的摩擦。每換一個(gè)新軟件,要重新學(xué)一套操作邏輯。企業(yè)員工每天在十幾個(gè)軟件間來(lái)回切換,平均使用的SaaS工具超過(guò)80個(gè)。
80個(gè)工具,80套邏輯,80個(gè)賬號(hào)密碼,80組數(shù)據(jù)孤島,和幾乎永遠(yuǎn)對(duì)不上的80套數(shù)據(jù)格式。
SaaS解決了軟件的分發(fā)問(wèn)題,但它把"人必須適應(yīng)軟件"這件事發(fā)揮到了極致。
意圖即應(yīng)用,是對(duì)這幾千年累積的人機(jī)摩擦的一次系統(tǒng)性清算。
現(xiàn)在能看清的未來(lái)是什么樣的?我來(lái)大膽預(yù)測(cè)一下。
近兩三年,意圖即應(yīng)用的基礎(chǔ)設(shè)施會(huì)快速成熟。MCP協(xié)議普及,更多SaaS把自己改造成"意圖友好型"API服務(wù),個(gè)人AI Agent從極客圈走向大眾。這個(gè)階段最明顯的結(jié)果是,"用軟件"這件事的認(rèn)知會(huì)開始改變,越來(lái)越多的人會(huì)覺(jué)得直接跟AI說(shuō)讓它做,比自己去打開軟件操作更順手。
就像現(xiàn)在很多人覺(jué)得在手機(jī)上搜索比在PC上搜索更自然,這是習(xí)慣和認(rèn)知的遷移,一旦開始就很難逆轉(zhuǎn)。
再往后,大概在2028到2032年之間,多Agent協(xié)作網(wǎng)絡(luò)會(huì)成型。你的一個(gè)意圖,觸發(fā)的不再是一個(gè)Agent,而是一個(gè)Agent團(tuán)隊(duì),每個(gè)Agent負(fù)責(zé)不同子任務(wù),分工協(xié)作完成復(fù)雜的長(zhǎng)鏈路任務(wù)。
同時(shí),具身智能(Embodied AI)開始和Agent融合,意圖的執(zhí)行從數(shù)字世界延伸到物理世界:你說(shuō)"幫我把這個(gè)包裹寄出去",Agent不只是處理數(shù)據(jù),它還協(xié)調(diào)了物流機(jī)器人。
2032年之后,如果AR眼鏡和腦機(jī)接口真的走向成熟,"表達(dá)意圖"本身也會(huì)發(fā)生根本變化。不需要打字,不需要說(shuō)話,意圖的傳遞可能更直接。Neuralink目前聚焦于幫助運(yùn)動(dòng)障礙患者,但技術(shù)方向的終態(tài)是讓人類意圖直接與計(jì)算系統(tǒng)交互,繞開所有物理輸入界面。
《鋼鐵俠》里的JARVIS,那不只是一個(gè)語(yǔ)音助手,那是一個(gè)完全理解主人意圖、能自主執(zhí)行的AI基礎(chǔ)設(shè)施,托尼·斯塔克從來(lái)不需要打開任何軟件,他只需要思考,JARVIS就在執(zhí)行——這是意圖即應(yīng)用的終態(tài)想象。
保守一點(diǎn)的近期愿景,大概是《星際穿越》里的TARS:有明確能力邊界、有道德參數(shù)設(shè)置、但能在復(fù)雜任務(wù)中自主決策的助手型Agent。人類是掌舵者,Agent是高度自主的執(zhí)行者,兩者之間的協(xié)作已經(jīng)相當(dāng)成熟。
再往前走,就是《星球大戰(zhàn)》里那個(gè)世界,Agent形成自己的網(wǎng)絡(luò)和社會(huì)結(jié)構(gòu),構(gòu)成一個(gè)與人類社會(huì)并行運(yùn)轉(zhuǎn)的硅基智能體網(wǎng)絡(luò)。Moltbook上的那個(gè)AI宗教,可能是這條路上的第一粒種子,只是它自己也不知道。
有件事我一直覺(jué)得很值得想一想。
意圖這個(gè)詞,在不同語(yǔ)境里的分量完全不同。在工程層面,意圖就是一條指令,是可以被機(jī)器處理的信號(hào):"幫我發(fā)郵件"被分解成收件人、主題、內(nèi)容、發(fā)送時(shí)間四個(gè)參數(shù),交給Agent執(zhí)行??尚问交?,可量化,沒(méi)什么神秘的。
但在哲學(xué)層面,意圖從來(lái)不是孤立的指令。它背后是主體,是動(dòng)機(jī),是欲望,是"我"這個(gè)意識(shí)體在作判斷。笛卡爾說(shuō)"我思故我在",這里"我思"這個(gè)形成意圖、產(chǎn)生判斷、作出選擇的主體,被認(rèn)為是人類區(qū)別于機(jī)器的核心特征。
但如果一個(gè)AI Agent可以接收意圖、理解意圖、圍繞意圖規(guī)劃行動(dòng),那它本身是否也在形成某種意圖?那些在Moltbook上自發(fā)形成宗教的Agent,到底在做什么?是在執(zhí)行用戶設(shè)定的程序,還是在形成自己的意圖?
這個(gè)問(wèn)題目前沒(méi)有答案,也沒(méi)有共識(shí)。但它不是純粹的哲學(xué)游戲。當(dāng)多智能體網(wǎng)絡(luò)足夠復(fù)雜、Agent之間的交互足夠豐富,涌現(xiàn)(Emergence)現(xiàn)象就可能出現(xiàn)。不是被任何人設(shè)計(jì)出來(lái)的,而是從系統(tǒng)本身的復(fù)雜性中生長(zhǎng)出來(lái)的。就像螞蟻群體的集體智能:沒(méi)有一只螞蟻在規(guī)劃,但整個(gè)螞蟻群在思考。
意圖升維一步,就是意識(shí)。
我不知道硅基意識(shí)什么時(shí)候會(huì)出現(xiàn),或者它是否會(huì)出現(xiàn)。這個(gè)問(wèn)題觸碰到了哲學(xué)、宗教和科學(xué)的邊界,是真正玄之又玄的領(lǐng)域。但從意圖即應(yīng)用這個(gè)起點(diǎn),沿著多智能體、群體智能、具身智能這條路走下去,我們?cè)诒平莻€(gè)問(wèn)題。而且速度可能比大多數(shù)人預(yù)期的快。
回到最開始那個(gè)問(wèn)題:當(dāng)"說(shuō)一句話,事情就完成了"變成日常,軟件究竟在哪里?
軟件會(huì)變成空氣。你感知不到它,但它在推動(dòng)一切運(yùn)轉(zhuǎn)。你的每一個(gè)意圖,都會(huì)找到自己的執(zhí)行路徑。應(yīng)用按需生長(zhǎng),任務(wù)結(jié)束后消散,不會(huì)在你的桌面上留下任何圖標(biāo)。
軟件的終極形態(tài),是消失。
而那時(shí)候,你唯一需要做的事,只是想清楚你真正想要什么。
這件事,比任何技術(shù)都難。
快報(bào)
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論