時至今日,圍繞AI手機,業(yè)內(nèi)已然分化出兩條截然不同的演進路徑。

一條是由操作系統(tǒng)或終端廠商主導(dǎo)的AI原生化,也就是我們常說的GUI Agent。它并不要求應(yīng)用本身為AI做出改造,而是試圖讓AI像人一樣理解、操作界面。

豆包AI手機是GUI最為典型的落地樣本。去年12月,豆包手機助手技術(shù)預(yù)覽版發(fā)布,首次將“AI接管決策”這一設(shè)想在終端完整呈現(xiàn)。用戶只需一句「幫我比價下單」,手機頁面開始自動跳轉(zhuǎn)、識別界面、點擊按鈕、領(lǐng)券、結(jié)算,全程不依賴任何官方接口。這種近乎擬人化的操作拓展了AI手機的想象邊界,迅速在科技圈引發(fā)熱烈討論。

魅族也是GUI路線的推崇者,它是國內(nèi)最早提出“視覺一體化”概念的廠商之一。在去年5月最新發(fā)布的Flyme AIOS 2操作系統(tǒng)中,其搭載的“Task Robot”便是旨在由AI模擬人工在GUI界面上進行點擊和操作。

另一條是由應(yīng)用巨頭主導(dǎo)的業(yè)務(wù)AI化。它不依賴對人類操作行為的模擬,而是通過A2A(Agent to Agent)的方式,在應(yīng)用內(nèi)部拆解出可被調(diào)用的能力模塊。各Agent之間通過統(tǒng)一協(xié)議直接交換數(shù)據(jù)、調(diào)用功能,從底層完成任務(wù)協(xié)作,繞過“看屏幕、點按鈕”這一中間環(huán)節(jié)。

阿里千問和未來將要推出的騰訊微信Agent便是這一路線的踐行者。前者通過MCP+A2A的通用Agent體系,把淘寶、飛豬、支付寶、高德等拆成大量原子能力,接入“任務(wù)助理”;后者則被業(yè)界普遍預(yù)期,會把微信、企業(yè)微信、小程序等生態(tài)能力全面Agent化。

對用戶來說,只需一句自然語言指令,便可以觸發(fā)跨搜索、社交、支付、出行等多業(yè)務(wù)協(xié)作,真正體現(xiàn)出“任務(wù)拆解+跨服務(wù)調(diào)用”的A2A精髓。

在剛剛結(jié)束的千問發(fā)布會上,這一路線的落地效果有了更直觀的呈現(xiàn)。用戶只需一句「幫我點40杯霸王茶姬的伯牙絕弦」,千問即可在不跳轉(zhuǎn)頁面的情況下完成選品、下單和支付,幾分鐘后奶茶送達;輸入「春節(jié)帶家人去三亞」或「幫我規(guī)劃云南旅行」,千問則會聯(lián)動飛豬和高德完成機票、酒店、行程規(guī)劃及必要電話確認(rèn),實現(xiàn)“一句話,整套行程自動排好”;在政務(wù)和民生服務(wù)中,如用戶問「杭州戶口如何辦理護照」,千問不僅能講清政策和材料清單,還可直接給出線上辦理入口,幫助用戶少跑冤枉路。

如千問C端事業(yè)群總裁吳嘉在發(fā)布會上所言,“AI在擁有超強大腦之后,開始長出了能夠觸達真實世界的手和腳,在生活中實實在在地替用戶干活。”

兩條路線各有所長。GUI路線最大優(yōu)勢在于“無感兼容”,理論上,AI只要能看懂屏幕,就能直接完成操作,A2A由于是通過協(xié)議直接調(diào)用APP,其執(zhí)行的精準(zhǔn)度與響應(yīng)速度遠高于模擬點擊,在效率和準(zhǔn)確性上更優(yōu),也更適合交易、支付、履約等高價值、高風(fēng)險場景。

目前來看,兩條路線雖然都撞上了既有APP生態(tài)的“柏林墻”,但GUI路線下,由于涉及更多系統(tǒng)級權(quán)限與隱私數(shù)據(jù),相關(guān)風(fēng)險更早暴露,落地過程中的摩擦與阻力也更加明顯。

豆包手機限量發(fā)售后僅2-3天,微信、支付寶、美團、以及建行、農(nóng)行等主流銀行APP,便已經(jīng)對豆包式的自動化操作做了不同程度的技術(shù)和風(fēng)控限制:有的觸發(fā)安全風(fēng)控導(dǎo)致登錄異常,有的直接識別并屏蔽此類“代操作”行為。

系統(tǒng)級AI的控制權(quán),幾乎是所有手機廠商都不愿外放的底牌,必須握在自己手中。這也導(dǎo)致豆包手機雖然在交互創(chuàng)新上給出了積極的探索,但短期內(nèi)還是很難進入國內(nèi)頭部手機廠商的合作視野。

所以我們會看到,華為、榮耀、小米等頭部手機廠商一邊對豆包助手在OS做系統(tǒng)層掐斷(如權(quán)限拒絕),一邊力推自家AI助手。華為升級“小藝”把智能體深度綁定進鴻蒙生態(tài),小米以“超級小愛”承接系統(tǒng)級多模態(tài)交互與跨應(yīng)用執(zhí)行,榮耀則在發(fā)布會上讓YOYO上演“一口氣點2000杯咖啡”的花活兒,向用戶展示出“系統(tǒng)級會動手”。

某種程度上,這是手機廠商們在用“自有智能體”替代“外來總管”,展示出其既要占住AI入口,又要守住生態(tài)主導(dǎo)權(quán)的決心。

相比之下,雖然能預(yù)見的是,A2A同樣繞不開不同應(yīng)用廠商“商業(yè)授權(quán)”這道坎,卻已是目前在局部范圍內(nèi)展現(xiàn)出的“最優(yōu)解”。

阿里千問系A(chǔ)gent或微信Agent,通過自有生態(tài)內(nèi)的高頻、高價值場景,驗證A2A路線的技術(shù)可靠性,實現(xiàn)“小原生”,再以統(tǒng)一協(xié)議和成熟范式為樣板,逐步對外開放接口,吸引更多第三方服務(wù)以“接入Agent網(wǎng)絡(luò)”的方式走向“更大的原生”。

據(jù)了解,吳嘉還在千問發(fā)布會后的采訪中透露,“除了接入阿里生態(tài),千問會在未來接入第三方的產(chǎn)品,這件事已在討論中。”

至少在現(xiàn)階段,這種從內(nèi)部生長出來的秩序,比強行接管外部APP的GUI路線面臨的阻力要更小。

二、可控性進化:AI手機的第一要義

從演進方向來看,GUI更像從更高一級調(diào)度層出發(fā),“自上而下”統(tǒng)籌各類應(yīng)用,A2A則像由業(yè)務(wù)自身先完成智能體改造,再逐步形成協(xié)作網(wǎng)絡(luò)的“自下而上”。

若論體驗感,GUI路線明顯更優(yōu),因為它更“未來”,用戶很容易在演示場景中發(fā)現(xiàn)“Aha moment”。若論成熟度和穩(wěn)定性,A2A路線有更大概率發(fā)展成可持續(xù)的基礎(chǔ)能力,也符合AI手機的演進方向。

(豆包手機演示圖)

但這并不意味著兩條路線必然走向?qū)αⅰPPO ColorOS智慧產(chǎn)品研發(fā)負(fù)責(zé)人姜昱辰就曾在采訪中提到,“OPPO將采取差異化策略,針對社交、支付等高頻使用場景,優(yōu)先構(gòu)建智能體間的直接通信協(xié)議;而對于低頻長尾需求,則保留圖形界面交互作為補充方案。”

這背后,其實對應(yīng)著兩種截然不同的技術(shù)范式:AI是“模擬人做事”,還是“直接調(diào)用能力”。GUI Agent在簡單場景下尚可奏效,但一旦涉及多步驟、多分支的復(fù)雜任務(wù),穩(wěn)定性就會下降。

相比之下,當(dāng)AI是從應(yīng)用本身出發(fā),完成從APP到Agent的升級,其基于工作流的進化和理解是循序漸進的,與之對應(yīng)的是復(fù)雜任務(wù)成功率也會顯著提升。由此可見,AI Agent競爭的核心,不止在于“能力有多強”,更在于“是否足夠可控”。

真正的分水嶺,出現(xiàn)在合規(guī)與責(zé)任界定。中國信通院牽頭發(fā)布的《端云協(xié)同智能體交互雙重授權(quán)安全指引》,重點提到了“構(gòu)建由用戶和應(yīng)用雙重授權(quán)的安全機制”,明確智能體AI“需同時獲得應(yīng)用授權(quán)與用戶授權(quán),才能合法訪問第三方應(yīng)用”。

GUI Agent繞過了應(yīng)用對AI許可授權(quán)的過程,一旦在支付、游戲、金融等場景出現(xiàn)損失或爭議,就會面臨責(zé)任歸屬的難題:這是用戶“自作主張”的后果?是AI服務(wù)提供方的責(zé)任?還是應(yīng)用方?jīng)]有做好防護?在沒有“用戶+應(yīng)用雙重授權(quán)”的前提下,很難建立一套各方都認(rèn)可的責(zé)任與合規(guī)框架。

隱私與數(shù)據(jù)安全,進一步放大了GUI路線的風(fēng)險。為了跨APP代操作,GUI Agent 往往需要使用諸如READ_FRAME_BUFFER、INJECT_EVENTS 這類系統(tǒng)級敏感權(quán)限,直接讀取屏幕畫面、模擬點擊與輸入。

對普通用戶而言,這等價于把自己的聊天記錄、支付頁面、驗證碼輸入、銀行余額,一次性暴露給一個“看不見的助手”。即便產(chǎn)品方聲稱“數(shù)據(jù)不上云”“截圖不存儲”,用戶也很難真正理解數(shù)據(jù)在本地和云端之間的流動路徑,信任門檻非常高。

這種擔(dān)憂并非用戶的“技術(shù)焦慮”,而是已經(jīng)在行業(yè)內(nèi)部被反復(fù)討論的現(xiàn)實風(fēng)險。中國信通院數(shù)安智庫專家曾令平接受媒體采訪時坦言,系統(tǒng)級AI確實存在多重風(fēng)險。

“頂格的系統(tǒng)權(quán)限如同開‘后門’,可讀取屏幕上的所有信息,包括各種隱私數(shù)據(jù);模擬點擊功能可能被惡意利用,威脅資金安全;部分廠商權(quán)限開通不透明,責(zé)任劃分模糊,也會放大安全隱患。”

從現(xiàn)實反饋來看,監(jiān)管與頭部平臺對這種可能“越權(quán)”的系統(tǒng)級能力始終保持高度警惕。一旦允許某個外部智能體在屏幕層面對金融操作、登錄驗證進行自動化處理,從技術(shù)上就必須假設(shè):只要有權(quán)限,就存在被惡意濫用、被中間人攻擊或被其他惡意程序劫持的可能。這也是為何在豆包手機助手的測試階段,銀行、支付類應(yīng)用的自動化能力很快就被主動收縮和下線。

(OWASP(開放全球應(yīng)用安全項目)發(fā)布的《2026年智能體應(yīng)用安全十大風(fēng)險》“身份與權(quán)限濫用”是十大風(fēng)險之一)

與之對應(yīng),A2A路線在設(shè)計之初便明確區(qū)分了角色邊界:人是決策主體,AI負(fù)責(zé)執(zhí)行和優(yōu)化。用戶負(fù)責(zé)給出目標(biāo)與偏好,主Agent拆解任務(wù)并規(guī)劃步驟,子Agent則在各自業(yè)務(wù)域內(nèi),調(diào)用經(jīng)過應(yīng)用方授權(quán)和封裝的能力,在可控邊界內(nèi)協(xié)同完成任務(wù)。

在這一過程中,“用戶授權(quán)”和“應(yīng)用授權(quán)”被天然地綁定在一起:應(yīng)用方通過協(xié)議公開哪些能力可以被智能體調(diào)用、調(diào)用頻率如何限制、涉及哪些數(shù)據(jù)字段,這構(gòu)成了“應(yīng)用授權(quán)”的硬邊界,也讓用戶更容易理解AI的能力范圍。

與此同時,用戶會在具體場景里授權(quán)某個Agent代表自己調(diào)用這些能力,并在關(guān)鍵決策節(jié)點給予確認(rèn)。

AI提出建議,人來拍板,最終由業(yè)務(wù)方按照協(xié)議執(zhí)行。既降低了對系統(tǒng)級高權(quán)限的依賴,也將隱私與責(zé)任問題拆解到更細(xì)粒度的接口與交互之中,更易被監(jiān)管接受,也便于平臺審計。

如果再把時間周期拉長,A2A更等同于搭建了一個有APP安全和數(shù)據(jù)安全協(xié)議底層的“超級Agent”。

它的進化方式并非推翻現(xiàn)有生態(tài),而是基于既有的用戶行為邏輯,在保留現(xiàn)階段軟件生態(tài)、APP生態(tài)基礎(chǔ)和商業(yè)價值生態(tài)的基礎(chǔ)之上,向AI邁出一步,為C端用戶提供一種有真實體感的“體驗附加項”。

這也更符合近兩年被頻繁提及的“人本智能(Human-Centered AI)”理念,即AI的核心價值并非取代人,而是在安全、可控的邊界內(nèi),承接人的目標(biāo)與責(zé)任,把技術(shù)能力轉(zhuǎn)化為對教育、醫(yī)療等普惠場景的真實改善。

當(dāng)然,A2A路線也并非全無挑戰(zhàn),隨著千問、微信等超級Agent繼續(xù)向前演進,超級Agent之間如何打通協(xié)作,不同生態(tài)中誰作為主Agent、誰作為子Agent,以及底層模型之間的語義差異等等,都是繞不開的問題。

試想一下,未來的某一天,你讓淘寶Agent負(fù)責(zé)采購野餐裝備,同時調(diào)用美團Agent訂附近的下午茶。但在兩個Agent的“對話”中,兩者對“即時送達”的理解并不一致——淘寶認(rèn)為是“當(dāng)天可送”,而美團默認(rèn)的是“30分鐘內(nèi)送達”。

結(jié)果在協(xié)商配送時間時,系統(tǒng)給出了一個雙方都無法兌現(xiàn)的承諾:本該“無貨”的商品,被包裝成了“換個口味即可立刻送達”,最終導(dǎo)致訂單失敗,用戶白等一場。

但博弈往往是新秩序的前奏,就像過去二十年,互聯(lián)網(wǎng)依賴HTTP、TCP/IP這樣的底層共識運行,隨著技術(shù)革新的深化,不排除未來政策或行業(yè)層面可能出現(xiàn)“超級Agent to超級Agent”的公共協(xié)議。到那時,AI手機才真正推開了通往全能交互的大門。

三、終極猜想:尋找AI時代的「iPhone」

如果說移動互聯(lián)網(wǎng)時代的核心產(chǎn)品邏輯,是“以APP為中心組織服務(wù)”,那么AI時代正在浮現(xiàn)的,是一個以Agent為中心重構(gòu)產(chǎn)品、生態(tài)與用戶體驗的新范式。

回看移動互聯(lián)網(wǎng)的爆發(fā)原點,蘋果的偉大之處不止于iPhone的硬件參數(shù),更在于它通過App Store建立了一套契合用戶需求的移動互聯(lián)網(wǎng)的軟件生態(tài)。

借用歷史視角回望,我們或能窺見未來“iPhone”的雛形。

其軟件價值是一種能繁榮Agent生態(tài)的聚合能力,其硬件形態(tài)也未必是手機,甚至可能是眼鏡、頭顯、手表等其他智能終端。

當(dāng)應(yīng)用不再是靜止的圖標(biāo),而是以Agent的形式流動起來時,AI的角色也隨之發(fā)生改變。它不再只是提升點擊效率的輔助工具,而是開始真正介入并重塑價值創(chuàng)造的核心環(huán)節(jié)。

當(dāng)AI Agent成為連接用戶與服務(wù)的核心入口,競爭的焦點也不再是“誰占據(jù)了用戶更多時間”,而是誰更高效地完成了用戶的真實需求——“流量”從“時間占有”升級為“需求滿足”。

事實上,Agent從“工具”進化為“服務(wù)主體”已逐漸成為業(yè)內(nèi)共識。微軟CEO薩提亞·納德拉在微軟Build 2025開發(fā)者大會上提到,AI不只是協(xié)作工具,更是可被信賴的數(shù)字同事,能夠獨立思考、執(zhí)行任務(wù)。

OpenAI CEO薩姆·奧特曼也在2025年的訪談中提到,AI正在經(jīng)歷從“推理引擎”到“個人代理(Personal Agent)”的跨越。

當(dāng)用戶選擇某個Agent,本質(zhì)上是在選擇一個能代替自己做決策的“智能服務(wù)商”。這也對未來的AI終端提出了更高要求:它不僅要理解指令,更要理解用戶背后的利益邊界、風(fēng)險偏好與決策底線。

因此,無論是AI手機,還是未來可能出現(xiàn)的其他AI終端,本質(zhì)上都是AI Agent的硬件載體,而非Agent本身。其核心演進邏輯,都應(yīng)遵循“人本位”原則,即AI不應(yīng)越俎代庖代替人類做決策。

這一判斷,也與另一個正在顯現(xiàn)的大趨勢相呼應(yīng)——AI時代,價值將更加集中地體現(xiàn)為企業(yè)可被Agent調(diào)用和放大的核心能力,比如阿里、京東的電商履約,比如騰訊的社交關(guān)系鏈等等,都被轉(zhuǎn)化為一個明確的AI價值符號,最終這些符號進行排列組合,企業(yè)之間不斷聚合協(xié)同,形成更極致的終極AGI產(chǎn)品。

近期國家市場監(jiān)管總局對外賣行業(yè)巨頭及攜程的約談,釋放出一個清晰信號:協(xié)同聚合是符合社會價值的,平臺“通吃”單打獨斗反而會帶來更大的用戶和商業(yè)風(fēng)險。

這意味著,未來的“終端霸主”,需在商業(yè)變現(xiàn)、生態(tài)公平之間找到最優(yōu)用戶需求價值,和最優(yōu)社會穩(wěn)定價值的平衡點。

雖道阻且長,但沸騰推動進步,我們或許仍無法準(zhǔn)確描繪AI時代「iPhone」的最終形態(tài),但可以確信的是——它一定誕生于Agent生態(tài)真正繁榮、協(xié)同而非通吃成為共識的那一刻。

本文系作者 產(chǎn)業(yè)家 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請注明出處、作者和本文鏈接。
本內(nèi)容來源于鈦媒體鈦度號,文章內(nèi)容僅供參考、交流、學(xué)習(xí),不構(gòu)成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點和發(fā)現(xiàn),點擊這里投稿 。創(chuàng)業(yè)或融資尋求報道,點擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實名制要求,請綁定手機號后發(fā)表評論

登錄后輸入評論內(nèi)容

快報

更多

2026-03-28 23:01

澤連斯基稱與中東3國達成防務(wù)合作協(xié)議,涉聯(lián)合生產(chǎn)無人機

2026-03-28 22:35

山西太原一建筑發(fā)生火災(zāi),已致1人死亡25人受傷

2026-03-28 22:26

王文濤部長發(fā)表書面致辭,支持世貿(mào)組織《電子商務(wù)協(xié)定》達成臨時實施安排

2026-03-28 21:54

40余家單位聯(lián)盟,中國最大人形機器人訓(xùn)練基地在京揭牌

2026-03-28 21:41

周鴻祎與劉慈欣在科幻大會預(yù)判:百億智能體或成新物種,AI推動人類文明分化

2026-03-28 21:38

第五代宏光MINIEV上市,售價4.48萬-5.48萬元

2026-03-28 20:42

烏稱伊朗襲擊迪拜倉庫并致烏克蘭人傷亡消息不實

2026-03-28 20:23

3月28日新聞聯(lián)播速覽23條

2026-03-28 20:05

美國務(wù)卿和歐盟官員被曝就烏克蘭問題激烈交鋒

2026-03-28 19:44

“Token”這個詞的搜索量最高一天達到7.7萬次,比去年日均搜索量高出1850%

2026-03-28 19:39

飛捷科思發(fā)布中國首個可微分物理仿真引擎Fysics

2026-03-28 19:13

“網(wǎng)售產(chǎn)品質(zhì)量安全提升系列行動2026”在北京啟動

2026-03-28 19:03

國務(wù)院食安辦、市場監(jiān)管總局約談相關(guān)地方市級人民政府負(fù)責(zé)人,督辦“3?15”晚會曝光問題整改

2026-03-28 18:44

飛書 CLI 開源:AI 可直連飛書辦公套件

2026-03-28 18:36

馬來西亞說伊朗允許馬滯留油輪通行霍爾木茲海峽

2026-03-28 18:02

今年前三個月中國創(chuàng)新藥對外授權(quán)交易總額超600億美元

2026-03-28 17:39

中國和菲律賓舉行南海問題雙邊磋商機制第十一次會議

2026-03-28 17:30

印尼正式實施16歲以下社媒禁令,約7000萬人受影響

2026-03-28 17:04

美國加州禁止官員借內(nèi)幕消息在預(yù)測市場牟利

2026-03-28 17:02

北京“超現(xiàn)場”生態(tài)共同體建設(shè)暨全國覆蓋啟動

掃描下載App