Langbase調(diào)查了3400多位專業(yè)人士(100多個國家),職業(yè)包括C級高管(46%)、工程師(26%)、客戶支持(17%)、MKT(8%)。報告鏈接https://langbase.com/state-of-ai-agents
![]()
具體內(nèi)容如下:
1、誰在采用AI Agent?
LangChain調(diào)查顯示:約有51%的受訪者已經(jīng)在生產(chǎn)環(huán)境中采用了AI Agent;78%的受訪者計劃在近期將AI Agent引入生產(chǎn)應(yīng)用。
按規(guī)模看,員工人數(shù)為100-2000的中型企業(yè)最為積極,采用率達到63%;按行業(yè)看,90%的非科技公司已經(jīng)部署或計劃部署AI Agent,這與科技公司(89%)旗鼓相當。
![]()
Langbase調(diào)查顯示:目前,AI(非AI Agent)的實驗用途比例遠遠大于生產(chǎn)用途,雖然后者在穩(wěn)步增加中。
![]()
2、AI Agent基座大模型哪家強?
Langbase調(diào)查顯示:OpenAI(76%)占據(jù)主導地位;谷歌(59%)正迅速崛起,成為其強勁的競爭對手;Anthropic(47%)緊隨其后。Meta的Llama、Mistral和Cohere影響力不高,但增長勢頭不容忽視。
![]()
各家大模型的采用情況如下:
OpenAI在技術(shù)和營銷應(yīng)用處于領(lǐng)先地位,同時也是翻譯能手;
Google在健康和翻譯領(lǐng)域表現(xiàn)相當出色,展示其在語言和醫(yī)學領(lǐng)域的強大實力;
Anthropic是處理技術(shù)任務(wù)的高手,但在營銷和翻譯方面的使用率較低;
Mistral在技術(shù)和科學領(lǐng)域表現(xiàn)不錯,不過是個偏科生;
Meta被廣泛應(yīng)用于技術(shù)和科學領(lǐng)域;
Cohere在多個領(lǐng)域的齊頭并進。
![]()
3、選擇AI Agent基座大模型受哪些因素影響?
Langbase調(diào)查顯示,準確性(45%)是最重要的因素,其次是安全性(24%)和可定制性(21%),成本(10%)影響相對較小。(注:與“企業(yè)采用AI Agent有何顧慮”基本一致)
![]()
4、企業(yè)在哪些場景采用AI Agent?
LangChain調(diào)查顯示:研究與總結(jié)(58%)、個人生產(chǎn)力工具(53.5%)、客戶服務(wù)(45.8%)。
![]()
該結(jié)果顯示——人們希望將耗時任務(wù)交給AI Agent。
知識過濾器:AI Agent能夠快速提煉關(guān)鍵信息。在文獻綜述或研究分析中,人們無需自己手動篩選海量數(shù)據(jù);
生產(chǎn)力加速器:AI Agent可以協(xié)助安排日程、管理任務(wù),提升個人效率,讓人們專注于更重要的工作;
客服神助攻:AI Agent幫助企業(yè)更快地處理客戶咨詢、解決問題,大幅提升團隊的響應(yīng)速度。
Langbase調(diào)查顯示:自動化、簡化是企業(yè)采用AI的首要目標,其在效率和流程簡化方面受益;定制化解決方案、提升協(xié)作能力則反映了大模型日益增長的靈活性,以及消費者對系統(tǒng)共享訪問的興趣。
![]()
在具體場景上,Langbase調(diào)查顯示:
AI大模型在軟件開發(fā)(87%)應(yīng)用最廣泛;
其次是文本摘要(59%)、市場營銷(50%)、IT運營(48%)、客服(43%);
最后是人力資源(26%)、法律合規(guī)(15%)等領(lǐng)域。
值得注意的是,該結(jié)果與上述LangChain的調(diào)查有些出入。主要原因是——Langbase的提問方式是AI大模型,而非AI Agent。
![]()
5、在生產(chǎn)中采用AI Agent存在哪些顧慮?
LangChain調(diào)查顯示,性能質(zhì)量(41%)是首要關(guān)注點,其重要性遠超成本(18.4%)和安全(18.4%)等因素。
![]()
AI Agent依賴LLM“黑盒”控制工作流程,這會帶來不可預(yù)測性,增加出錯風險。因此,團隊難以確保其Agent 能否始終提供準確、符合上下文的響應(yīng)。
對于小企業(yè)而言,性能質(zhì)量尤其重要——45.8%的小企業(yè)將性能質(zhì)量列為主要關(guān)注點,而成本因素僅為 22.4%。
對于必須遵守法規(guī),要敏感地處理客戶端數(shù)據(jù)的中大型企業(yè)來說,安全問題也很普遍,超過了成本因素。
![]()
除了上述因素,LangChain在書面回復(fù)中發(fā)現(xiàn),團隊還面臨知識、時間難題。
知識不足:許多團隊缺乏構(gòu)建和部署 AI Agent的專業(yè)技能,特別是在特定應(yīng)用場景下的實現(xiàn)。員工們還要苦練專業(yè)技能,以高效利用AI Agent。
時間有限:構(gòu)建可靠的AI Agent需要投入大量時間成本,包括調(diào)試、評估和模型微調(diào)等環(huán)節(jié)。
Langbase調(diào)查顯示:復(fù)雜的擴展和部署過程是阻礙采用的首要問題;其次是數(shù)據(jù)隱私和安全合規(guī)性;缺乏監(jiān)控工具、高昂的基礎(chǔ)設(shè)施成本也阻礙了技術(shù)的落地應(yīng)用。
![]()
6、AI Agent開發(fā)相關(guān)問題有哪些?
Langbase調(diào)查顯示:在生產(chǎn)環(huán)境中部署LLM和AI Agent面臨關(guān)鍵挑戰(zhàn),包括定制化難度高、缺乏用于質(zhì)量保證的評估方法,可重復(fù)使用的基礎(chǔ)設(shè)施不足。碎片化工具、集成問題以及可擴展性限制進一步加劇困難,突顯出構(gòu)建簡化流程和強大支持工具的必要性。
![]()
開發(fā)者將AI Agent的版本控制視為開發(fā)平臺最重要的功能。強大的SDK、庫生態(tài)系統(tǒng)、本地開發(fā)環(huán)境也受到關(guān)注。
![]()
大多數(shù)受訪者需要多代理RAG能力以提高上下文信息處理;評估工具對于確保AI系統(tǒng)按預(yù)期工作同樣很重要;多代理流水線也是在生產(chǎn)中實現(xiàn)復(fù)雜任務(wù)的關(guān)鍵技術(shù)。
![]()
7、對AI Agent有哪些展望?
LangChain調(diào)查顯示:企業(yè)在采用AI Agent,既有新的期待,也會面臨持續(xù)的挑戰(zhàn)。
新的期待:
處理多步驟任務(wù):AI Agent具備更深入的推理和上下文理解能力,能夠應(yīng)對復(fù)雜任務(wù)。
自動化重復(fù)性任務(wù):AI Agent被視為自動化日常任務(wù)的關(guān)鍵工具,釋放人力投入更具創(chuàng)造性的工作。
任務(wù)分配與協(xié)作:優(yōu)化任務(wù)分配,確保合適的Agent在正確的時間處理特定問題,尤其在多Agent系統(tǒng)中。
類人推理能力:不同于LLMs,AI Agent能追溯并優(yōu)化自己的決策,根據(jù)新信息調(diào)整策略,類似人類的思考過程。
![]()
主要挑戰(zhàn):
Agent的黑盒機制:工程師發(fā)現(xiàn),他們很難向團隊和利益相關(guān)者解釋 AI Agent 的功能和行為。盡管可視化步驟有助于理解到底發(fā)生了什么,但 LLM 的內(nèi)部機制仍然是個黑盒,增加了解釋的難度。
重點關(guān)注:
對開源AI Agent的興奮:許多人對開源AI Agent 表現(xiàn)出濃厚興趣,認為集體智慧能加速創(chuàng)新。
期待更強大的模型:大家期待更高級的 AI Agent,由更強大的模型驅(qū)動,以更高的效率和自主性處理復(fù)雜任務(wù)。
![]()
結(jié)語
從企業(yè)的采用意愿來看,2025年或?qū)⒊蔀锳I Agent的爆發(fā)元年。
從爆發(fā)領(lǐng)域來看,軟件開發(fā)、客戶服務(wù)、市場營銷等領(lǐng)域?qū)⒙氏扰艹龇N子選手。目前已知的就包括編程神器Cursor、AI Coding“鼻祖”Replit等等。
值得關(guān)注的是,這兩份報告均揭示出當前AI Agent落地的最大難點——準確性,甚至連成本因素都名列二、三位。
一個辦法是等待“至尊”大模型出現(xiàn),但這取決于巨頭們的能力邊界。而在某種程度上,AI Agent的出現(xiàn)本身就是為了解決LLM在具體應(yīng)用場景中的局限性。因此,開發(fā)者需要盡可能地在記憶、規(guī)劃、工具使用等其他技術(shù)棧下功夫。
如果不能迅速實現(xiàn),我們也可以換個思路:短期內(nèi)商業(yè)化成功的AI Agent,不一定是看起來“代理化”程度最高的產(chǎn)品;而是能夠平衡性能、可靠性,以及用戶信任的產(chǎn)品。
換句話說,如果做不到完全自主,開發(fā)者需要從一開始考慮如何將人類員工融入其中,做到準確性萬無一失。
正如吳恩達的觀點,形容詞“Agentic”比名詞“Agent”能更好地幫助我們理解這類智能體的本質(zhì)。如同自動駕駛汽車L1-L4,Agent的進化也是一個過程。或許,一個確定的趨勢是先擁有AI Copilot,再擁有AI Agent。只不過,Copilot這個詞的存在感可能會降低,轉(zhuǎn)而被“少量Agentic能力”代替。
快報
根據(jù)《網(wǎng)絡(luò)安全法》實名制要求,請綁定手機號后發(fā)表評論