Langbase調(diào)查了3400多位專業(yè)人士(100多個國家),職業(yè)包括C級高管(46%)、工程師(26%)、客戶支持(17%)、MKT(8%)。報告鏈接https://langbase.com/state-of-ai-agents

具體內(nèi)容如下:

1、誰在采用AI Agent?

LangChain調(diào)查顯示:約有51%的受訪者已經(jīng)在生產(chǎn)環(huán)境中采用了AI Agent;78%的受訪者計劃在近期將AI Agent引入生產(chǎn)應(yīng)用。

按規(guī)模看,員工人數(shù)為100-2000的中型企業(yè)最為積極,采用率達到63%;按行業(yè)看,90%的非科技公司已經(jīng)部署或計劃部署AI Agent,這與科技公司(89%)旗鼓相當。

Langbase調(diào)查顯示:目前,AI(非AI Agent)的實驗用途比例遠遠大于生產(chǎn)用途,雖然后者在穩(wěn)步增加中。

2、AI Agent基座大模型哪家強?

Langbase調(diào)查顯示:OpenAI(76%)占據(jù)主導地位;谷歌(59%)正迅速崛起,成為其強勁的競爭對手;Anthropic(47%)緊隨其后。Meta的Llama、Mistral和Cohere影響力不高,但增長勢頭不容忽視。

各家大模型的采用情況如下:

OpenAI在技術(shù)和營銷應(yīng)用處于領(lǐng)先地位,同時也是翻譯能手;

Google在健康和翻譯領(lǐng)域表現(xiàn)相當出色,展示其在語言和醫(yī)學領(lǐng)域的強大實力;

Anthropic是處理技術(shù)任務(wù)的高手,但在營銷和翻譯方面的使用率較低;

Mistral在技術(shù)和科學領(lǐng)域表現(xiàn)不錯,不過是個偏科生;

Meta被廣泛應(yīng)用于技術(shù)和科學領(lǐng)域;

Cohere在多個領(lǐng)域的齊頭并進。

3、選擇AI Agent基座大模型受哪些因素影響?

Langbase調(diào)查顯示,準確性(45%)是最重要的因素,其次是安全性(24%)和可定制性(21%),成本(10%)影響相對較小。(注:與“企業(yè)采用AI Agent有何顧慮”基本一致)

4、企業(yè)在哪些場景采用AI Agent?

LangChain調(diào)查顯示:研究與總結(jié)(58%)、個人生產(chǎn)力工具(53.5%)、客戶服務(wù)(45.8%)。

該結(jié)果顯示——人們希望將耗時任務(wù)交給AI Agent。

知識過濾器:AI Agent能夠快速提煉關(guān)鍵信息。在文獻綜述或研究分析中,人們無需自己手動篩選海量數(shù)據(jù);

生產(chǎn)力加速器:AI Agent可以協(xié)助安排日程、管理任務(wù),提升個人效率,讓人們專注于更重要的工作;

客服神助攻:AI Agent幫助企業(yè)更快地處理客戶咨詢、解決問題,大幅提升團隊的響應(yīng)速度。

Langbase調(diào)查顯示:自動化、簡化是企業(yè)采用AI的首要目標,其在效率和流程簡化方面受益;定制化解決方案、提升協(xié)作能力則反映了大模型日益增長的靈活性,以及消費者對系統(tǒng)共享訪問的興趣。

在具體場景上,Langbase調(diào)查顯示

AI大模型在軟件開發(fā)(87%)應(yīng)用最廣泛;

其次是文本摘要(59%)、市場營銷(50%)、IT運營(48%)、客服(43%);

最后是人力資源(26%)、法律合規(guī)(15%)等領(lǐng)域。

值得注意的是,該結(jié)果與上述LangChain的調(diào)查有些出入。主要原因是——Langbase的提問方式是AI大模型,而非AI Agent。

5、在生產(chǎn)中采用AI Agent存在哪些顧慮?

LangChain調(diào)查顯示,性能質(zhì)量(41%)是首要關(guān)注點,其重要性遠超成本(18.4%)和安全(18.4%)等因素。

AI Agent依賴LLM“黑盒”控制工作流程,這會帶來不可預(yù)測性,增加出錯風險。因此,團隊難以確保其Agent 能否始終提供準確、符合上下文的響應(yīng)。

對于小企業(yè)而言,性能質(zhì)量尤其重要——45.8%的小企業(yè)將性能質(zhì)量列為主要關(guān)注點,而成本因素僅為 22.4%。

對于必須遵守法規(guī),要敏感地處理客戶端數(shù)據(jù)的中大型企業(yè)來說,安全問題也很普遍,超過了成本因素。

除了上述因素,LangChain在書面回復(fù)中發(fā)現(xiàn),團隊還面臨知識、時間難題。

知識不足:許多團隊缺乏構(gòu)建和部署 AI Agent的專業(yè)技能,特別是在特定應(yīng)用場景下的實現(xiàn)。員工們還要苦練專業(yè)技能,以高效利用AI Agent。

時間有限:構(gòu)建可靠的AI Agent需要投入大量時間成本,包括調(diào)試、評估和模型微調(diào)等環(huán)節(jié)。

Langbase調(diào)查顯示:復(fù)雜的擴展和部署過程是阻礙采用的首要問題;其次是數(shù)據(jù)隱私和安全合規(guī)性;缺乏監(jiān)控工具、高昂的基礎(chǔ)設(shè)施成本也阻礙了技術(shù)的落地應(yīng)用。

6、AI Agent開發(fā)相關(guān)問題有哪些?

Langbase調(diào)查顯示:在生產(chǎn)環(huán)境中部署LLM和AI Agent面臨關(guān)鍵挑戰(zhàn),包括定制化難度高、缺乏用于質(zhì)量保證的評估方法,可重復(fù)使用的基礎(chǔ)設(shè)施不足。碎片化工具、集成問題以及可擴展性限制進一步加劇困難,突顯出構(gòu)建簡化流程和強大支持工具的必要性。

開發(fā)者將AI Agent的版本控制視為開發(fā)平臺最重要的功能。強大的SDK、庫生態(tài)系統(tǒng)、本地開發(fā)環(huán)境也受到關(guān)注。

大多數(shù)受訪者需要多代理RAG能力以提高上下文信息處理;評估工具對于確保AI系統(tǒng)按預(yù)期工作同樣很重要;多代理流水線也是在生產(chǎn)中實現(xiàn)復(fù)雜任務(wù)的關(guān)鍵技術(shù)。

7、對AI Agent有哪些展望?

LangChain調(diào)查顯示:企業(yè)在采用AI Agent,既有新的期待,也會面臨持續(xù)的挑戰(zhàn)。

新的期待:

處理多步驟任務(wù):AI Agent具備更深入的推理和上下文理解能力,能夠應(yīng)對復(fù)雜任務(wù)。

自動化重復(fù)性任務(wù):AI Agent被視為自動化日常任務(wù)的關(guān)鍵工具,釋放人力投入更具創(chuàng)造性的工作。

任務(wù)分配與協(xié)作:優(yōu)化任務(wù)分配,確保合適的Agent在正確的時間處理特定問題,尤其在多Agent系統(tǒng)中。

類人推理能力:不同于LLMs,AI Agent能追溯并優(yōu)化自己的決策,根據(jù)新信息調(diào)整策略,類似人類的思考過程。

主要挑戰(zhàn):

Agent的黑盒機制:工程師發(fā)現(xiàn),他們很難向團隊和利益相關(guān)者解釋 AI Agent 的功能和行為。盡管可視化步驟有助于理解到底發(fā)生了什么,但 LLM 的內(nèi)部機制仍然是個黑盒,增加了解釋的難度。

重點關(guān)注:

對開源AI Agent的興奮:許多人對開源AI Agent 表現(xiàn)出濃厚興趣,認為集體智慧能加速創(chuàng)新。

期待更強大的模型:大家期待更高級的 AI Agent,由更強大的模型驅(qū)動,以更高的效率和自主性處理復(fù)雜任務(wù)。

結(jié)語

從企業(yè)的采用意愿來看,2025年或?qū)⒊蔀锳I Agent的爆發(fā)元年。

從爆發(fā)領(lǐng)域來看,軟件開發(fā)、客戶服務(wù)、市場營銷等領(lǐng)域?qū)⒙氏扰艹龇N子選手。目前已知的就包括編程神器Cursor、AI Coding“鼻祖”Replit等等。

值得關(guān)注的是,這兩份報告均揭示出當前AI Agent落地的最大難點——準確性,甚至連成本因素都名列二、三位。

一個辦法是等待“至尊”大模型出現(xiàn),但這取決于巨頭們的能力邊界。而在某種程度上,‌AI Agent的出現(xiàn)本身就是為了解決LLM在具體應(yīng)用場景中的局限性。因此,開發(fā)者需要盡可能地在記憶、規(guī)劃、工具使用等其他技術(shù)棧下功夫。

如果不能迅速實現(xiàn),我們也可以換個思路:短期內(nèi)商業(yè)化成功的AI Agent,不一定是看起來“代理化”程度最高的產(chǎn)品;而是能夠平衡性能、可靠性,以及用戶信任的產(chǎn)品。

換句話說,如果做不到完全自主,開發(fā)者需要從一開始考慮如何將人類員工融入其中,做到準確性萬無一失。

正如吳恩達的觀點,形容詞“Agentic”比名詞“Agent”能更好地幫助我們理解這類智能體的本質(zhì)。如同自動駕駛汽車L1-L4,Agent的進化也是一個過程。或許,一個確定的趨勢是先擁有AI Copilot,再擁有AI Agent。只不過,Copilot這個詞的存在感可能會降低,轉(zhuǎn)而被“少量Agentic能力”代替。

本文系作者 適道 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請注明出處、作者和本文鏈接。
本內(nèi)容來源于鈦媒體鈦度號,文章內(nèi)容僅供參考、交流、學習,不構(gòu)成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點和發(fā)現(xiàn),點擊這里投稿 。創(chuàng)業(yè)或融資尋求報道,點擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實名制要求,請綁定手機號后發(fā)表評論

登錄后輸入評論內(nèi)容

快報

更多

20:34

大風、降水來襲,長江江蘇段部分區(qū)域?qū)嵤┡R時交通管制

19:59

國航C919正式投入北京—廈門、北京—哈爾濱兩條航線運營

19:57

中鋁國際:2025年歸母凈利潤2.58億元,同比增長16.47%

19:19

伊朗稱已打擊與美軍工有關(guān)聯(lián)的兩家企業(yè)

18:36

伊朗與巴基斯坦兩國外長通電話,討論地區(qū)局勢

18:35

2025年玩具(不含潮玩)國內(nèi)市場零售總額達1035.3億元

18:08

全國豬價跌破5元,創(chuàng)歷史新低

18:07

時代天使2025年實現(xiàn)收入3.7億美元,同比增長37.8%

17:57

電魂網(wǎng)絡(luò):擬投資4920萬元取得上海漫魂51%股權(quán)

17:51

美國1天超3000場反戰(zhàn)示威

17:28

雀巢12噸巧克力被盜

17:11

伊朗官員表示將“果斷反擊”美軍奪島

17:08

伊朗議長稱武裝部隊“正等著美軍地面行動”,并將“懲罰”其地區(qū)盟友

17:05

三安光電:董事長及總經(jīng)理擬增持公司股份

16:58

全球多地爆發(fā)示威抗議,民眾高呼“不要戰(zhàn)爭”

16:55

中信證券:配置上建議繼續(xù)堅守中國優(yōu)勢制造業(yè),靜待4月決斷

16:38

美國土安全部資金中斷進入第44天,創(chuàng)美國史上最長政府部分“停擺”紀錄

16:17

北京啟動智能網(wǎng)聯(lián)新能源汽車商業(yè)保險開發(fā)應(yīng)用,統(tǒng)一適配L2至L4全級別智能網(wǎng)聯(lián)新能源汽車

16:16

恒林股份發(fā)布AI體感工學白皮書,加速布局AI智能家居

16:15

中國國家創(chuàng)新指數(shù)綜合排名世界第9位,較上年提升1位

掃描下載App