附上本期直播時間軸,幫你快速跳轉(zhuǎn)感興趣的部分
03:03 Agent應用現(xiàn)狀
04:17 科銳AI應用布局
06:43 大模型發(fā)展的三個階段
11:20 Agent應用痛點
17:40 如何選出“真”AI需求
27:45 兩個指標,篩選Agent優(yōu)先落地場景
33:54 AI正在重塑各行各業(yè)
38:17 AI如何重構(gòu)人力資源行業(yè)
劉湘明:首先,請您簡單介紹一下科銳國際。
劉之:科銳國際是一家技術(shù)驅(qū)動型的人力資源解決方案公司,是國內(nèi)第一家在A股上市的人力資源公司。目前在全球有160多個分支機構(gòu),主要提供獵頭、招聘流程外包以及靈活用工等人力資源服務,核心優(yōu)勢是技術(shù)+平臺+服務的商業(yè)模式。
劉湘明:此次參加WAIC大會, 您的感受如何?
劉之:我看到了具身智能和很多硬件廠商的展臺。AI當然仍然還是更多是圍繞著基礎設施,應用廠商還比較少。不過我相信明年、后年,WAIC上會出現(xiàn)更多的應用公司。另外,我覺得技術(shù)氛圍十分不錯,能在會上看見一些不錯的技術(shù)展示。
劉湘明:AI 落地是目前熱議的話題,現(xiàn)在 AI 在招聘業(yè)務的應用和改造,已經(jīng)到什么程度了?
劉之:目前國內(nèi)外在招聘方面的AI應用有很多進展。整體上看,我覺得人力資源公司和SaaS公司發(fā)展是最快的,而企業(yè)側(cè)相對來說慢一點。雖然AI仍處于完善基礎設施的階段,但我相信過一段時間之后,在招聘場景中會有更多的應用,甚至新的商業(yè)模式出現(xiàn)。
劉湘明:目前科銳國際在 AI 應用做了哪些嘗試?
劉之:科銳在 ChatGPT 剛問世的時候就開始了 AI 應用的嘗試。我覺得這個過程中大概經(jīng)歷了三次技術(shù)突破。
第一次是 ChatGPT 問世。ChatGPT 改變了知識獲取的方式。在這個階段,科銳主要針對獵頭業(yè)務展開 AI 化。因為科銳所服務的部分細分市場是圍繞著技術(shù)崗位的招聘業(yè)務展開的。所以獵頭業(yè)務需要對崗位的專業(yè)知識有深度理解。
獲取企業(yè)內(nèi)部數(shù)據(jù)有三種方法:微調(diào)、上下文學習與 RAG。我在兩年多前判斷微調(diào)垂直大模型并沒有什么實際意義:參數(shù)小的模型容易微調(diào),但是智能化水平低;參數(shù)大的模型難以微調(diào)??其J的數(shù)據(jù)量太大,沒法放在上下文中。所以我們主攻的方向是 RAG。而 RAG 的核心就是 Embedding 模型,過去兩年,科銳一直在訓練招聘與技能的垂直 Embedding 模型和研發(fā)MatchSystem匹配系統(tǒng)。
第二次是多模態(tài)大模型。但我認為,視覺 - 語言的多模態(tài)大模型缺乏 ScalingLaw。這可能和語言是由人類創(chuàng)造的一種壓縮格式,所以容易出現(xiàn) ScalingLaw有關。而語音 - 語言的多模態(tài)都屬于人類創(chuàng)造的數(shù)據(jù)形式,是具備 ScalingLaw 的。在這個階段我們核心關注 AI 電話這個場景。因為在招聘過程中,很多都需要進行電話溝通。
第三次是 Agent。這個階段是從 DeepSeek R1 通過強化學習將推理能力提升到了一個新高度開始的。這個階段我認為最佳的發(fā)展方向是:輕微重復的短流程業(yè)務。
剛才講的是技術(shù),再講講產(chǎn)品。我們很多年前就判斷未來的招聘行業(yè)的市場變化速度會越來越快。原因有兩個:第一個是國內(nèi)產(chǎn)業(yè)鏈越來越細分,細分崗位也就越來越多,比如工程師崗位,原先用五個類別劃分就夠了,現(xiàn)在可能要九類,甚至十類進行劃分。第二個是技術(shù)呈現(xiàn)出指數(shù)型的發(fā)展。
我們在三年前開始構(gòu)建大數(shù)據(jù)平臺,所以積累了非常多的數(shù)據(jù)。我們希望利用研發(fā)的 MatchSystem 匹配系統(tǒng)和 CRE Embedding 模型的能力,將線上線下,增量存量、區(qū)域行業(yè)的客戶、職位、人才和顧問進行實時 AI 匹配,進而可以更快的響應市場的快速變化。這些技術(shù)已經(jīng)應用在科銳內(nèi)部系統(tǒng)和平臺產(chǎn)品禾蛙上。
劉湘明:您可否分享一些具體的細節(jié)和經(jīng)驗?
劉之:Embedding 模型相當于將簡歷和招聘需求能夠編碼成一個計算機能讀懂的語言,從而讓大模型在訪問企業(yè)內(nèi)部數(shù)據(jù)的時候,可以快速在一個龐大的數(shù)據(jù)庫中找到想要的信息。
在今年 4 月份以前,Embedding 模型還處在語義階段。語義即代表了一段文本的潛在意義。當來到了 Agent 時代,這種技術(shù)就存在問題了。比如我問 Agent:" 我想知道科銳數(shù)據(jù)庫中,有哪些產(chǎn)品經(jīng)理是有從 0 到 1 經(jīng)驗的?" 這就需要我看完這個人的簡歷后,進行一些推理。比如這個曾經(jīng)從 0 到 1 創(chuàng)業(yè)過,這個人曾經(jīng)在小公司待過,而這個公司曾經(jīng)發(fā)展很快,那么他就會有從 0 到 1 的經(jīng)驗。推理是指通過多個證據(jù),并得出結(jié)論。還有些情況下,Agent 還需要做一些多跳檢索。比如我想查詢 " 某家公司內(nèi),有一個人選,這個人曾經(jīng)在哪些地方工作過 "。
多跳檢索和推理任務在 Agent 時代里,如果用傳統(tǒng)基于語義的 Embedding 模型的話,Agent 需要與系統(tǒng)進行反復交互。這樣消耗的 Token 量非常的大,速度很慢,而且還不一定準確。
我們在兩年多 Embedding 的實踐中,一直有一個疑惑:" 為什么像 BERT 這樣的 Encoder 架構(gòu),它的 Scaling Law 不明顯?" 后來我們從強化學習、語言學和認知心理學的角度進行了深入研究,才有了一些頓悟。我們過去總以為語言的本質(zhì)是為了傳遞信息和知識,也就是我們所說的 " 語義 "。但其實,語言與思維有著更深層的關系。比如人在思考的時候,腦海里會出現(xiàn)很多詞匯或句子。這種語言形式,我們稱之為 " 內(nèi)語(Inner Speech)"。內(nèi)語有兩個關鍵作用:第一個是幫助人保持注意力集中,第二個是引導和組織人的思維過程。
既然我們認為語言與顯性思維有關,那么我們?yōu)槭裁床荒茉?nbsp;Embedding 模型中把這種 " 思維鏈" 激發(fā)出來呢?基于這個認識,科銳正在研發(fā)兩個創(chuàng)新性的技術(shù):第一個叫 RT(Refine Thought)推理技術(shù),它通過多次前向傳播,快速激發(fā)出 Embedding 模型在預訓練階段學習到的推理能力。RT 與Embedding 模型結(jié)合,已經(jīng)在多個公開數(shù)據(jù)集上刷新了 SOTA(State of the Art,業(yè)界最優(yōu))。第二個是 正在訓練的CRE-T1 模型。它引入了基于強化學習的訓練框架,并采用token級別的信用分配機制,從而擺脫傳統(tǒng)對比學習的約束,使 Embedding 模型在推理狀態(tài)空間中實現(xiàn)更加有效的跳躍與泛化。
劉湘明:招聘看起來是一個人力資源的環(huán)節(jié),但其實這里面?zhèn)€性化差異非常大,面向不同的崗位、人才,分類龐雜,在進行 AI應用之前,你們怎么梳理這些需求的?
劉之:首先先談談對行業(yè)的理解。我認為服務跟產(chǎn)品是兩回事,管理學上講,服務管理與產(chǎn)品管理本質(zhì)上存在區(qū)別。服務管理比較強調(diào)激發(fā)顧問的自主性,需要充分授權(quán)。所以在服務行業(yè)里,過分強調(diào)標準化違背了行業(yè)特點。但是我們要做系統(tǒng),即使有自定義能力,也必須具備一定的標準化能力。這就產(chǎn)生了沖突。
在這種個性化較多的情況下,最核心的是進行識別需求。在需求識別上,我們可以分為兩個階段:一是 Agent 出現(xiàn)之前;二是 Agent 出現(xiàn)之后。
Agent 出現(xiàn)之前做產(chǎn)品,最核心的是要識別出小需求和偽需求。如果小需求,同時高頻出現(xiàn),往往這個需求是一個非常好的抓手,能夠?qū)崿F(xiàn)單點突破。這兩類需求產(chǎn)生的原因:1,對技術(shù)上限不了解,過于宏大敘事;2,對需求背后的真相不理解;3,沒考慮需求的應用范圍和頻次。
針對此,科銳提出了 " 問題 - 方案鏈 " 的需求管理方法。要明確 " 誰 "" 問題 " 和 " 方案 "。需要明確具體且有代表性的用戶角色。問題需要精準定義待解決的痛點。對比 " 現(xiàn)有方案 "(Before) 與 " 新方案 "(After),關鍵是新方案能否帶來十倍級體驗提升,同時預判新方案可能帶來的衍生問題。
另一方面,在 AI 早期,我們認為應該盡量做 " 老場景 " 的 " 新解法 "。因為技術(shù)還在變革,可能再過兩三年才會出現(xiàn)新場景。
Agent 之后,產(chǎn)品設計和需求管理的方法又發(fā)生了巨大的改變。Agent 更強調(diào)自主性,自主完成任務。原先做系統(tǒng)的時候,需要特別關注流程節(jié)點,我們稱為交付物。產(chǎn)研負責將線下的交付物固化到線上。但 Agent 時代,交付物的固化已經(jīng)不重要了,更多要觀察的是優(yōu)秀顧問的感知和決策的過程。所以,Agent 需要更多優(yōu)秀顧問參與到產(chǎn)研開發(fā)環(huán)節(jié)中。
這個階段,要先解決基礎能力再解決場景需求。例如,以科銳正在內(nèi)測的 Agent 系統(tǒng)。舉個例子,基礎能力包括模型、沙箱(沙箱就是一臺電腦,需要一個代碼執(zhí)行環(huán)境,同時還需要訪問外部網(wǎng)站)、工作記憶與長期記憶、工具等等。解決了基礎能力之后,才開始優(yōu)化具體的場景。在場景開發(fā)時候,還對基礎能力提出一些特別的需求。
Agent 與人一樣,都需要在一個巨大的問題空間中,搜索解決問題的路徑。這個問題空間我們可以用一個叫問題清晰度的指標來進行衡量。問題清晰度用專業(yè)的術(shù)語可以稱為 " 問題空間結(jié)構(gòu)良好性 "。問題清晰度包含三個方面:第一是當前狀態(tài)清不清晰;第二個是目標狀態(tài)清不清晰;第三個是搜索空間是否巨大。當問題清晰度很低的情況下,搜索是非常復雜的。
第二個指標叫費力度。認知心理學的術(shù)語可以稱為 " 認知負荷 "。它說明在這個任務當中需要耗費多少心智資源。
用費力度和問題清晰度兩個指標并結(jié)合頻次去進行判斷。比如有些高問題清晰度、低費力度的問題,如果這類問題是反復出現(xiàn)的,那么企業(yè)應用優(yōu)先解決;而低問題清晰度、高費力度的問題,這類問題價值極大(例如 AI 編碼、Coding)。通常使用長程規(guī)劃(甚至是逐步規(guī)劃),并結(jié)合更多的工作記憶才能解決。
使用這兩個指標對企業(yè)的業(yè)務或任務進行分層,找出要重點解決的場景。找到場景后,還需要進一步去思考讓 Agent 先模仿人類,再如何超越人類。
劉湘明:我再追問一下,科銳國際 AI 應用與員工協(xié)作關系是什么樣的?如何用 AI?
劉之:先談產(chǎn)研內(nèi)部的協(xié)作關系。我覺得這一波 AI 是高度學科融合的,正在對所有職能的分工進行重塑。最早大模型關心的是工程與深度學習算法的融合,到了具身智能之后開始出現(xiàn)了強化學習,再到 Agent 時代,更多討論的是認知心理學。
過去我們一直在強調(diào)分工和協(xié)作,但這一輪 AI 浪潮的到來,正在加速消滅分工和協(xié)作。
所以在過去的幾年時間內(nèi),無論是產(chǎn)品、數(shù)據(jù)、工程師,還是測試、前端、后端等部門的員工,科銳都做了很多融合工作,比如,我們要求后端會寫算法;產(chǎn)品經(jīng)理會寫代碼....這樣的融合才能拉齊大家的認知。
再從業(yè)務與產(chǎn)研的協(xié)作關系來看。我認為業(yè)務與產(chǎn)研的協(xié)作關系,應該從原來的產(chǎn)品幫助業(yè)務梳理流程,到實現(xiàn)業(yè)務自己梳理,自己實現(xiàn)應用的過程。產(chǎn)研提供的更多是可以根據(jù)業(yè)務人員的需求進行定制的通用產(chǎn)品。業(yè)務人員可以自己創(chuàng)建一個獨立的 Agent,并通過對話的方式訓練它。但核心在于業(yè)務人員能不能把自己的感知和決策過程抽象提煉出來。
劉湘明:所以說,真正的技術(shù)革命是對組織文化、傳統(tǒng)管理提出了巨大的挑戰(zhàn)。
劉之:對,管理革命的確經(jīng)過了很多階段。從早年的科學管理,到行為管理,到目標管理,再到過去幾年大廠所推行的網(wǎng)格化管理。其實早在中臺出現(xiàn)之后,尤其在產(chǎn)研部門,更多出現(xiàn)的是反分工,消滅分工。
原先,在一些諸如打車、外賣等輕服務的行業(yè),已經(jīng)利用數(shù)字化的手段實現(xiàn)了一定程度上的標準化。而產(chǎn)品管理,比如服裝行業(yè),他們其實是用數(shù)字化的方法,實現(xiàn)了一定程度的個性化。
這一輪的 AI 變革對于服務行業(yè)而言,最大的改變是:能夠讓服務行業(yè)的標準化程度再高點,或者說是將其自動化程度再提高一點,這就會帶來一個全新的管理革命。
此外,我問過一些大模型一個問題:當 Agent 在一家企業(yè)里面的應用數(shù)量超過人類會怎樣?超過 100 倍會怎樣?大多數(shù)模型給我的答案是:中層干部會消失。中層原來特別強調(diào)協(xié)調(diào),他們的職能可能就是上傳下達,協(xié)調(diào)所有人。
劉湘明:以招聘為例,原來寫簡歷是為了要考慮搜索優(yōu)化,未來是不是要考慮 AI 優(yōu)化的問題?
劉之:這個問題我們前段時間還真考慮過。我們現(xiàn)在很多時候是基于人類語言進行交互和處理,那么我們有沒有可能為 AI 創(chuàng)造一個全新的語言,它的壓縮率更高(因為中文壓縮率是比英文壓縮率要高的)。后來我試著用 AI 創(chuàng)造出了一個高度壓縮的語言,說實話連我自己都沒看懂。
劉湘明:相比上一個技術(shù)時代,哪些新的突破性技術(shù)在推動產(chǎn)品智能化進程中,起到了關鍵作用?
劉之:對科銳而言,第一是預訓練語言模型和合成數(shù)據(jù)對我們的幫助極大。在此之前,企業(yè)做匹配系統(tǒng)更多的是靠標簽以及知識圖譜之類的方式。這需要大量的人工標注。但有了預訓練語言模型的話,標注量就少了很多。
合成數(shù)據(jù)方面,畢竟原有的數(shù)據(jù)十分有限,通過合成的方式,我們可以將原先有限的數(shù)據(jù)擴展出特別多的數(shù)據(jù),這些數(shù)據(jù)再通過對比學習等方法進行訓練。
第二點我認為最大的變化是推理。我們過去理解匹配是語義的匹配,后來我們認為匹配不僅是語義,可能還包含了組織結(jié)構(gòu)、個人偏好等方面的匹配,現(xiàn)在,我們認為匹配就是推理。
推理呈現(xiàn)更多的是人類思維,我認為推理是一個意義重大的事情。而 DeepSeek-R1問世之后,反響之所以這么大,也是因為他對推理,尤其是結(jié)合強化學習這方面的突破,讓人們明白了原來推理可以通過強化學習,僅需要少量數(shù)據(jù)(比預訓練少),就能達到原先預訓練階段的推理能力。
劉湘明:AI+ 人力資源招聘場景的上限取決于什么?
劉之:我先講一下對 Agent 上限的理解。
我認為通用 Agent 最大的難點在于工作記憶有限。Agent 可以通過增大步數(shù)或提升計算總時長來提升任務執(zhí)行的效果。但這會產(chǎn)生巨大的上下文(工作記憶)。而很多大模型雖然名義上的上下文窗口很大,但實際有效的注意力有限。
我個人認為在 Transformer 架構(gòu)下有一個 " 三難困境 ",即 " 上下文窗口大小 "、" 有效的注意力 " 和 " 高信息密度 ",這三者無法同時實現(xiàn)。
比如長文章的檢索任務,大部分模型的有效注意力能到 90% 左右,但如果是推理任務,比如需要從里面根據(jù)某極端內(nèi)容推理得到一個結(jié)果,大部分模型的有效上下文,有效注意力長度就會變成上下文窗口大小的 60% 左右。
而招聘 Agent 的上限取決于感知能力。感知層面與具身智能一樣,都是最難解決的問題。在招聘當中,有一些肢體語言、表情等等。這些感知決定了招聘 Agent 的上限。
劉湘明:從客戶角度出發(fā),客戶對于 AI 技術(shù)的接受度與付費意愿如何?
劉之:科銳國際的客戶群可以分為三類,一類是甲方/雇主方;一類是候選人;還有一類是生態(tài)伙伴。目前在候選人與甲方/雇主方這兩個群體中,科銳尚未對外提供 AI 產(chǎn)品。我覺得從今年年初開始 AI 接受度開始大幅度上升,已經(jīng)有很多甲方客戶會找我們了解 AI 落地。不過在禾蛙平臺上,我們提供了一些AI工具,用于幫助生態(tài)伙伴提升工作效率。
劉湘明:AI 在落地過程中,最重要、最值得重視的問題是什么?
劉之:第一個是一定要預判方向,至少要做到預判 3 個月以內(nèi)的技術(shù)方向。在方向預判過程中,要避免走到通用大模型的主航道上,時時刻刻要思考國內(nèi)外科技巨頭們會怎樣做。
第二個是對技術(shù)要有敬畏之心。有了敬畏之心,就會選擇在一個技術(shù)或場景上反復打磨,而不是到處開花。這個技術(shù)一定是在整個系統(tǒng)中解決問題的核心技術(shù)。因為具體到落地過程中,哪怕一個小功能的落地上線,都有可能遇見很多坑。在單點上的投入,把一個點打磨的特別好,一旦這個點突破了,也許整體就突破了。
劉湘明:對您來說,這個點是什么?
劉之:以科銳為例,我認為我們過去幾年很重要的關鍵點是:行業(yè)變化速度很快,我們需要更快的響應行業(yè)變化速度。所以圍繞這個判斷,我們做了很多工作。同時,我認為我們需要在某些業(yè)務上實現(xiàn)規(guī)?;?nbsp;—— 比如在某個崗位或某個賽道上達成規(guī)?;?。在這個過程中,我覺得最重要的是解決兩個問題:一是如何獲取更多數(shù)據(jù),二是如何在單點業(yè)務中結(jié)合技術(shù)應用。此外,技術(shù)討論必須與業(yè)務實際緊密結(jié)合。
![]()
快報
根據(jù)《網(wǎng)絡安全法》實名制要求,請綁定手機號后發(fā)表評論
招聘 AI 分三階段,現(xiàn)在總算到 Agent 能自己干活了。
語音和文本多模態(tài)結(jié)合,在招聘電話里應該好用。
先磨基礎能力再搞場景,Agent 落地得這么穩(wěn)著來。
以前靠人工標注,現(xiàn)在有預訓練模型省事多了。
中層干部可能消失?AI 對管理的影響真不小。
科銳從老場景找新解法,這思路在 AI 落地時挺實用的。
問題清晰度和費力度,用這倆選場景挺靠譜的。
Agent 工作記憶有三難,看來通用型還得再琢磨琢磨。
推理能力成關鍵,看來匹配不只是看簡歷文字了。
客戶對 AI 接受度上來了,就看實際效果能不能留住人