00:45 智能體上限是模型能力,自訓(xùn)練模型成為出路
14:21 AI下半場,可能是大數(shù)據(jù)小模型的時代
29:00 專屬模型訓(xùn)練,卡點(diǎn)在哪
40:03 只做Agent不做行業(yè)模型,相當(dāng)于只做“面子”不做“里子”
以下為對話實(shí)錄,經(jīng)編輯整理:
劉湘明:各位觀眾大家好,歡迎來到鈦媒體舉辦的AI落地指南系列的直播的第一場。今天也特別高興邀請到了兩位嘉賓,他們是釘釘CTO朱鴻(一粟)、壹生檢康創(chuàng)始人王強(qiáng)宇。
去年9月份,強(qiáng)宇在鈦媒體三亞的IT價值峰會上面有一個很重要的發(fā)布,過去一年,產(chǎn)品做了哪些升級迭代?
王強(qiáng)宇:其實(shí)最重要的迭代就是我們從做Prompt和RAG,變成是自己訓(xùn)練一個婦科大模型。因?yàn)槲覀冎饾u發(fā)現(xiàn),盡管我們做了很復(fù)雜的Prompt,智能體的準(zhǔn)確率到了70%左右,再往上走就非常難。
我們從今年1月份開始考慮自己訓(xùn)練模型,當(dāng)時正好也是DeepSeek比較火的時候。DeepSeek的開源給了我們訓(xùn)練模型的新思路。在三月底四月初的時候,我們和釘釘團(tuán)隊做了一些交流,他們很快就提出來說可以支持我們,支持中小企業(yè)創(chuàng)業(yè)公司來做模型的訓(xùn)練,我們就在釘釘?shù)膶儆?xùn)練平臺上做了很多共創(chuàng)。
早期主要是從SFT需要的環(huán)境和卡的算力去考慮,之后也是把數(shù)據(jù)標(biāo)注的問題做了重新的梳理,包括訓(xùn)練的整個流程,我們最新發(fā)布版本的婦科大模型準(zhǔn)確率,在六個癥狀上面可以達(dá)到90.2%。我們也用在了我們自己的“閨蜜醫(yī)生”產(chǎn)品上,一個32B的小模型只需要2張4090卡就可以跑通(含推理)。
這說明,小模型完全可以訓(xùn)練出來,也完全可以跑得起來。閨蜜醫(yī)生是個toC的應(yīng)用,解決了很多15-25歲女生遇到的各種婦科問題,所以我們覺得這個路徑完全可以走得通,這也是我們這次和鈦媒體一起來聊這個話題的原因。
劉湘明:你在鈦媒體上發(fā)了兩篇文章,效果都非常好,都是這種非常深度的技術(shù),你提到關(guān)鍵的優(yōu)化,包括針對一些合成數(shù)據(jù),高質(zhì)量的數(shù)據(jù),對這種診斷的準(zhǔn)確率提升有很大關(guān)鍵的作用,到底是做的哪些事情呢?
王強(qiáng)宇:主要做了這么幾件事情。
首先就是數(shù)據(jù)的準(zhǔn)備工作,從數(shù)據(jù)的清洗到數(shù)據(jù)的分布,我想先解釋一下什么叫精標(biāo)數(shù)據(jù),對于醫(yī)學(xué)來說,其實(shí)我們說的婦科的六大癥狀就是從月經(jīng)不調(diào)到異常出血,到外陰瘙癢,到白帶異常等六個癥狀。我們過去的數(shù)據(jù)其實(shí)沒有很均勻地分布在這六個癥狀,所以首先我們把數(shù)據(jù)做了一個很均勻的分布;
第二,我們把數(shù)據(jù)從癥狀信息到思考過程,到診斷的結(jié)論,做了一次非常認(rèn)真的標(biāo)注,從幾萬條數(shù)據(jù)中提取出來幾千條精標(biāo)數(shù)據(jù);
第三,我們跟釘釘團(tuán)隊共創(chuàng)。釘釘也有支持我們的算法團(tuán)隊一起共創(chuàng)和研究pipeline(流水線并行),因?yàn)樵?strong>有了算力以后,需要有一個步驟去分步去訓(xùn)練這個模型,我們把過去二十多個小時的訓(xùn)練時間壓縮到了7個小時,這個過程其實(shí)就離不開釘釘對我們非常具體的共創(chuàng)和支持。
我們每次訓(xùn)練都會做迭代和數(shù)據(jù)優(yōu)化,準(zhǔn)確率逐漸從70%多到83%,最后幾天才到90%。
當(dāng)然這里面還有一件事情我覺得比較重要,就是從管理監(jiān)督學(xué)習(xí)的SFT到算法專家調(diào)整獎勵參數(shù)、函數(shù)等,有了釘釘這樣的一個平臺,我們創(chuàng)業(yè)公司就有一個更好的底座和基礎(chǔ)來訓(xùn)練。
所以其實(shí)我覺得最大的一個收獲,toC應(yīng)用有數(shù)據(jù)和算力還不夠,需要有行業(yè)專家來一起來做這件事情,過程還是比較曲折的,中間有幾次都練不下去了,在訓(xùn)練環(huán)境上,在數(shù)據(jù)的標(biāo)注的方法上,在訓(xùn)練的整個的流程上面,其實(shí)都有很多地方是有一些know-how的。
劉湘明:聽強(qiáng)宇剛才的介紹,其實(shí)你們跟釘釘?shù)暮献?,其?shí)跟原來甲方乙方的合作好像不太一樣了,一粟能不能介紹一下?
朱鴻(一粟):隨著通用大模型能力越來越強(qiáng),好像公眾都已經(jīng)普遍在接觸AI了,我們發(fā)現(xiàn)AI技術(shù)逐漸成熟,尤其像強(qiáng)化學(xué)習(xí)這樣的技術(shù),能夠大幅降低訓(xùn)練成本。
我們的基本判斷就是,AI大模型的下半場就是問AI要效果,70分可能只是及格,我們要實(shí)現(xiàn)具體任務(wù)的高準(zhǔn)確度,一定要通過科學(xué)的訓(xùn)練方法,產(chǎn)生出一個有效果保障的模型,這是釘釘需要去做的事情。
確實(shí)如強(qiáng)宇所講,訓(xùn)練模型實(shí)際上也是真的是需要勇氣,因?yàn)槲粗臇|西太多。訓(xùn)練模型本身并不是一個高度確定性的事情,尤其是我們現(xiàn)在還在幾十張卡的訓(xùn)練環(huán)境,如果我們走向百卡、千卡甚至萬卡的訓(xùn)練,預(yù)計挑戰(zhàn)會更多。
關(guān)于這件事情的價值,就是進(jìn)入到企業(yè)級AI領(lǐng)域,我們也有一些思考,企業(yè)用AI一般分成三個層次。
第一個就是做企業(yè)知識的管理,提升信息檢索或企業(yè)內(nèi)部問答的效率,門檻也不會很高,我走訪了可能幾十家企業(yè),90%的企業(yè)都已經(jīng)在內(nèi)部開始實(shí)施知識庫的應(yīng)用。
第二個層次就是經(jīng)營決策類的輔助,對經(jīng)營管理做出一些輔助決策,優(yōu)化資源的配置,比如說像電商里的銷量預(yù)測,價格的一些優(yōu)化,或者搭建大數(shù)據(jù)的看板。我們也做了一些嘗試,在招聘領(lǐng)域做簡歷的初查,這些應(yīng)用也開始在各行各業(yè)里面產(chǎn)生一些新的效果,但是Agent的能力上限,其實(shí)就是模型的創(chuàng)新,模型的能力有多少,Agent很難去超越,所以我們就有這個決心去和行業(yè)共創(chuàng)垂直行業(yè)大模型。
我們也希望能夠更快進(jìn)入到企業(yè)應(yīng)用AI的第三個層次,就是生產(chǎn)工藝流程的自動化,融入到企業(yè)的核心流程里,推動像制造行業(yè)的智能制造、供應(yīng)鏈的優(yōu)化、庫存的智能調(diào)度,包括我們看到一些行業(yè)多模態(tài)模型的應(yīng)用,老師傅的經(jīng)驗(yàn)可以被訓(xùn)練到模型里,比如在產(chǎn)線聽到鍋爐或者發(fā)動機(jī)的聲音異常,老師傅一聽就知道可能出問題了。
但如果沒有非常昂貴的監(jiān)測系統(tǒng)的話,實(shí)際上我們可以用非常廉價的這種設(shè)備,結(jié)合一些新的標(biāo)注,讓老師傅來成為這個模型的訓(xùn)練師標(biāo)注師,通過訓(xùn)練模型的方式,能夠產(chǎn)生一個AI識別鍋爐的聲音的功能,診斷下是否有安全隱患。
類似于這樣的小模型,其實(shí)也能夠在企業(yè)經(jīng)營、生產(chǎn)管理上產(chǎn)生效果。所以釘釘大模型的下半場,我們的定位就是為千行百業(yè)做專屬模型,認(rèn)真做好AI的基礎(chǔ)設(shè)施,提供全鏈路的專屬模型打造工具鏈,做好服務(wù),也是要跟我們的客戶行業(yè)標(biāo)桿一起,探索AI能夠?yàn)槠髽I(yè)未來帶來什么樣的價值,我們做好賦能的工作。
![]()
劉湘明:強(qiáng)宇剛才也介紹了很多,那么,做行業(yè)模型這件事的源泉和邏輯是什么?
王強(qiáng)宇:我非常認(rèn)同一粟講的觀點(diǎn),智能體的上限是模型的能力。我們?nèi)ツ?月份參加了鈦媒體的數(shù)字價值峰會,但走到12月份的時候,我們已經(jīng)發(fā)現(xiàn),其實(shí)靠智能體已經(jīng)走不下去了。
我覺得行業(yè)模型的訓(xùn)練是智能體走下去的一個必然、一個終局的選擇。當(dāng)然正好也出現(xiàn)了通義QWEN,能力很強(qiáng),又出現(xiàn)了DeepSeek,確實(shí)也有關(guān)系,昨天晚上我跟一個朋友在聊,他們也說到,可能下半場是大數(shù)據(jù)小模型的時代。
行業(yè)模型就是我們認(rèn)為的大數(shù)據(jù)小模型的時代。從我們自己訓(xùn)練模型的體會,我們最深刻地體會,可能還是深度共創(chuàng),釘釘是具備這樣的土壤和環(huán)境的。所以我其實(shí)很感謝釘釘,既非常敏銳地看到了這樣的一個機(jī)遇,又非常開放地給垂直公司這樣的機(jī)會。
因?yàn)閷τ谥行?chuàng)業(yè)公司來說,有幾個很大的瓶頸。第一個就是算力資源,我們都很清楚,由于地緣政治的原因,算力資源對中小企業(yè)來說是非常難的,不是光有錢的問題,可能有錢也不一定買得到。
第二,就是訓(xùn)練環(huán)境的搭建。釘釘團(tuán)隊給了我們非常大的支持。因?yàn)樗麄冇幸恍┳鲞^行業(yè)訓(xùn)練或者做過基模訓(xùn)練的工程師和專家,可以幫助我們快速搭建行業(yè)模型的訓(xùn)練環(huán)境。這看起來好像沒有那么難,但是實(shí)際上自己要摸索蠻長時間。
第三,就是訓(xùn)練方法,有數(shù)據(jù)是不是就能訓(xùn)練出一個高準(zhǔn)確度的模型?不一定,因?yàn)槟阈枰幸粋€正確的訓(xùn)練方法,這就是我們經(jīng)常說的算力、算法和數(shù)據(jù)的關(guān)系。打個比方,數(shù)據(jù)相當(dāng)于做菜的原材料,光有原材料是不是就能做一桌好菜,你還要有很好的烹飪的方法,烹飪的流程,這個就是釘釘提供的東西,所以這幾個東西其實(shí)釘釘都能夠很好地提供。
釘釘又是很懂行業(yè)的一個應(yīng)用,所以我覺得這才是未來中小企業(yè)釋放數(shù)據(jù)活力的場景。
劉湘明:一粟有什么補(bǔ)充么?
朱鴻:我簡單補(bǔ)充一下。強(qiáng)宇講得很好,從成本上來講分三部分:第一部分是數(shù)據(jù),第二部分是整個算力以及工程鏈路,第三塊是算法的人才成本。
釘釘希望能夠?yàn)槠髽I(yè)實(shí)現(xiàn)一個按效果付費(fèi)的訓(xùn)練,按需付費(fèi)的推理。
在AI技術(shù)發(fā)展的早期,這個投資大家也不確定,投下去到底能產(chǎn)生多少的價值,釘釘愿意為各行各業(yè)去提供一個效果導(dǎo)向的專屬AI工廠,送進(jìn)來的就是很好的原料,數(shù)據(jù)是企業(yè)的私有,以及企業(yè)的業(yè)務(wù)專家人才。
我們是算法,對這些數(shù)據(jù)的質(zhì)量以及訓(xùn)練的目標(biāo)做測試,確定投入下去有效果,整個訓(xùn)練過程有可能產(chǎn)生一些問題,這些問題都是釘釘去解決。我們希望在雙方投入下去之前,就對模型的能力就有一個共識,基于這個共識,我們一起努力地把這個專屬模型有效地生產(chǎn)出來,所以釘釘希望在AI的這個時代,實(shí)現(xiàn)AI按效果付費(fèi)的商業(yè)化的解決方案。
劉湘明:特別好。因?yàn)榇蠹椰F(xiàn)在到AI時代都在談按效果付費(fèi),釘釘好像第一個把這個大旗舉起來,我想追問一句,就是你說按效果付費(fèi),你們的底氣來自于什么地方?因?yàn)閯偛乓舱劦搅?,其?shí)之前我們過去幾十年,大家都想走這條路。
朱鴻:這個底氣,第一來自于阿里云,尤其像大模型的訓(xùn)練過程中,積累沉淀下來的知識,以及最大的算力供給。我們可以在非常短的時間內(nèi)去調(diào)度百卡甚至千卡的算力。我們也期望未來每家企業(yè)都有不止一個專屬模型,并且能夠通過釘釘上的數(shù)據(jù)閉環(huán)鏈路,實(shí)現(xiàn)一個模型可以每天迭代。就像我們現(xiàn)在開發(fā)釘釘?shù)膽?yīng)用,快速迭代適應(yīng)業(yè)務(wù)的一些不確定性。
整個阿里集團(tuán),包括釘釘積累的經(jīng)驗(yàn)、知識、人才,以及釘釘已經(jīng)連接了中國最廣泛的企業(yè),尤其是像制造行業(yè)、零售行業(yè)的標(biāo)桿客戶。他們有這樣的意愿和我們共創(chuàng)。
這也是釘釘一直以來堅守的產(chǎn)品文化,我們不去定義太多,不是站在自己平臺的角度去定義產(chǎn)品,而是跟我們的客戶去共創(chuàng)。
產(chǎn)品來源于真實(shí)的場景需求,將阿里的技術(shù)普惠化,讓技術(shù)和業(yè)務(wù)比較深入地去結(jié)合,以最終效果為導(dǎo)向去衡量。當(dāng)然最重要的就是客戶的信任,才有這樣的一個底氣。
劉湘明:話題回到強(qiáng)宇這邊,你們有沒有估算過效果是什么樣的?
王強(qiáng)宇:這其實(shí)也是我想聊的話題,從六月底達(dá)到90%準(zhǔn)確度之后,我們很快就已經(jīng)部署到閨蜜醫(yī)生這么一個to C應(yīng)用上。剛剛我們和美年大健康的合作伙伴還在演示我們的產(chǎn)品,我們其實(shí)就部署了幾張4090的卡,回答的速度和準(zhǔn)確度,跟DeepSeek已經(jīng)在體驗(yàn)上沒什么差別,我們也有一個功能是深度思考的,叫問癥狀的功能。
每天幾千個、上萬個用戶已經(jīng)在用,我們的客戶已經(jīng)都在用這個婦科大模型,效果還是令人滿意的。
第二,我們現(xiàn)在已經(jīng)準(zhǔn)備向一些醫(yī)院開放這樣的能力了,特別是一些專科醫(yī)院,婦科的醫(yī)院。我們其實(shí)也在跟醫(yī)院聊,通過醫(yī)院的數(shù)據(jù)訓(xùn)練醫(yī)院的??拼竽P?。
中國其實(shí)有很多這樣的??漆t(yī)院,我們覺得應(yīng)用場景非常廣闊,很多醫(yī)院的數(shù)據(jù)拿出來訓(xùn)練以后,可以很快這個專屬模型達(dá)到醫(yī)院的頂尖水平。
相當(dāng)于每一個患者來這里預(yù)問診的時候,就等于是醫(yī)院最好的專家來幫他做問診,再分解到線下的問診,極大可以釋放醫(yī)院數(shù)據(jù)的能量和能力。
第三,我們跟釘釘也在繼續(xù)訓(xùn)練婦科模型,下一步的目標(biāo)就是從婦科到婦產(chǎn)科,另外我們的目標(biāo)是通過婦產(chǎn)科的正高考試,目前最新的情況已經(jīng)到60多分了,已經(jīng)及格了,我們希望能到75分以上。
剛才一粟講的按效果付費(fèi),我們不知道其他行業(yè)怎么樣,就我們這個行業(yè),我覺得完全是有機(jī)會的。
劉湘明:剛才提到了準(zhǔn)確率,你可能需要跟觀眾做一些科普,在醫(yī)療行業(yè)里面普遍的診斷準(zhǔn)確率大概是什么狀態(tài)?
王強(qiáng)宇:這個數(shù)字聽眾聽了以后,可能會比較失望。我們通過非官方的數(shù)據(jù)看到,三甲醫(yī)院的估準(zhǔn)率可能在30%到40%左右。當(dāng)然這是非官方數(shù)據(jù),不太準(zhǔn)確哈。
那么出現(xiàn)這樣問題的原因是什么?
第一,醫(yī)生的就診時間太短,我們都看過專家門診,醫(yī)生他也是人,他也不是神仙,在沒有完全讀到你的病歷之前,他就要給你做判斷,這個非常難。
第二,現(xiàn)在中國醫(yī)院的數(shù)據(jù)還沒有打通,你在A醫(yī)院看的這個病,到B醫(yī)院可能它是不連接的。醫(yī)生沒有辦法像AI匯總數(shù)據(jù),來判斷你的疾病,所以這也造成了誤診的問題。
所以90%的準(zhǔn)確度其實(shí)已經(jīng)很高了。當(dāng)然,這指的是醫(yī)生判斷的第一概率的疾病是什么,他跟真正專家線下標(biāo)準(zhǔn)來比較,可以到90%的匹配度。
AI的本質(zhì)是普惠人民,就是讓更多的人在醫(yī)生不需要工作的情況下,把自己的癥狀放給醫(yī)生,醫(yī)生大概判斷你可能是一個什么樣疾病,這肯定可以極大提高人民群眾的就診的體驗(yàn)。
![]()
劉湘明:剛才你也提到一個很關(guān)鍵的問題,說有幾次訓(xùn)練搞不下去了。直播間的人很多是行家,有人在問這個到底卡在哪兒,能不能跟大家交流一下細(xì)節(jié)?行家們都關(guān)注細(xì)節(jié)。
王強(qiáng)宇:第一個細(xì)節(jié)就是,我們在訓(xùn)練的過程中,有一段時間發(fā)現(xiàn)準(zhǔn)確度怎么也上不去了,到了70它就掉回來了。我們就很困惑為啥上不去,算力也夠,就是跑不通,就是上不去。
后來我們就發(fā)現(xiàn),問題出在數(shù)據(jù)上,我們后來跟一粟團(tuán)隊的算法專家一起討論,首先數(shù)據(jù)在六大領(lǐng)域是要均勻的,我記得是好像是外陰瘙癢這個癥狀,我們數(shù)據(jù)就很少,可能只有幾千條數(shù)據(jù),所以碰到這個癥狀的時候,機(jī)器就不懂,他就訓(xùn)不出來。我們后來很快花了很多時間去調(diào)整數(shù)據(jù)的分布,做精標(biāo)數(shù)據(jù)的分布。
第二卡點(diǎn),訓(xùn)練流程可能不一定對,模型需要一個很正確的pipeline訓(xùn)練步驟。你先要去做什么樣的訓(xùn)練,后面再做什么。我們在鈦媒體發(fā)的文章,基本上都核心的know-how說出來了,基本上沒有怎么做保留。
后來我們和一粟團(tuán)隊建立流程之后,其實(shí)很快就找到了一條正確的道路。按照這個流程準(zhǔn)備數(shù)據(jù),準(zhǔn)備數(shù)據(jù)了以后分步來訓(xùn)練,然后就看到準(zhǔn)確率就逐漸地提高了。當(dāng)然在強(qiáng)化學(xué)習(xí)上面可能還有一些困難和問題還沒有完全解決。
因?yàn)槲覀兒髞戆l(fā)現(xiàn),強(qiáng)化學(xué)習(xí)真的要讓它出現(xiàn)好的結(jié)果,可能你需要的數(shù)據(jù)質(zhì)量,包括分布可能有更高的要求。所以我們現(xiàn)在通過獎勵函數(shù)去做更深的共創(chuàng)和研究。
劉湘明:一粟還有什么補(bǔ)充么?
朱鴻:我覺得第一個挑戰(zhàn)還是一開始的信任。雙方在第一周的合作里面,共同地建立起工作目標(biāo)的認(rèn)知,我們就是要做到高分,而且是有時間要求,我覺得這是第一個挑戰(zhàn)。
前面講到的數(shù)據(jù)問題,數(shù)據(jù)的配方確實(shí)是模型產(chǎn)生真正能力的關(guān)鍵,在這方面下了不少的功夫,那今天的技術(shù)人員在這個模型能力上不去的時候,診斷到底哪里有問題。這還是基于模型訓(xùn)練的專業(yè)知識,專家經(jīng)驗(yàn)來判斷能夠給出定位問題,快速反饋以及雙方一起再把這個問題解決,如果設(shè)置目標(biāo)很低,其實(shí)他并不滿足行業(yè)的生產(chǎn)的要求。
劉湘明:我們在去年在三亞也討論過,大家很容易達(dá)到一個好像看著不錯的分值,有的人說是三四十分,有的人說是六七十分。但是真正達(dá)到可用的優(yōu)秀狀態(tài),其實(shí)中間有一個很難突破的瓶頸。也想請兩位分享一下,你覺得到底是什么地方是卡點(diǎn),怎么去突破這個瓶頸。
王強(qiáng)宇:深度共創(chuàng)其實(shí)還蠻難的。我覺得釘釘在這一點(diǎn)上我特別認(rèn)可,剛才一粟也說了,釘釘是千行萬業(yè)的釘釘,釘釘?shù)亩ㄎ挥衅栈莸乃枷?,一個大公司很難跟一個創(chuàng)業(yè)公司在一起做很深度的共創(chuàng)。
無招回到阿里之后,他還是把這個共創(chuàng)的大旗和文化重新樹立起來了。大家都其實(shí)看過無招第一段創(chuàng)業(yè),如果沒有那家公司,可能釘釘?shù)恼Q生至少要晚幾年。
所以我覺得共創(chuàng)的文化和共創(chuàng)的精神,是解決卡點(diǎn)的精神和文化內(nèi)因。我們跟一粟團(tuán)隊之間也非常親密無間在合作。我們沒有說這個數(shù)據(jù)不能給你看,你不能來了解我的這個know-how,一粟也沒有覺得這個算法不是我的事,我為什么要替你去研究這個事。
回到模型訓(xùn)練這個事,連大模型都能訓(xùn)練出來,行業(yè)模型訓(xùn)練不出來么,肯定訓(xùn)練的出來。我作為一個創(chuàng)始人的角度,我理解就是說技術(shù)的困難確實(shí)有,但你做這件事情的精力夠不夠?是不是真的愿意把這些數(shù)據(jù)問題拿出來。
畢竟行業(yè)模型也不需要去做一個基模的創(chuàng)新,這些問題從理論上來說,其實(shí)都是有方案可以解決的,只是說能解到什么程度。釘釘很快補(bǔ)充了和吸引了很多算法人才進(jìn)來,這可能也是解決問題的另外一個原因,這部分可能一粟可以更多講一下。
朱鴻:行業(yè)模型要成功,關(guān)鍵的就是大模型算法或者工程技術(shù)人員和懂這個行業(yè)的人,大家互相信任,能夠結(jié)合在一起訓(xùn)練模型。
我們可以看到,今天在行業(yè)里面,通用大模型的能力在不斷提升,它實(shí)際上是利用了公開的幾乎所有的知識,把它壓縮到了一個大模型里。現(xiàn)在跑出來的模型應(yīng)用,最多的是代碼生成的模型,AI產(chǎn)品可以幫助工程師更快掌握全棧技術(shù),了解技術(shù)原理,因?yàn)锳I把互聯(lián)網(wǎng)上學(xué)到的技術(shù)文檔、知識,代碼都學(xué)習(xí)了。
隨著AI的技術(shù)發(fā)展,我覺得懂AI的行業(yè)人才也會越來越多,在行業(yè)里面的大模型更多被應(yīng)用,被訓(xùn)練出來,被生產(chǎn)出來,所以要達(dá)到今天這個效果,我認(rèn)為還是要讓AI技術(shù)更加普及,能夠到各個行業(yè)里去,跟行業(yè)的專家一起把行業(yè)大模型能力定義標(biāo)準(zhǔn),我覺得AI效果的卡點(diǎn)肯定不是在算力上,一定還是在數(shù)據(jù)和人才的組合。
劉湘明:后邊一個問題可能是比較有爭議性,拆開兩部分問:一部分其實(shí)是強(qiáng)宇,今年很熱的一個話題就是Agent智能體,你們?nèi)ツ觊_始折騰這個事情,然后Agent今天變得非常的熱;再回到一粟這邊,釘釘其實(shí)把很多的關(guān)注度放在了行業(yè)模型的開發(fā)建設(shè)上,基本沒有談智能體。你們怎么看待智能體和行業(yè)模型未來的發(fā)展,沿著你們的思路,未來會有哪些機(jī)會?
王強(qiáng)宇:這個話題我也是挺想說一說的,智能體今年其實(shí)確實(shí)很熱,包括MCP,包括智能體的一些公司Manus等,我是很認(rèn)同一粟的觀點(diǎn),智能體的上限是模型的能力。
如果說是一個辯論大賽的話,我肯定是支持行業(yè)模型和垂直模型才是更好的AI下半場的未來的觀點(diǎn),因?yàn)橹悄荏w做得再好,你可能能做的事情就是把它的應(yīng)用做得更絲滑、做得更方便,比如說MCP形態(tài),可以把這個事情做得完成度更高。
但是如果我們不能把行業(yè)的數(shù)據(jù)挖掘出來,其實(shí)等于放著一個金礦,你沒有去采。而是天天研究怎么能把門面做得更好看一點(diǎn),門面做得好看,數(shù)據(jù)的威力發(fā)揮不出來,那么AI的算法算力怎么能夠發(fā)揮作用。
我們作為行業(yè)應(yīng)用公司,肯定是要把數(shù)據(jù)的力量真正發(fā)揮出來,讓數(shù)據(jù)用到該到的地方去,我非常支持釘釘在行業(yè)數(shù)據(jù)這一塊的研究,而且從千行萬業(yè)的角度來看,行業(yè)模型訓(xùn)練才是最大能釋放中小企業(yè)和各個行業(yè)公司生產(chǎn)力的機(jī)會。
因?yàn)橹悄荏w可能影響的就是這些PaaS的公司,但是我覺得還不是特別根本。所以我其實(shí)有一個觀點(diǎn),這個觀點(diǎn)有點(diǎn)偏執(zhí),我覺得智能體更多的就是“術(shù)”方面的事情,“道”的問題還是要解決數(shù)據(jù)和訓(xùn)練的問題。
這個觀點(diǎn)對不對,也要未來去驗(yàn)證,但是在今天這個時間點(diǎn),我們來談智能體更遠(yuǎn)的未來是什么,我覺得肯定離不開模型,離不開行業(yè)模型的訓(xùn)練,離不開這些數(shù)據(jù)使用的價值。
AI時代跟上一個數(shù)據(jù)時代肯定是相關(guān)聯(lián)的,數(shù)據(jù)才是真正的原材料。如果沒有原材料,AI時代怎么能夠跑得起來好的應(yīng)用?這是我的一個觀點(diǎn)。
我還想補(bǔ)充一點(diǎn)卡點(diǎn)的問題,我們公司其實(shí)也是一個跨界的團(tuán)隊。當(dāng)你做一個行業(yè)的時候,可能你需要跨界,除了算法工程師、應(yīng)用工程師以外,我們還有一個全職的醫(yī)學(xué)團(tuán)隊,他們都是醫(yī)生出身,我最近聽說螞蟻有個團(tuán)隊中也有好幾十個醫(yī)生,所以就是說真正要把應(yīng)用做到很好,創(chuàng)業(yè)者可能也要組建一個創(chuàng)業(yè)團(tuán)隊,在AI時代才會有機(jī)會把行業(yè)做得非常深入。
朱鴻:Agent和模型,我覺得是在AI技術(shù)發(fā)展過程中,大家的側(cè)重點(diǎn)也在不斷演進(jìn),整個行業(yè)里面模型訓(xùn)練的迭代速度越來越快。
從GPT 3.5到現(xiàn)在通義千問的迭代速度,過去可能一年一個模型,現(xiàn)在一個月好幾個模型,我當(dāng)然希望企業(yè)自己的模型也能夠按日來迭代。只有這樣,企業(yè)才能真正把AI的技術(shù)價值發(fā)揮出來
我覺得整個行業(yè)從業(yè)者都要積極思考,這里面會涉及到非常多的技術(shù)。比如去年大家談很多微調(diào),微調(diào)成本也不低的,今年更多就是強(qiáng)化學(xué)習(xí),明年會不會有新的技術(shù)出來,我想一定會有。
這些技術(shù)迅速地被應(yīng)用起來,原來需要做很多的Agent編排,這個工程工作是不是會被新訓(xùn)練的模型自動解決掉,讓整個應(yīng)用的體驗(yàn)變得更好,我想這一定是一個動態(tài)變化的過程。
我相信模型本身的能力會不斷加大,但是企業(yè)的知識最終都是被訓(xùn)到專有數(shù)據(jù)庫,它不會在一個智能體的編排的流程上。
劉湘明:強(qiáng)宇下定決心把重點(diǎn)從Agent智能體轉(zhuǎn)到行業(yè)模型的訓(xùn)練上,這個決心有多難?剛才也談到了行業(yè)模型,你們都覺得是一個更值得關(guān)注的趨勢,企業(yè)尤其中小企業(yè)需要做好哪些準(zhǔn)備?
王強(qiáng)宇:是這樣的,我們當(dāng)時從Agent轉(zhuǎn)到模型訓(xùn)練,我們自己也在回顧當(dāng)時的決策流程,其實(shí)我覺得當(dāng)時的決策流程還挺平滑的,很自然地覺得應(yīng)該去做模型了。
我們就開了一個合伙人的會,我現(xiàn)在回顧可能有幾個因素:第一個就是DeepSeek的出現(xiàn),大家都知道DeepSeek出現(xiàn)了以后,對整個AI行業(yè)帶來很大的一個沖擊,我們就發(fā)現(xiàn)原來基模還可以做得更好。
第二,還是智能體的上限是模型的能力,做到百分之六七十的時候,其實(shí)要再提高這個準(zhǔn)確度,已經(jīng)很難再往上提高,你自己看到這個瓶頸,所以你就自然會想到,我有數(shù)據(jù)可以微調(diào),可以后訓(xùn)練。我們也當(dāng)時看了很多論文,特別是強(qiáng)化學(xué)習(xí)發(fā)展得很快的,DeepSeek在強(qiáng)化學(xué)習(xí)算法上做了很多創(chuàng)新,才能把訓(xùn)練成本大幅下降。這也是回到模型訓(xùn)練的一個原因,當(dāng)然我們也有這樣的算法專家,能夠看到這個趨勢。
簡單地說,就是兩個因素,一個是你的準(zhǔn)確度上不去了,但又想追求更好的體驗(yàn)給用戶,要給用戶更準(zhǔn)確的結(jié)果,肯定去想新的辦法,這很自然。第二個就是說因?yàn)轭愃朴贒eepSeek這樣的模型出現(xiàn),包括算法的迭代,我記得有位院士說的一段話特別有意思,現(xiàn)在看起來也是在驗(yàn)證那句話。就說AI行業(yè)現(xiàn)在發(fā)展很有意思,算力、算法在變革,現(xiàn)在看起來數(shù)據(jù)也可能會變革,它幾個要素都在輪流變革,輪流變革就會帶動這個行業(yè)輪流的創(chuàng)新和發(fā)展。
現(xiàn)在看起來真的是按照這個邏輯在走,所以我覺得這一輪為什么我們看好行業(yè)模型,我覺得釘釘?shù)倪x擇非常正確,除了使命正確以外,就是幫助中小企業(yè)來做普惠創(chuàng)新正確以外,其實(shí)數(shù)據(jù)給了大家這樣的機(jī)會。
回到剛才那個問題,當(dāng)時選擇做模型訓(xùn)練還挺自然的。一個創(chuàng)業(yè)公司最重要的事情是要有自己的獨(dú)立思考能力。而不是智能體熱我就做智能體,模型熱我就做模型,我覺得肯定是不對的,應(yīng)該是依據(jù)客戶價值和你的方向去做。
劉湘明:最后一個問題留給一粟,你剛才也談了很多,可能很多企業(yè)也躍躍欲試,可能想訓(xùn)練自己的模型。他們在跟釘釘合作之前,需要做好哪些準(zhǔn)備呢?
朱鴻:我認(rèn)為投入做這個事情可能也要一把手決定,客戶需要有數(shù)據(jù),過去十年以來,很多客戶通過釘釘實(shí)現(xiàn)從無紙化再到組織在線,很多業(yè)務(wù)系統(tǒng)都已經(jīng)完成了數(shù)據(jù)積累,但是有數(shù)據(jù)和AI ready的數(shù)據(jù),中間還是有些距離,所以我們會去積極評估。
雙方的決心還是非常關(guān)鍵的,我們希望周期也不能太長,所以企業(yè)在數(shù)據(jù)準(zhǔn)備和決心上如果有這樣的共識,實(shí)際上我們主要的評估就是否具備一定的示范性。
劉湘明:那對于人才方面有沒有什么要求,因?yàn)槠鋵?shí)AI人才基本上都被大廠抓走了,是吧?
朱鴻:對企業(yè)來講,我們更需要的是去懂這個業(yè)務(wù)的老師傅,他能夠?qū)δP偷哪芰ψ龀稣_的評估。只要建立好這樣的一個專家?guī)?,我們就有信心,把這個模型給確認(rèn)好。
劉湘明:強(qiáng)宇有什么補(bǔ)充?
王強(qiáng)宇:我覺得釘釘現(xiàn)在正在形成標(biāo)準(zhǔn),以后可能不需要我這樣的人。但是需要老師傅,產(chǎn)品經(jīng)理,包括對客戶很了解的人。其實(shí)釘釘一樣可以把它拆解出來。
因?yàn)獒斸斢凶銐虻乃惴ê退懔Φ膶<?,我甚至還會有外圍的咨詢公司來建設(shè)生態(tài)。我覺得完全有可能訓(xùn)練出行業(yè)模型。
![]()
(本文首發(fā)于鈦媒體APP,作者 | 張帥,編輯 | 蓋虹達(dá))
快報
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請綁定手機(jī)號后發(fā)表評論