火山引擎也不提及模型的私有化部署。譚待表示“搞私有化、一體機(jī),在AI時(shí)代完全不work”。不過(guò),一些行業(yè)人士表示,這給豆包大模型在部分行業(yè)市場(chǎng)落地帶來(lái)阻力。它只能用支持私有化部署的工具如HiAgent搭配DeepSeek等開源模型,開展業(yè)務(wù)。
![]()
譚待也被幾次問(wèn)及豆包手機(jī)問(wèn)題,雖然這并不是他負(fù)責(zé)的業(yè)務(wù)。他以汽車座艙服務(wù)舉例,強(qiáng)調(diào)這種以agent的自然交互方式,是手機(jī)和各種終端需要的體驗(yàn),感覺(jué)有非常大的智能空間。而這次主題峰會(huì)上,一個(gè)有趣的事情是,火山引擎首先介紹了其安全產(chǎn)品。譚待稱“沒(méi)有其他云企業(yè)這樣做”,理由是不把安全解決好,大家用起來(lái)不放心,并稱市場(chǎng)大、責(zé)任也更大。展區(qū)內(nèi)也有合作伙伴認(rèn)為,安全是關(guān)乎字節(jié)下一步業(yè)務(wù)的關(guān)鍵。
以下是譚待會(huì)后與媒體、自媒體部分Q&A整理(有部分問(wèn)題整合):
Q:會(huì)上公布了豆包大模型日均調(diào)用量超過(guò)50萬(wàn)億tokens,這些tokens是集中在某些行業(yè),還是比較分散?是否有行業(yè)占比超過(guò)5%或10%,另外個(gè)人用量占比是怎樣的?
譚待:行業(yè)分布上,早期肯定是偏C端的行業(yè)漲得更快一些,比如互聯(lián)網(wǎng)、零售包括手機(jī)、汽車,然后是教育。我們也看到在企業(yè)B端用量也有很多的,比如有一個(gè)客戶內(nèi)部做了100多個(gè)智能體,每天有幾十億的token消耗?,F(xiàn)在,我們“萬(wàn)億tokens俱樂(lè)部”(累計(jì)tokens使用量超過(guò)了1萬(wàn)億)的企業(yè)有100家,比AWS多一些。
個(gè)人應(yīng)用情況符合“二八定理”,即80%的用戶是個(gè)人,20%是企業(yè)(概數(shù)),但企業(yè)占了tokens調(diào)用的80%、個(gè)人20%。此前云時(shí)代,企業(yè)和個(gè)人用量占比是8.5:1.5,現(xiàn)在AI時(shí)代可能是7.5:2.5,我覺(jué)得未來(lái)可能個(gè)人還會(huì)再高一點(diǎn)。
Q:最近競(jìng)爭(zhēng)對(duì)手在大力做C端,希望短期內(nèi)把token調(diào)用量提升3倍,競(jìng)爭(zhēng)很猛烈,你們?cè)趺磻?yīng)對(duì)?
譚待:競(jìng)爭(zhēng)不關(guān)鍵。首先,增長(zhǎng)3倍和5倍,假設(shè)你是對(duì)的,但是明年市場(chǎng)能漲10倍呢?大家看的就不是存量的競(jìng)爭(zhēng),不是零和博弈,而是一起把這個(gè)市場(chǎng)做大。別的云廠商現(xiàn)在也很重視MaaS,我覺(jué)得挺好。第二,這件事本身的天花板很高,如果對(duì)手投入這么大,能帶來(lái)更多的人、更多的想法,我覺(jué)得特別好,這樣我們就一起把這個(gè)事情做大,加速AI落地社會(huì)的發(fā)展。
Q:AWS判斷,未來(lái)他們MaaS平臺(tái)帶來(lái)的token收入會(huì)跟EC2計(jì)算產(chǎn)品不相上下,EC2目前在AWS盤子里占比30%-40%,你認(rèn)為趨勢(shì)會(huì)是這樣嗎?
譚待:我比較同意這個(gè)趨勢(shì),這里面涉及到云業(yè)務(wù)轉(zhuǎn)型的問(wèn)題。如果我們看芯片的出貨量,兩年前GPU的出貨量就已經(jīng)超過(guò)CPU了。MaaS還有另外一個(gè)邏輯,從GPU的訓(xùn)練轉(zhuǎn)向推理,這還有個(gè)過(guò)程。我們很早就說(shuō)MaaS是非常重要的事情。
Q:整個(gè)云的轉(zhuǎn)型會(huì)面臨很多挑戰(zhàn),怎么解決存量業(yè)務(wù)的轉(zhuǎn)型,如何解決激勵(lì)問(wèn)題?
譚待:首先是戰(zhàn)略問(wèn)題。你所有策略是服務(wù)于戰(zhàn)略目標(biāo)的,戰(zhàn)略取舍還要看長(zhǎng)期、短期。我覺(jué)得主要我們也是繼承了字節(jié)的一貫做法,非??撮L(zhǎng)期。比如,2030年會(huì)發(fā)生什么變化,倒推你能知道什么是重要的,再看看明年做的事情和重要的事情是不是相符。
很可能有的公司知道未來(lái)的變化,但是明年做的事情就不一樣,因?yàn)橛胸?cái)報(bào)壓力、職業(yè)經(jīng)理人有業(yè)績(jī)壓力。我們從大的文化層面鼓勵(lì)大家首先是看長(zhǎng)期,只要把這個(gè)看清楚了,就有很多策略做好這個(gè)事情,比如可以組一些專門的團(tuán)隊(duì),也可以在這部分上給大家激勵(lì)翻倍,投資也是一樣的。
我覺(jué)得現(xiàn)在一個(gè)很重要的點(diǎn),云處于一個(gè)大的變革里面,還是應(yīng)該讓技術(shù)強(qiáng)的人負(fù)責(zé),這是很重要的;如果在平穩(wěn)期可以讓銷售強(qiáng)的人負(fù)責(zé)。
Q:這次發(fā)布AgentKit、多模態(tài)數(shù)據(jù)湖背后的邏輯?
譚待:你看技術(shù)變化要看它的內(nèi)核,以前幾輪大的變化中第一個(gè)是PC互聯(lián)網(wǎng),內(nèi)核是網(wǎng)站,數(shù)據(jù)庫(kù)MySQL等就是那個(gè)時(shí)候起來(lái)的;到了移動(dòng)互聯(lián)網(wǎng),圍繞APP,包括NoSQL云原生數(shù)據(jù)庫(kù)規(guī)模漲了10倍。
現(xiàn)在到了AI時(shí)代,Web和APP都會(huì)在,但是背后很多邏輯會(huì)變成Agent,當(dāng)然也會(huì)有原生的AI Agent出來(lái),你的架構(gòu)設(shè)計(jì)就要圍繞Agent來(lái)看。
就要考慮Agent要有什么樣的runtime、中間件、數(shù)據(jù)湖以及DevOps相關(guān)的東西。Agent帶來(lái)了一些新需求,比如Sandbox(沙箱)、權(quán)限管理等。Agent是按需創(chuàng)造,也跟以前不一樣,傳統(tǒng)應(yīng)用是少數(shù)的表,每個(gè)表特別大,Agent是創(chuàng)建特別多的表,每個(gè)表很小,隨時(shí)創(chuàng)建隨時(shí)刪掉,這些都是開發(fā)范式帶來(lái)的,因?yàn)檫@些開發(fā)邏輯不是人做的,是Agent做的,你需要底層響應(yīng)好這樣的需求。數(shù)據(jù)也是一樣的,Agent處理任務(wù)時(shí),要跟數(shù)據(jù)湖怎么來(lái)打通,我覺(jué)得這是一個(gè)理念思維的變化。
Q:火山引擎被認(rèn)為是字節(jié)技術(shù)能力的外溢,這種外溢對(duì)的影響是怎樣的?
譚待:包括國(guó)內(nèi)阿里,海外AWS、谷歌都是自己能力的外溢,因?yàn)楝F(xiàn)在技術(shù)的投入非常大,如果你原來(lái)不是一個(gè)能夠外溢的業(yè)務(wù),你很難在云計(jì)算上保持足夠的領(lǐng)先,包括微軟是OS的外溢,Oracle有傳統(tǒng)數(shù)據(jù)庫(kù)的能力,大致都是這樣的邏輯。
云這個(gè)事情,也需要有一個(gè)時(shí)間點(diǎn)。比如我們最開始外溢的是一些工具,大家想要的就是抖音同款,這個(gè)外溢最容易,應(yīng)該是2020年我剛加入字節(jié)時(shí)就在做的事情。第二個(gè)外溢是我們的規(guī)模優(yōu)勢(shì),我們發(fā)現(xiàn)抖音的服務(wù)器中國(guó)最多,把這些外溢出來(lái)不就可以打造很便宜的云嗎?彈性好、成本低就可以進(jìn)入到云市場(chǎng),2021年我們正式做了云服務(wù)。
字節(jié)在AI上一直非常堅(jiān)持,從成立就做推薦算法,這就是AI的一種表現(xiàn)形式;視頻影像創(chuàng)作、視頻分發(fā)都是。2022年我們就確定了AI是我們很重要的方向。AI也不是一蹴而就的,首先解決訓(xùn)練的問(wèn)題,2023年基本上所有的AI創(chuàng)業(yè)公司都在火山引擎上做模型訓(xùn)練,訓(xùn)練完了再干應(yīng)用,應(yīng)用才能發(fā)揮更大的價(jià)值,所以我們應(yīng)該是2023年下半年第一次推出了火山方舟(MaaS 大模型服務(wù)平臺(tái)),2024年年中推出了豆包大模型。
我覺(jué)得一個(gè)很重要的事,是你自己要做過(guò),我們做過(guò)豆包,豆包的產(chǎn)品也是用的火山方舟,我們內(nèi)外是一體的,這里面的坑我們都踩了非常多遍,這樣抽象出來(lái)變成產(chǎn)品對(duì)外是一種優(yōu)勢(shì)。
Q:可以看到阿里最近各個(gè)業(yè)務(wù)加大2C,大家都在加大2C和2B,邏輯是什么?
譚待:我們以前講大數(shù)據(jù),C端很難體驗(yàn)到背后的東西,但是模型是C端、B端都可以很容易體驗(yàn)到,我覺(jué)得大模型其實(shí)2C、2B之間會(huì)有一個(gè)很好的協(xié)同。
同時(shí),模型讓個(gè)體的能力變得更強(qiáng),以前大家覺(jué)得2B軟件特別難用,因?yàn)樗嗫紤]的是流程設(shè)計(jì)的好不好;但到了大模型時(shí)代,這些東西可能通過(guò)Agent一句話就完成了,所以一個(gè)人能做一個(gè)團(tuán)隊(duì)的事情,這個(gè)時(shí)候個(gè)體的體驗(yàn)就很關(guān)鍵。反過(guò)來(lái),我覺(jué)得這是字節(jié)一個(gè)很大的優(yōu)勢(shì),因?yàn)槲覀兪潜容^會(huì)把體驗(yàn)做好的。
Q:今年7月的報(bào)告稱企業(yè)用AI工具產(chǎn)生的實(shí)際生產(chǎn)力在行業(yè)之間的分化有很大差距,傳統(tǒng)行業(yè)相對(duì)落后一點(diǎn),ROI不高,你們?cè)诳蛻敉卣股鲜欠窨吹竭^(guò)類似的gap,這怎樣影響你們?cè)谑袌?chǎng)上的重點(diǎn)?
譚待:取決于你怎么看這個(gè)事情,有的行業(yè)起量特別快,但是天花板低;有的行業(yè)是起量特別慢,但是天花板很高。比如說(shuō)最早模型肯定是在陪伴聊天起量很快,但是聊天天花板不高。我自己覺(jué)得模型最大的價(jià)值以后肯定不是說(shuō)幫人去寫點(diǎn)打油詩(shī),生產(chǎn)一些合成的照片。我覺(jué)得模型最大的價(jià)值肯定還是更好的幫人成長(zhǎng),教育、醫(yī)療,做新的科研,這些天花板都是非常好的,tokens用量也是非常大的。
Q:想問(wèn)問(wèn)在手機(jī)軟件方面,包括汽車,您認(rèn)為要增強(qiáng)哪些創(chuàng)新?
譚待:我說(shuō)說(shuō)汽車,搭載大模型之后,用人對(duì)話的方式就能理解。你說(shuō)冷了,就幫你調(diào)溫度;你說(shuō)打開天窗,它就知道打開遮陽(yáng)板而不是天窗。你突然想聽一首歌,只記得歌詞,就能把它放出來(lái)了。甚至以后可以直接在車上點(diǎn)餐。新人一般要幫團(tuán)隊(duì)點(diǎn)咖啡,有的要糖有的不要特別復(fù)雜,自己操作半小時(shí)過(guò)去了,現(xiàn)在一兩句話就幫你做了,以后這個(gè)能力可以平移到車上,你開到哪提前說(shuō)在公司樓下給我把咖啡點(diǎn)了,停完車去拿就好了。
這種交互就是自然的以agent的方式,就像人跟它交互一樣,這個(gè)在手機(jī)上、在車上,在各種各樣的終端上,我覺(jué)得未來(lái)都會(huì)是這樣一個(gè)體驗(yàn),我感覺(jué)是有非常大的智能空間的。
Q:12月18日ChatGPT發(fā)布了Agent商店,你是否認(rèn)為2026年是Agent的大爆發(fā)之年?
譚待:如果看中國(guó)市場(chǎng),今年算是Agent元年。不知道你說(shuō)的大爆發(fā)是多大,明年肯定會(huì)有很多更有價(jià)值的Agent涌現(xiàn),比如AI幫你寫PPT,明年可能非常好;AI做短劇、漫劇明年品質(zhì)會(huì)有很大提升。以后營(yíng)銷素材,會(huì)根據(jù)用戶畫像生成他喜歡的素材。
從這些角度,我覺(jué)得會(huì)帶來(lái)非常多的爆發(fā)。我們的一個(gè)客戶,2024年有50多個(gè)Agent,2025年增長(zhǎng)到200多個(gè),明年肯定會(huì)更多。這么多Agent就要管理好,要協(xié)同,還要做運(yùn)營(yíng)的事情。我們也是按這個(gè)邏輯把模型MaaS、Agent開發(fā)和Agent運(yùn)營(yíng)相關(guān)的產(chǎn)品服務(wù)搞好。
快報(bào)
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論