百度創(chuàng)始人 李彥宏,圖片來自百度官方
“百度還在支棱著。”
這是一位開發(fā)者在Create2025百度AI開發(fā)者大會現(xiàn)場的感嘆。
畢竟,李彥宏還在不遺余力地在臺前為AI布道。他始終對外展示出一副訓練有素的姿態(tài),就像一個持續(xù)穩(wěn)定輸出的AI。
Create大會是百度一年一度面向開發(fā)者群體的技術(shù)發(fā)布和交流大會。4?25日, Create2025百度AI開發(fā)者大會如期舉行,百度創(chuàng)始人李彥宏發(fā)表了題為《模型的世界 應(yīng)用的天下》的演講。
60分鐘的演講中,李彥宏發(fā)布了兩大模型,多款A(yù)I應(yīng)用,并宣布將幫助開發(fā)者全面擁抱MCP。
過去一年,一面是大模型廠商卷死卷生,另一面是開發(fā)者無所適從,不敢放心大膽做應(yīng)用,生怕一不留神,重投入的應(yīng)用,就被新出現(xiàn)的應(yīng)用取代,當然,事實也是如此。
李彥宏對開發(fā)者說,“只要找對場景,選對基礎(chǔ)模型,有時候還要學一點調(diào)模型的方法,在此基礎(chǔ)上做出來的應(yīng)用是不會過時的”“沒有應(yīng)用芯片、模型都沒有價值。模型會有很多,但未來真正統(tǒng)治這個世界的是應(yīng)用,應(yīng)用才是王者。”
在基礎(chǔ)模型側(cè),李彥宏還發(fā)布了文心大模型4.5 Turbo和深度思考模型X1 Turbo。相比文心4.5,文心大模型4.5 Turbo速度更快,價格下降80%。文心大模型X1 Turbo相比文心X1,性能提升的同時,價格再降50%。
一同發(fā)布的,還有高說服力數(shù)字人、通用超級智能體心響APP、內(nèi)容操作系統(tǒng)滄舟OS等AI應(yīng)用,覆蓋AI數(shù)字人、代碼智能體、多智能體協(xié)作等熱門賽道。
值得關(guān)注的是,在“AI+”的細分行業(yè)上,百度這一次似乎更看好電商賽道。除了發(fā)布基于電商直播場景的高說服力數(shù)字人之外,百度發(fā)布了首個電商交易MCP,搜索MCP等MCP Server,供開發(fā)者調(diào)用。
MCP(Model Context Protocol,模型上下文協(xié)議)是最近AI行業(yè)的熱詞,由Claude公司母公司Anthropic于去年11月提出并開源,獲得了獲OpenAI、谷歌等公司支持。
作為AI領(lǐng)域的標準化接口協(xié)議,正在重構(gòu)行業(yè)生態(tài),其核心目標是解決大模型與外部工具交互的標準化問題,推動AI應(yīng)用從實驗室走向產(chǎn)業(yè)級落地。
李彥宏表示,百度將幫助開發(fā)者全面擁抱MCP,并現(xiàn)場演示了千帆、搜索、電商、網(wǎng)盤等產(chǎn)品接入MCP的案例。
當天的One More Thing環(huán)節(jié),百度正式點亮了國內(nèi)首個全自研的三萬卡集群,李彥宏表示,它可以同時承載多個千億參數(shù)大模型的全量訓練,支持1000個客戶同時做百億參數(shù)的大模型精調(diào)。
大家好!歡迎參加Create 2025百度AI開發(fā)者大會!Create是我們一年一度面向開發(fā)者群體的技術(shù)發(fā)布和交流大會。今天AI的發(fā)展日新月異,新技術(shù)層出不窮,令人眼花繚亂,甚至不知所措,這個時候面對面的交流和溝通,思想的碰撞,成果的展示,比以往任何時候都更加重要。
這是我們首次來到武漢舉辦Create大會。這里開放包容、高校云集、活力涌動、場景眾多。我相信,隨著無代碼開發(fā)時代的到來,武漢也將成為“開發(fā)者之城”。
過去一年,我們看到模型發(fā)布越來越頻繁,DeepSeek橫空出世,MCP逐漸被接受為行業(yè)標準,代碼智能體和通用智能體等多智能體協(xié)作產(chǎn)品被廣為關(guān)注。越來越多人加入開發(fā)者隊伍,我看到開源中國社區(qū)一年新增的開發(fā)者數(shù)量就超過了150萬。另一方面,也有不少開發(fā)者充滿焦慮,模型迭代這么快,能力越來越強,我基于大模型開發(fā)的應(yīng)用會不會很快就過時,沒價值了?
這種擔心不無道理。大模型世界風云變幻,幾乎周周有發(fā)布,天天有更新。去年第四季度有49個大模型更新發(fā)布。2025年速度進一步加快,第一季度就有55個發(fā)布,最多的時候一周有8個模型。一邊是大模型廠商卷死卷生,另一邊是開發(fā)者無所適從,不敢放心大膽做應(yīng)用。為什么?就是擔心應(yīng)用被模型的迭代給快速覆蓋掉,自己白費功夫。
但我想跟大家說,這其實是個雙刃劍,一方面開發(fā)者確實要理解技術(shù)發(fā)展的趨勢,避開大模型自身發(fā)展的延長線;另一方面,這么多模型,日益強大的模型能力,其實是為我們提供了更多的選擇,打開了更多的可能性,你只要找對場景,選對基礎(chǔ)模型,有時候還要學一點調(diào)模型的方法,在此基礎(chǔ)上做出來的應(yīng)用是不會過時的。
應(yīng)用才是真正創(chuàng)造價值的,沒有應(yīng)用,芯片、模型都沒有價值。我們這次大會的主題:模型的世界,應(yīng)用的天下,就是說模型會有很多,但未來真正統(tǒng)治這個世界的是應(yīng)用,應(yīng)用才是王者。
比如,在交通領(lǐng)域,高速公路上會發(fā)生各種各樣的安全事件。既有異常停車、行人闖入這樣的常發(fā)事件,也有火災(zāi)煙霧、物品拋灑這種長尾事件。這些安全事件的檢測,都是部署在高速路側(cè)的邊緣系統(tǒng)中的小模型完成的。但它們的識別準確率沒那么高,時不時會出現(xiàn)一些狀況。比如沒能識別出大貨車拋灑下來的危險物品,把視頻中的光斑、陰影識別成了拋灑物,漏報、誤報,或者重復(fù)報。而誤報太多,預(yù)警的作用就沒有了。
有了大模型之后,部署在云端的大模型,可以對小模型檢測過的視頻片段進行秒級校驗,對于常發(fā)事件,大模型可以將檢測準確率提升到95%以上;對于長尾事件,檢測準確率也能提高到90%。監(jiān)控人員介入處置的工作量降低了50%。
隨著模型能力的增強,這種大模型和應(yīng)用場景結(jié)合的機會將越來越多,這些AI應(yīng)用不但不會被模型能力所覆蓋,反倒能夠滲透到更多的場景,從而價值變得更高。這種能夠帶來實在價值的應(yīng)用,是屬于開發(fā)者的真機會。這樣的機會,在千行百業(yè)里,比比皆是,遍地是黃金。
DeepSeek發(fā)布以后,我們第一時間在百度智能云的千帆平臺上做了部署,向數(shù)以萬計的開發(fā)者提供免費的調(diào)用機會。百度的各個業(yè)務(wù)線也都積極擁抱,文小言、百度搜索、百度地圖等都接入了DeepSeek滿血版,在很多內(nèi)外部應(yīng)用場景都產(chǎn)生了非常不錯的效果。今天下午的分論壇就有一個專門討論DeepSeek的,我們會在那里跟大家分享利用DeepSeek開發(fā)AI應(yīng)用的各種經(jīng)驗。
當然DeepSeek也不是萬能的。比如它只能處理文本,還不能理解和生成圖片、音頻、視頻等多媒體內(nèi)容,而我們的很多百度智能云客戶,都需要這種多模理解和生成能力;比如它幻覺率比較高,在很多場合不能放心使用,如果在電商直播中幻覺出來一個買一送一的優(yōu)惠,那商家就要賠慘了。當然它更大的問題是慢和貴,中國市場上絕大多數(shù)的大模型API調(diào)用價格都比DeepSeek滿血版要低,速度要更快,而今天我們要隆重發(fā)布的文心大模型的4.5 Turbo和X1 Turbo就是要解決這些問題的。
今年的3月16日,在文心一言發(fā)布兩周年之際,我們發(fā)布了文心大模型4.5和文心大模型X1。文心大模型4.5是百度首個原生多模態(tài)大模型,實現(xiàn)了在同一個模型里對文本、語音、圖片、視頻的一體化理解。在多項測試中表現(xiàn)優(yōu)于GPT4.5,而API調(diào)用價格僅為GPT4.5的1%;文心大模型X1作為深度思考模型,性能對標DeepSeek-R1,而調(diào)用價格只有R1的一半。
今天,我們正式發(fā)布文心大模型4.5 Turbo和文心大模型X1 Turbo。主打三大特性:多模態(tài)、強推理、低成本。
多模態(tài)是未來基礎(chǔ)模型的標配,純文本模型的市場會越變越小,多模態(tài)模型的市場會越來越大。至于說新模型的價格有多低?這里先賣個關(guān)子,稍后揭曉答案。我們先來看看,文心4.5 Turbo在圖片和視頻理解方面的表現(xiàn)。
我們給文心4.5 Turbo這樣一張照片,照片很模糊,大致能看出,是兩個人在爭搶一個球。現(xiàn)場朋友們,有人知道這是哪場比賽嗎?我們也問了一些其他的大模型,有的把這個足球識別成了橄欖球,把圖片中的廣告牌,識別成了職業(yè)橄欖球聯(lián)盟比賽的畫面,得出結(jié)論“這是1981年的超級碗比賽片段”,但這是錯的。
我們再來問問文心4.5 Turbo:“這是哪場比賽?”可以看到,在畫質(zhì)非常低、信息量很少的情況下,通過賽場廣告牌和球員動作等元素,文心4.5Turbo準確判斷出,這是1986年阿根廷對陣英格蘭的世界杯足球賽。而且點出了那場比賽最著名的事件——馬拉多納的“上帝之手”。
我們再來看一個視頻理解的例子。在這個視頻中,有三個物體在水槽中游動,看起來像是在展示一種科學原理。我們把這個視頻上傳給文心4.5Turbo,看看它怎么說?
答案出來了,它準確理解了這是一個水槽實驗,其中紅色的水滴形浮體比另外兩塊浮體更快到達了終點,并給出近一步說明,這可以用“流體動力學中的形狀阻力原理來解釋”,因為流線形物體能夠減少渦流,降低了阻力,所以跑得更快。
文心4.5 Turbo不僅在多模態(tài)理解能力上有著明顯進步,在去幻覺、邏輯推理和代碼能力上也都有著整體增強。
文心大模型X1 Turbo是基于文心4.5 Turbo的深度思考模型。上個月X1發(fā)布后,受到了用戶的廣泛青睞。而X1 Turbo具備更先進的思維鏈,深度思考能力更強,擅長文學創(chuàng)作、邏輯推理等,進一步增強了多模態(tài)能力。更重要的是,它還能夠調(diào)用不同工具,我們來看下。
最近武漢有個很有名的吉祥物叫“蒜鳥”,我們用它來考考新的文心X1 Turbo。“聽說武漢有種東西叫蒜鳥,請你把它畫出來”它思考后,自動選擇了聯(lián)網(wǎng)搜索、圖片生成兩個工具。
首先,通過聯(lián)網(wǎng)查找“蒜鳥”相關(guān)信息,我們了解到這是一個諧音梗,從武漢方言“算了”演變成吉祥物,被稱為武漢的和平鳥。文心X1 Turbo在思考時,認為在圖像中加入長江大橋、黃鶴樓這些武漢元素會更有代表性。然后,它調(diào)用AI繪圖工具,畫出了這樣一只頭頂綠色大蒜的“蒜鳥”。我們也嘗試了用其他模型來畫,但生成出來的都只是一張普通小鳥的圖片。
我們再讓它“寫一份蒜鳥應(yīng)聘武漢熱干面代言人的簡歷,以word形式發(fā)給我。”通過聯(lián)網(wǎng)搜索工具,文心X1 Turbo收集到了關(guān)于“蒜鳥”的詳細信息,構(gòu)思出背景、特點、文化意義、代言人優(yōu)勢等內(nèi)容,生成了一份簡歷,再調(diào)用代碼解釋器,把這份簡歷做成了word文件,方便做二次編輯。
上面這個簡單的案例,只是X1 Turbo能力的一個小切口。體現(xiàn)了它的深度思考和多工具調(diào)用能力。好,現(xiàn)在是謎底揭曉的時刻了!
文心大模型4.5 Turbo每百萬token 輸入價格僅為0.8元,輸出價格3.2元!相比文心4.5,速度更快,價格下降80%。
文心大模型X1 Turbo每百萬token輸入價格1元,輸出價格4元,相比文心X1,性能提升的同時,價格再降50%。
為什么我們要不斷把大模型的成本降下來?因為開發(fā)者做AI應(yīng)用的一個很大阻礙就是成本高,用不起。而創(chuàng)新的本質(zhì)往往就是成本下降。成本降低后,開發(fā)者和創(chuàng)業(yè)者們才可以放心大膽地做開發(fā),企業(yè)才能夠低成本地部署大模型,最終推動各行各業(yè)應(yīng)用的爆發(fā)。
有了這樣超級能干的基礎(chǔ)模型,我們就可以打造出超級有用、超級有趣的AI應(yīng)用來。2025年最令人激動的突破性應(yīng)用之一,就是AI數(shù)字人。下面,我就給大家介紹一種高說服力數(shù)字人,簡單來說,就是聲形超擬真、內(nèi)容更專業(yè)、互動更靈活,實現(xiàn)了數(shù)字人超越真人的體驗,在電商直播、游戲、消費等領(lǐng)域,有著巨大的想象空間。
現(xiàn)在市場上常見的數(shù)字人,文案枯燥、動作少、機器音重,我們先來看一下。這樣的數(shù)字人直播,其實效果也不算差,但看久了就審美疲勞。我們再來看這段。
如果看到這段直播,你能分清她是真人還是數(shù)字人嗎?為什么數(shù)字人能做到這么真,甚至表現(xiàn)力超越真人?這要歸功于一個關(guān)鍵能力,叫做“劇本生成”。
高說服力數(shù)字人的背后,是由內(nèi)容豐富的多模劇本驅(qū)動的。剛才屏幕右邊,就同步展示了一個完整的劇本。不止有臺詞,還有表情、語氣、動作,它們會匹配臺詞內(nèi)容實時調(diào)整,情緒轉(zhuǎn)折和動作切換都很順暢,表現(xiàn)“超擬真”。
那一個真實的直播間,除了主播,往往還有助播、場控、運營等四五個角色給打配合。在數(shù)字人直播間里,能不能做到呢?
可以看到,有一個AI大腦會根據(jù)直播間的實時熱度和轉(zhuǎn)化情況,靈活調(diào)度各類角色。比如,直播間人氣高,大家下單熱情高,AI大腦就會把助播調(diào)動起來,促進轉(zhuǎn)化。在產(chǎn)品介紹和領(lǐng)取福利環(huán)節(jié),AI大腦也可以適時切換鏡頭畫面、插入小卡片、福袋等素材。真正實現(xiàn)了一個人就是一支營銷團隊。
今天的電商直播已經(jīng)是一個非常主流的交易形態(tài),也涌現(xiàn)出了一批賺了大錢的主播。他們的能力可不可以被數(shù)字人復(fù)制?為了讓更多人都能有一個專屬數(shù)字人,并且靠數(shù)字人直播變現(xiàn),我們推出了“一鍵克隆”功能。你只需要錄制一條最短2分鐘的直播視頻,傳到百度慧播星平臺上做基礎(chǔ)訓練,就可以反復(fù)使用這個數(shù)字人進行直播了,可謂是“人人都能做主播”。
高說服力數(shù)字人,是多模態(tài)大模型的一個典型應(yīng)用。而開發(fā)者面對的多數(shù)情況,往往是一個應(yīng)用需要組合使用多個模型。模型的組合使用,聽起來簡單,但要想做得好、體驗好、有用戶買單,還是很難的。
百度文庫在這方面收獲了廣泛的認可。文庫的AI功能付費用戶已經(jīng)超過4000萬,月活達到了9700萬,成為了真正的“超級生產(chǎn)力"。
而文庫和網(wǎng)盤共同打造的自由畫布,就是一個多模型組合使用的極致例子。自由畫布可以處理幾乎所有的常見模態(tài)和文件類型,我們可以從網(wǎng)盤中拖入各種格式的素材,有Word、PDF、圖片、音頻、視頻等等。
比如,我們想研究下《長江禁漁對江豚種群的影響》,就可以使用這些素材,也可以直接粘貼網(wǎng)頁鏈接,或是通過AI搜索來補充最新的內(nèi)容。它還支持圖生圖,比如選中一張江豚的實拍圖,讓它改為可愛漫畫風。
接著,我們可以指定每種素材的使用方法,比如,在這篇江豚生存境況的文稿中選取一段,明確要求用這里面的數(shù)據(jù);然后,圈選一篇禁漁政策效果分析的論文,指定參考其中的主要觀點。
做好這些備注后,把這些素材一鍵全選,輸入需要的主題,就可以要求它生成各種類型的內(nèi)容了。比如中等篇幅的長文,比如PPT或者是繪本。特別是適合孩子觀看的視頻化繪本,還用上了剛剛生成的卡通小江豚形象。
自由畫布對各類素材強大的處理能力,正是多個模型組合使用的結(jié)果。這里有基于文心精調(diào)的模型來理解用戶意圖,有多模態(tài)模型處理音視頻素材,還有不同的專有模型和行業(yè)模型,用于提取文檔和網(wǎng)頁鏈接內(nèi)容、處理角色形象、生成不同格式的新內(nèi)容等。
這套能力,已經(jīng)沉淀為一個完整的技術(shù)底座——滄舟OS。這是一個為內(nèi)容而生的操作系統(tǒng),它包括了兩大核心:
第一個是Chatfile Plus,它要對不同模態(tài)、不同形態(tài)、不同格式的內(nèi)容,做解析和向量化處理,把它們變成一種大模型能聽懂的向量化Token,然后再進行混合生成。第二個是建立了三庫和三器:三庫,就是公域知識庫、私域知識庫、記憶庫;三器,是編輯器、閱讀器、播放器,它們可以根據(jù)用戶的需求被大模型組合調(diào)用。
有了這樣一個扎實的技術(shù)底座,它上層的交互界面就不再局限于畫布的形態(tài),我們近期就利用這套底座上線了一個非常實用的功能,AI筆記。
我們相信,有了這套技術(shù)底座,文庫和網(wǎng)盤還會不斷推出更多更好用的AI功能,成為每個人都愛不釋手的超級生產(chǎn)力工具。
剛才我介紹了幾個多模態(tài)理解和生成方面的應(yīng)用。下面,我還想給大家再看看另外一個視覺大模型的典型應(yīng)用,無人駕駛。就在我們Create大會的會場周邊,包括武漢的大部分區(qū)域,有許多輛蘿卜快跑正為人們提供著安全、舒適與便利的服務(wù)。事實上,無人駕駛比有人駕駛更安全的理念正在被越來越多的人意識到。全世界各個國家、城市都會逐步接受這一新鮮事物,我們也將在全球持續(xù)擴大規(guī)模。相信在不久的將來,不同城市、不同國家、不同種族都將享受無人駕駛的便利。
大概一年前,別人問我最看好的AI應(yīng)用方向是什么,我說是智能體。那時,這還是個非共識的認知。僅僅一年不到,智能體就已經(jīng)成為了AI應(yīng)用的代名詞。
代碼智能體Coding Agent, 是最近半年AI應(yīng)用進展最快、最火的賽道。陸續(xù)涌現(xiàn)了cursor、devin、lovable等一系列編碼智能體,既有輔助代碼生成工具,也有無代碼編程工具。未來每個公司都需要依賴代碼智能體來完成任務(wù)。如果還像原來那樣吭哧吭哧一行一行地寫代碼,是沒有贏的可能性的。
百度的工程師普遍使用文心快碼Comate這樣的輔助代碼生成工具,非技術(shù)人員則會使用秒噠這樣的無代碼編程工具。去年11月的百度世界大會上,我們發(fā)布了秒噠,它擁有無代碼編程、多智能體協(xié)作、多工具調(diào)用三大特性。今年3月,秒噠向全社會開放,任何人都可以通過秒噠,一句話生成應(yīng)用。
比如,一個父親提出來想做個拼圖小游戲,既有經(jīng)典的動物、交通工具、字母類圖片主題,也可以有不同難度的進階。另外,他還希望游戲允許上傳本地圖片,做成個性化拼圖,拼圖完成后,還能夠顯示圖片的知識卡片,寓教于樂。
我們看秒噠接到需求后,陸續(xù)調(diào)度了策劃師、研發(fā)工程師、素材設(shè)計師等多個角色智能體。
很快,游戲就生成好了,可以選擇不同的圖片主題,比如火車、寵物等等,還能選擇2乘2到4乘4的不同難度。拼圖成功后,會顯示出一個“太棒了”的鼓勵頁,還是挺有意思的,很適合小朋友。如果有自己喜歡的圖片,也可以選擇本地上傳,做成個性化拼圖。
這位父親給我們留言說,秒噠幫了他大忙,以前經(jīng)常不知道陪孩子干點兒什么,這個拼圖游戲讓他們度過了一個快樂的中午。有興趣的朋友也可以掃碼體驗一下。
我們再來看一個秒噠幫助大學生創(chuàng)業(yè)者做好營銷工具的例子。一個大學生創(chuàng)業(yè)團隊發(fā)現(xiàn)了在校園內(nèi)賣夜宵的商機。需要做出一個購買和配送功能一體化的系統(tǒng),原本的開發(fā)時間要1周多;而使用秒噠,不需要任何開發(fā)團隊,幾分鐘就可以搞定。
他們先上傳了一份需求文檔,涵蓋了對于頁面的各類需求,這里還要求系統(tǒng)具備地圖導航和客服咨詢的功能??梢钥吹剑雵}先調(diào)用了產(chǎn)品經(jīng)理的智能體,理清了首屏內(nèi)容、上屏展示、預(yù)約訂餐這些模塊的開發(fā)需求,還給出了設(shè)計建議。和剛才一樣,接著秒噠就開始陸續(xù)調(diào)用架構(gòu)師、素材設(shè)計師、測試工程師等多個智能體開發(fā)應(yīng)用。
在這個過程中,秒噠先后調(diào)用了智能云的存儲、數(shù)據(jù)庫功能,和手機驗證碼、地圖導航、智能客服等工具組件,實現(xiàn)了制作留資表單、一鍵導航到店、管理后臺數(shù)據(jù)等能力,生成的應(yīng)用可以直接在手機上使用。
這個創(chuàng)業(yè)團隊把二維碼分享到社群推廣后,還可以在后臺時刻關(guān)注營銷轉(zhuǎn)化的進展情況。就這樣,僅用5塊錢左右的模型調(diào)用費,和幾分鐘的時間,這個團隊就搞出了一個營銷工具。
有了秒噠,一個陜西的果農(nóng),做了一個能賣蘋果、自動算賬的應(yīng)用;一位退休師傅,創(chuàng)建了一個可以進行車位、訪客和維修登記的居民服務(wù)應(yīng)用;一個蘇州的繡娘工作室,搭建了蘇繡AI博物館,讓更多人看到這種傳統(tǒng)技藝。
全球只有不到3000萬程序員,有80億人,當技術(shù)的門檻逐漸消失,每個人都可以具備程序員的能力,無論你是大學生、農(nóng)民還是手藝人,只要有想法,秒噠就能讓你夢想成真!
多智能體協(xié)作是一個非常有價值的AI應(yīng)用方向。未來的AI應(yīng)用,不只可以回答問題,還要能完成任務(wù)。而任何一個復(fù)雜任務(wù)的交付,都需要多智能體協(xié)作來解析需求、分拆任務(wù)、調(diào)度資源、規(guī)劃執(zhí)行,最終交付結(jié)果。
AI應(yīng)用井噴的時代就在眼前,它們可能是智能體,也可能是H5、小程序或者獨立App。那怎么才能快速找到它們呢?
答案就在百度搜索開放平臺的AI開放計劃!在新的時代,百度搜索將敞開大門,擁抱每個不同形態(tài)的AI應(yīng)用,建立多樣的內(nèi)容和服務(wù)分發(fā)機制,不僅為用戶提供最新最全的AI服務(wù),更為開發(fā)者提供流量和收益。
比如在搜索框內(nèi)輸入『3D家裝設(shè)計』,首條結(jié)果就會出現(xiàn)生境科技的『家裝設(shè)計』AI應(yīng)用卡,選擇『定制專屬方案』,上傳房間照片、選擇房間類型和風格偏好,就可以一鍵生成效果圖了。
目前,已經(jīng)有AI面試助手、專業(yè)醫(yī)學咨詢、視覺內(nèi)容制作等各個領(lǐng)域的一批應(yīng)用率先接入了百度搜索開放平臺,我們也誠摯邀請更多的應(yīng)用開發(fā)者們參與進來,早接入,早獲益!
與此同時,百度搜索也將全面索引市場上的各類MCP server,為開發(fā)者提供最全的開發(fā)工具。MCP很火,那它為什么這么重要呢?
AI應(yīng)用大爆發(fā)的時代,開發(fā)者們普遍遇到了一系列難題:比如,使用工具缺少統(tǒng)一規(guī)范,開發(fā)效率不高;需要反復(fù)適配各類平臺,耗時耗力;開源社區(qū)的工具和組件良莠不齊,整合維護難度大。
MCP,也就是模型上下文協(xié)議,提供了全新的解決思路。它就像給AI裝上了“萬能插座”,開發(fā)者不再需要為每個工具編寫定制化的代碼,只要按照MCP標準,編寫一次接口就好,極大降低了開發(fā)的負擔。總的來說,MCP讓AI更懂外部世界,更容易獲得信息,更自由地調(diào)用工具,是AI發(fā)展的一大步,你應(yīng)該盡早的了解它。
開發(fā)者要擁抱MCP有兩種路徑,一是把自己的資源、數(shù)據(jù)、能力通過MCP的形式提供出來,讓更多的AI應(yīng)用來使用;一是自己在開發(fā)AI應(yīng)用的時候充分利用已有的MCP Server資源,這樣既減少了開發(fā)量,又大幅提升能力。隨著MCP生態(tài)的日益繁榮,無論是國外的Anthropic, OpenAI, Google,還是國內(nèi)的阿里、字節(jié)、騰訊,都在積極擁抱MCP。
百度會幫助開發(fā)者積極全面地擁抱MCP。
我們優(yōu)化了文心基礎(chǔ)大模型,提升了模型在使用MCP server時的任務(wù)規(guī)劃和調(diào)度能力。
百度智能云的千帆平臺率先全面兼容了MCP,不僅提供大量的第三方server,也支持開發(fā)者創(chuàng)建和發(fā)布自己的MCP server。
百度搜索構(gòu)建了MCP server的發(fā)現(xiàn)平臺,可以索引全網(wǎng)市場上優(yōu)質(zhì)的server
百度的文心快碼Comate,是國內(nèi)首個支持MCP server的智能編碼助手。
百度的商品檢索、商品交易、商品詳情、商品參數(shù)對比、商品排行榜能力等等也已經(jīng)通過百度電商的MCP server對外提供,這是國內(nèi)首家支持電商交易的MCP服務(wù)。
我們的地圖、文庫、網(wǎng)盤等應(yīng)用,也在通過MCP server的方式,把越來越多的能力逐步開放出來。
當然,最重要的是,文心大模型使用的聯(lián)網(wǎng)搜索工具也變身為百度搜索MCP server供開發(fā)者調(diào)用,依托百度25年的技術(shù)積累,這是目前世界上最好的搜索MCP。
我們來看一個三星手機接入百度文庫網(wǎng)盤MCP server的例子。三星手機正在接入百度文庫網(wǎng)盤的文件上傳、下載、檢索、分享和內(nèi)容理解等多個MCP server。
一方面,用戶在手機的語音助手界面,通過說話方式,就可以直接實現(xiàn)文件的上傳網(wǎng)盤備份、云上分享、文檔摘要總結(jié)和內(nèi)容問答等功能。
另一方面,這些Server還能夠豐富三星手機系統(tǒng)的云存儲能力,解決手機自身對大文件、多文件難以批量備份和分享的問題。比如用戶在手機相冊里,喚起語音助手說:“把昨天在奧森拍的照片備份至百度網(wǎng)盤,并把小明的照片發(fā)送給他”。
相關(guān)照片就會被上傳到用戶授權(quán)的網(wǎng)盤賬號內(nèi),并生成分享鏈接,手機助手再調(diào)用通訊錄,把鏈接通過短信方式發(fā)到對方手機上,點擊鏈接就能夠直接進入百度網(wǎng)盤進行查看或轉(zhuǎn)存了。
文庫網(wǎng)盤的這些能力都被大量用戶驗證過,我們希望把它們封裝好,通過MCP Server的形式開放出來,供更多開發(fā)者使用。
我們再來看一個通過千帆平臺把智能體和搜索、電商MCP server相結(jié)合的例子。用戶的需求是“想考清華大學計算機方向的研究生,要買幾本專業(yè)書籍學習”。以前的智能體只能泛泛的列出些看似相關(guān)的書名,無法給出具體的推薦建議,更沒法幫助用戶實現(xiàn)選品和交易。那現(xiàn)在有了MCP,怎么就不一樣了呢?
我們打開千帆平臺,對原有的萬能助手智能體進行編輯,添加百度AI搜索和百度優(yōu)選的MCP Server,點擊發(fā)布,智能體的能力就更新完成了??聪滦ЧN覀兡脛偛诺男枨髥栠@個智能體,它會首先進行深度思考,接著調(diào)用百度AI搜索的MCP Server,給出推薦書籍的清單,并且列出了作者、出版社和書籍特點等商品詳情。
用戶看過書籍清單后,確定要第一本,希望找個靠譜劃算的店鋪下單。智能體就又調(diào)用百度優(yōu)選的MCP Server,獲取了不同店鋪的評分信息和商品價格,給出了最終購買建議。用戶確認后,就可以直接生成訂單,完成交易了。
這就是國內(nèi)首個支持電商交易的MCP服務(wù)與最好的搜索MCP相結(jié)合的成果。當然,千帆平臺上已經(jīng)接入的MCP服務(wù)遠不止這些。
現(xiàn)在基于MCP開發(fā)智能體,就像2010年開發(fā)移動APP。百度將持續(xù)加大對MCP的支持,推動更多應(yīng)用和服務(wù)接口兼容MCP,不斷賦能開發(fā)者創(chuàng)新,共建繁榮的MCP生態(tài)。今天下午的MCP分論壇會提供更多了解和掌握MCP的機會,希望大家踴躍參加。
百度一直為開發(fā)者提供模型、開發(fā)工具,以及資金資源等多方面的支持。兩年前,我們啟動了“文心杯”創(chuàng)業(yè)大賽,就是希望推動大模型生態(tài)繁榮,幫助創(chuàng)業(yè)者、開發(fā)者開發(fā)各種AI應(yīng)用。
兩屆“文心杯”創(chuàng)業(yè)大賽,我們收到了來自全球2500余支創(chuàng)業(yè)團隊的報名,為優(yōu)勝的隊伍提供了超過2億元的資金支持,并在技術(shù)、團隊和資源上持續(xù)給予全方位扶持。
可以說,文心杯已成為中國AI創(chuàng)投圈,最重磅的賽事和最知名的品牌之一。獲獎團隊大多成為了百度重要的生態(tài)伙伴,近半數(shù)獲獎團隊也已經(jīng)拿到了下一輪融資,獲得了很好的發(fā)展。
現(xiàn)在我宣布,第三屆“文心杯”創(chuàng)業(yè)大賽正式啟動!我們將進一步加大對創(chuàng)業(yè)者的支持力度,單一項目的獲獎金額將翻倍。特別大獎的投資額最高可達7000萬人民幣!非常期待可以有更多的開發(fā)者和創(chuàng)業(yè)團隊與我們同行,打造更多更好的AI應(yīng)用!
當然,正如大家都感受到的,外部環(huán)境充滿不確定性,經(jīng)濟形勢也面臨不小的挑戰(zhàn),這同樣考驗著每一家企業(yè)的責任和擔當。百度是一家技術(shù)公司,始終堅持創(chuàng)新,堅持AI人才培養(yǎng)。5年前,我們提出500萬AI人才計劃,實際上我們已經(jīng)為社會培養(yǎng)了超630萬AI人才。今天我宣布,未來5年,百度將加大力度,再為社會培養(yǎng)1000萬AI人才,幫助他們發(fā)揮創(chuàng)造力和生產(chǎn)力,一起推動智能經(jīng)濟的發(fā)展。
今天,我們在1小時內(nèi)做了有關(guān)模型和應(yīng)用的9大發(fā)布——發(fā)布了更強大、成本更低的文心大模型4.5 Turbo和X1 Turbo;發(fā)布了領(lǐng)先一代的高說服力數(shù)字人、功能強大的滄舟OS系統(tǒng)、代碼智能體秒噠的新進展、多智能體協(xié)作APP心響、面向未來的百度搜索AI開放計劃和幫助開發(fā)者全面擁抱MCP的計劃。
所有這些發(fā)布,都是為了讓開發(fā)者們可以不用擔心模型能力、不用擔心模型成本、更不用擔心開發(fā)工具和平臺,可以踏踏實實地做應(yīng)用,做出真正好的應(yīng)用!
讓每個需求都有回響,讓每次交互都產(chǎn)生心跳,讓每個創(chuàng)新都引爆浪潮!
我們堅信,應(yīng)用創(chuàng)造未來!開發(fā)者創(chuàng)造未來!謝謝大家。
(本文首發(fā)于鈦媒體APP,作者|李程程)
快報
根據(jù)《網(wǎng)絡(luò)安全法》實名制要求,請綁定手機號后發(fā)表評論
百度搜索接入MCP,以后搜索體驗不得起飛?
未來5年培養(yǎng)1000萬AI人才,百度這野心真不小!
三萬卡集群直接點亮,百度這算力儲備,妥妥的行業(yè)大佬!
一鍵克隆數(shù)字人,網(wǎng)紅主播要失業(yè)的節(jié)奏?
文心4.5 Turbo連模糊照片都能看懂,太智能了!
文心X1 Turbo深度思考能力拉滿,寫小說、做簡歷都在行!
數(shù)字人帶貨轉(zhuǎn)化率這么高,商家不得搶著用!
文心模型價格砍到這程度,其他廠商怕是要慌了!
百度這自研集群,為大模型訓練保駕護航!
百度這波發(fā)布會直接放大招,新模型降價+AI應(yīng)用,太猛了!