搜狗創(chuàng)始人、百川智能創(chuàng)始人兼CEO 王小川(來源:受訪者提供)

隨著8月底百川大模型對外開放,王小川團(tuán)隊加速研發(fā)新產(chǎn)品。

鈦媒體App獲悉,9月6日下午,人工智能(AI)大模型公司 百川智能在北京發(fā)布最新70億、130億參數(shù)的兩款Baichuan2系列開源大模型Baichuan2-7B、Baichuan2-13B,文科理科能力全面提升,支持中、英等數(shù)十種語言,應(yīng)用于學(xué)術(shù)研究、互聯(lián)網(wǎng)、金融等領(lǐng)域。

相比一代,Baichuan2數(shù)學(xué)能力提升49%,代碼能力提升46%,安全能力提升37%,邏輯能力提升25%,語義理解能力提升15%,均處于開源模型最好水平。

百川智能創(chuàng)始人兼CEO 王小川表示,70億參數(shù)的Baichuan2-7B在中英文主流任務(wù)全面超越Meta研發(fā)的開源大模型Llama2-13B。隨著國內(nèi)Baichuan2開源大模型的發(fā)布,再用Llama 2作為大家一個開源模型的時代已經(jīng)過去了。

“我們現(xiàn)在可以獲得一個比Llama2更加友好、能力更強的這樣一個開源模型,能夠去幫助我們扶持中國整個大模型生態(tài)發(fā)展。那么除了開源模型之外,下次我們再閉源里面可能會有一個新的突破,希望能夠在大模型領(lǐng)域為中國社會經(jīng)濟(jì)發(fā)展帶來我們的貢獻(xiàn)。”王小川表示。

清華大學(xué)計算機系教授、中國科學(xué)院院士張鈸表示,盡管中國已經(jīng)發(fā)布了眾多參數(shù)規(guī)模從幾十億到幾百億的大型模型和相應(yīng)的企業(yè),但這些模型大多應(yīng)用于工業(yè)領(lǐng)域,學(xué)術(shù)研究的應(yīng)用卻相對較少,尤其大模型幻覺問題嚴(yán)重。百川開源大模型在學(xué)術(shù)研究上的應(yīng)用顯得尤為重要和緊迫,這有助于我們更深入地解釋和理解大模型技術(shù)。

“我們必須深入探討和明確這些(可解釋、幻覺)問題,只有這樣,我們才能更好地發(fā)展中國的大模型產(chǎn)品。”張鈸稱。

據(jù)悉,百川智能創(chuàng)立于今年4月10日,由搜狗創(chuàng)始人王小川、前搜狗COO茹立云聯(lián)合成立,旨在打造中國版的OpenAI,構(gòu)建中國最好的大模型底座,并在教育、醫(yī)療等領(lǐng)域應(yīng)用落地。截至目前,百川智能已公布首輪5000萬美元融資。

過去149天,百川智能平均每28天發(fā)布一款大模型,已連續(xù)推出70億、130億參數(shù)的兩款開源大模型Baichuan-7B、Baichuan-13B,以及今年8月公布的530億參數(shù)、面向B端用戶的閉源通用大模型Baichuan-53B,在寫作、文本創(chuàng)作等領(lǐng)域能力已達(dá)到行業(yè)較好水平。

王小川此前對鈦媒體App表示,開源大模型里面,百川智能在中文領(lǐng)域現(xiàn)在就可以替代,在某些應(yīng)用中已經(jīng)超越閉源的GPT模型,未來其開源模型能力一定會超越Meta Llama 2。他強調(diào),未來可能80%的場景會用到開源模型。而百川智能目前已完成了“開源+閉源”大模型并行布局,希望做到中國最好的、對標(biāo)GPT的模型。

據(jù)悉,截至目前,百川開源大模型已經(jīng)在開源社區(qū)總下載量超越500萬。其中,Hugging Face首周下載量達(dá)百萬,近一個月的下載量337萬。而且在Github上,baichuan系列模型是星標(biāo)月漲幅最快的中國大模型。

企業(yè)端,截至目前,已經(jīng)又超過200家企業(yè)已申請百川大模型開源和商業(yè)授權(quán),并已將百川模型投入實際生產(chǎn)場景。企業(yè)涵蓋互聯(lián)網(wǎng)、軟件和信息技術(shù)、金融、法律、教育、制造業(yè)、企業(yè)服務(wù)等眾多領(lǐng)域,客戶包括阿里云、騰訊、火山引擎、京東科技、順豐科技、浪潮、中國農(nóng)業(yè)銀行、蔚來汽車等。

今年8月31日,百川智能旗下產(chǎn)品“百川大模型”等10余款大模型產(chǎn)品完成備案,成為中國首批面向公眾提供類似ChatGPT服務(wù)的 AI 大模型產(chǎn)品。

此次,百川智能公布的最新開源大模型Baichuan2系列,文科理科全面提升,擁有2.6TB訓(xùn)練的超大規(guī)模語料,數(shù)據(jù)方面規(guī)模大、覆蓋全、質(zhì)量優(yōu),篇章、段落、句子質(zhì)量打分,支持細(xì)顆粒采樣,訓(xùn)練則是高效、穩(wěn)定、可預(yù)測,安全方面實施了安全價值觀對齊,實現(xiàn)了多階段多目標(biāo)的強化學(xué)習(xí)。同時,百川Baichuan2系列開源大模型提供更透明、更開放,公布了3000億-2.6萬億tokens的模型訓(xùn)練中間過程,助力大模型研究。

另外,王小川還宣布,中國計算機學(xué)會(CCF)和百川聯(lián)合成立大模型研究基金,旨在推動圍繞大模型不同階段、不同維度等相關(guān)技術(shù)研究,支持醫(yī)療、開放世界Agent。而且,百川智能還將與亞馬遜云科技成立AI黑客松活動,在醫(yī)療健康、游戲娛樂兩大賽道支持AI大模型研究,冠軍獎勵超過20萬元。

合作伙伴方面,百川智能與阿里云、高通、英博數(shù)科、瀚博半導(dǎo)體、火山引擎、寒武紀(jì)、華為等公司合作落地百川大模型。

王小川早前向鈦媒體App透露,百川智能將在今年第四季度發(fā)布千億參數(shù)模型,預(yù)計明年一季度前后推出 “超級應(yīng)用”。

(本文首發(fā)鈦媒體App,作者|林志佳)

本文系作者 林志佳 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請注明出處、作者和本文鏈接
本內(nèi)容來源于鈦媒體鈦度號,文章內(nèi)容僅供參考、交流、學(xué)習(xí),不構(gòu)成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點和發(fā)現(xiàn),點擊這里投稿 。創(chuàng)業(yè)或融資尋求報道,點擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實名制要求,請綁定手機號后發(fā)表評論

登錄后輸入評論內(nèi)容
  • 底座模型不會用人家的來微調(diào)的吧,要論知識產(chǎn)權(quán),論實干,國內(nèi)這群互聯(lián)網(wǎng)公司真是每一個能打

    回復(fù) 2023.09.06 · via netease
  • 意思就是,百川

    回復(fù) 2023.09.06 · via netease
  • 已經(jīng)在本地試過了,很不錯

    回復(fù) 2023.09.06 · via netease
  • 基于那個開源項目改沒說

    回復(fù) 2023.09.06 · via netease

快報

更多

2026-03-28 23:01

澤連斯基稱與中東3國達(dá)成防務(wù)合作協(xié)議,涉聯(lián)合生產(chǎn)無人機

2026-03-28 22:35

山西太原一建筑發(fā)生火災(zāi),已致1人死亡25人受傷

2026-03-28 22:26

王文濤部長發(fā)表書面致辭,支持世貿(mào)組織《電子商務(wù)協(xié)定》達(dá)成臨時實施安排

2026-03-28 21:54

40余家單位聯(lián)盟,中國最大人形機器人訓(xùn)練基地在京揭牌

2026-03-28 21:41

周鴻祎與劉慈欣在科幻大會預(yù)判:百億智能體或成新物種,AI推動人類文明分化

2026-03-28 21:38

第五代宏光MINIEV上市,售價4.48萬-5.48萬元

2026-03-28 20:42

烏稱伊朗襲擊迪拜倉庫并致烏克蘭人傷亡消息不實

2026-03-28 20:23

3月28日新聞聯(lián)播速覽23條

2026-03-28 20:05

美國務(wù)卿和歐盟官員被曝就烏克蘭問題激烈交鋒

2026-03-28 19:44

“Token”這個詞的搜索量最高一天達(dá)到7.7萬次,比去年日均搜索量高出1850%

2026-03-28 19:39

飛捷科思發(fā)布中國首個可微分物理仿真引擎Fysics

2026-03-28 19:13

“網(wǎng)售產(chǎn)品質(zhì)量安全提升系列行動2026”在北京啟動

2026-03-28 19:03

國務(wù)院食安辦、市場監(jiān)管總局約談相關(guān)地方市級人民政府負(fù)責(zé)人,督辦“3?15”晚會曝光問題整改

2026-03-28 18:44

飛書 CLI 開源:AI 可直連飛書辦公套件

2026-03-28 18:36

馬來西亞說伊朗允許馬滯留油輪通行霍爾木茲海峽

2026-03-28 18:02

今年前三個月中國創(chuàng)新藥對外授權(quán)交易總額超600億美元

2026-03-28 17:39

中國和菲律賓舉行南海問題雙邊磋商機制第十一次會議

2026-03-28 17:30

印尼正式實施16歲以下社媒禁令,約7000萬人受影響

2026-03-28 17:04

美國加州禁止官員借內(nèi)幕消息在預(yù)測市場牟利

2026-03-28 17:02

北京“超現(xiàn)場”生態(tài)共同體建設(shè)暨全國覆蓋啟動

4

掃描下載App