對(duì)標(biāo)OpenAI GPT-4o的中國版本來了!
7月5日舉行的2024世界人工智能大會(huì)暨人工智能全球治理高級(jí)別會(huì)議(WAIC 2024)分論壇上,國內(nèi)AGI公司商湯科技發(fā)布日日新大模型5.5系列。
其中,最引發(fā)關(guān)注的,是國內(nèi)首個(gè)所見即所得、實(shí)時(shí)流式多模態(tài)交互模型“日日新5o”,交互體驗(yàn)對(duì)標(biāo)GPT-4o,實(shí)現(xiàn)全新AI交互模式。另外,全新日日新5.5的模型參數(shù)規(guī)模達(dá)6000億,綜合性能較“日日新5.0”平均提升30%,在數(shù)學(xué)推理、英文能力和指令跟隨等能力明顯增強(qiáng),交互效果和多項(xiàng)核心指標(biāo)實(shí)現(xiàn)對(duì)標(biāo)GPT-4o,同時(shí)也是國內(nèi)對(duì)標(biāo)GPT-4 Turbo領(lǐng)先的國產(chǎn)大模型之一。


商湯科技董事長兼CEO徐立在演講中表示,大模型本質(zhì)意義上是在做一個(gè)記憶的事情,記住世界的知識(shí),而它有的一點(diǎn)智力完全是來自于對(duì)于知識(shí)背后高階的思維邏輯和記憶;同時(shí),行業(yè)要進(jìn)行變化,交互模式一定是先行的;另外,基于手機(jī)旗艦平臺(tái),端側(cè)5.5 Lite模型版本性能精度提升10%、首包延遲下降40%、推理效率提升15%,達(dá)到每秒90.2個(gè)漢字的處理速度。因此,商湯在模型上面的能力,實(shí)際上還是在日日新,不停地迭代和演進(jìn)。
徐立還透露,為了讓更多企業(yè)用戶低門檻接入并使用“日日新”大模型體系能力,商湯于近期推出了“大模型0元Go”計(jì)劃。凡是“日日新”的新注冊用戶,都可獲得涉及調(diào)用、遷徙、訓(xùn)練等多項(xiàng)免費(fèi)服務(wù)大禮包。同時(shí),商湯還將免費(fèi)贈(zèng)送5000萬Tokens包,并且派出專屬搬家顧問,幫助OpenAI用戶實(shí)現(xiàn)零服務(wù)成本遷移。

實(shí)際上,最近一年多,商湯持續(xù)擴(kuò)大 AI 大模型投入力度,確立了“模型即服務(wù)”的商業(yè)模式,通過“大模型+大裝置”推動(dòng)實(shí)現(xiàn)通用人工智能(AGI)目標(biāo)。
今年3月,商湯科技董事長兼CEO徐立表示,在Scaling Law(尺度規(guī)律)指引下,大模型正處于技術(shù)革命與性能提升的黃金時(shí)期。自2023年發(fā)布以來,商湯“日日新”大模型的能力每隔三個(gè)月都會(huì)有顯著提升,實(shí)現(xiàn)了萬卡萬參的大模型訓(xùn)練能力,在基礎(chǔ)模型、多模態(tài)、編程和工具調(diào)用、百萬字無損上下文、終端小模型上都達(dá)到國內(nèi)領(lǐng)先水平。
據(jù)2023年財(cái)報(bào)數(shù)據(jù),商湯“日日新”大模型+大裝置驅(qū)動(dòng)生成式AI業(yè)務(wù)爆發(fā)式增長200%,收入達(dá)12億元,貢獻(xiàn)了35%的營收。這是商湯成立十年以來,以最快速度從無到有、超過10億元收入體量的業(yè)務(wù)。
業(yè)務(wù)層面,2024年上半年,商湯通過其大模型技術(shù)與多家行業(yè)頭部企業(yè)達(dá)成緊密合作。例如金山辦公的WPS AI通過整合商湯的大模型技術(shù),實(shí)現(xiàn)了辦公軟件的智能化升級(jí);小米公司的小愛同學(xué)業(yè)務(wù)在商湯大模型技術(shù)的助力下,用戶體驗(yàn)得到了顯著提升;海通證券與商湯合作,構(gòu)建金融AI應(yīng)用推動(dòng)數(shù)字化升級(jí);閱文集團(tuán)通過結(jié)合商湯科技的擬人大模型技術(shù),打造AI native的虛擬社交生態(tài)平臺(tái)——筑夢島。
徐立表示,商湯的大模型自從文本開始,拓展至代碼辦公、擬人對(duì)話、金融、農(nóng)業(yè)等多個(gè)垂直行業(yè),推出專屬模型和一體機(jī),使客戶能高效、經(jīng)濟(jì)地使用AI大模型。目前,商湯大模型已有超3000家客戶。
“現(xiàn)在的認(rèn)知其實(shí)還是在于,說如何用大模型去賦能行業(yè),而且我認(rèn)為,我們處在一個(gè)很重要、關(guān)鍵的轉(zhuǎn)折節(jié)點(diǎn),也就是接下來 AI 的超級(jí)時(shí)刻,有賴于我們共同去營造超級(jí)應(yīng)用。”徐立表示。
整體來說,全新商湯日日新大模型5.5版本,在原生多模態(tài)能力下按場景需求可提供純語言、多圖理解、4o語音、文生圖、代碼/辦公小浣熊、擬人、端側(cè)模擬、行業(yè)模型等多模態(tài)、多版本、強(qiáng)場景Agent形態(tài)。
商湯披露,截至目前,已有超過兩百家企業(yè)選擇使用商湯代碼小浣熊工具,此次升級(jí)的小浣熊模型響應(yīng)速度提升達(dá)5倍;同時(shí),辦公小浣熊支持端側(cè)落地;基于“日日新5.5”大模型驅(qū)動(dòng)下,從5月到今天,全新商湯擬人模型版本的平均使用時(shí)長在SDK調(diào)用下日均達(dá)到130分鐘,次日留存可以有50%以上,且人均的對(duì)話人數(shù)超過90次;另外,全新端側(cè)模型性能不斷提升,支持手機(jī)、平板、一體機(jī)、車載等終端設(shè)備,甚至還支持元蘿卜智能臺(tái)燈。
另外,商湯早前還發(fā)布國內(nèi)首個(gè)“可控”人物視頻生成大模型Vimi,也就是“圖生視頻”產(chǎn)品,僅通過一張任意風(fēng)格的照片就能生成和目標(biāo)動(dòng)作一致的人物類視頻,并支持多種驅(qū)動(dòng)方式,可通過已有人物視頻、動(dòng)畫、聲音、文字等多種元素進(jìn)行驅(qū)動(dòng)。
會(huì)前交流時(shí),商湯研究院研發(fā)總監(jiān)盧樂煒 向鈦媒體AGI等透露,目前商湯日日新的多模態(tài)模型就是邁向?qū)τ谝曨l理解、對(duì)真實(shí)世界理解。“在視頻指標(biāo)方面,我們的模型跟目前的 SOTA 的方法相比,有一個(gè)10%-20% 的提升。”
“性能提升需要模型有相當(dāng)大的規(guī)模。另外,如何更快速地訓(xùn)練一個(gè)更大(參數(shù))規(guī)模的模型,無論從算法、設(shè)計(jì)還有工程的配合,都需要很大的工作量,所以我們過去兩個(gè)月一直在持續(xù)攻關(guān)。”盧樂煒表示。

徐立強(qiáng)調(diào),商湯持續(xù)推進(jìn)模型應(yīng)用,端側(cè)大模型的 API 接入價(jià)格將達(dá)到每臺(tái)設(shè)備、每年9.9元。
目前,商湯在多模態(tài)、基礎(chǔ)模型、文生圖、文生視頻、擬(數(shù)字)人模型、行業(yè)垂直模型、端側(cè)模型、開源模型等熱門技術(shù)上均有涉獵和持續(xù)迭代,同時(shí)也在不斷調(diào)整優(yōu)化整體研發(fā)和商業(yè)化節(jié)奏。鈦媒體AGI了解到,預(yù)計(jì)V6版本將會(huì)在今年內(nèi)公布。
“所有的智能音箱、智能車載、智能眼鏡,大家都來接上我們的端側(cè)大模型,真正讓大家用得起 AI 大模型,AI才會(huì)進(jìn)入它的超級(jí)時(shí)刻。”徐立在演講結(jié)尾表示。
(本文首發(fā)于鈦媒體App,作者|林志佳,編輯|胡潤峰)
![]()
快報(bào)
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論