圖片來源@視覺中國(guó)
鈦媒體注:本文來源于微信公眾號(hào)新浪科技(ID:techsina),作者 | 周文猛,鈦媒體經(jīng)授權(quán)發(fā)布。
市場(chǎng)期待許久的阿里“通義千問”問世,并于昨日開啟測(cè)試體驗(yàn)。這是續(xù)百度、360之后,中國(guó)互聯(lián)網(wǎng)大廠的又一“玩家”首秀。
作為首批獲邀參與內(nèi)測(cè)的媒體,新浪財(cái)經(jīng)體驗(yàn)了“通義千問”,并與文心一言、ChatGPT兩款產(chǎn)品進(jìn)行對(duì)比。
這次對(duì)比中,我們列舉了5個(gè)維度的問題,分別為:生成代碼、中文理解、寫作文章、提綱寫作,以及熱點(diǎn)事件解讀。
三款產(chǎn)品,孰強(qiáng)孰弱?一測(cè)見分曉!
生成代碼:請(qǐng)寫一段冒泡排序算法?
作為助推ChatGPT成功出圈的主要功能,ChatGPT自動(dòng)生成代碼的能力最廣為稱道。那么,通義千問的代碼生成能力如何呢?新浪財(cái)經(jīng)最先向它提出了“寫一段冒泡排序算法”的請(qǐng)求。以下是回答:
![]()
通義千問回答
![]()
文心一言回答
![]()
ChatGPT回答
點(diǎn)評(píng):從生成邏輯上來看,“通義千問”先是簡(jiǎn)單地描述冒泡算法的實(shí)現(xiàn)邏輯,然后給出具體的Python代碼,最后給出代碼實(shí)現(xiàn)思路的講解。就具體的“代碼段”而言,實(shí)現(xiàn)邏輯與文心一言生成的代碼一致,整體較為簡(jiǎn)潔,但實(shí)現(xiàn)能力不分伯仲。
相對(duì)而言,ChatGPT生成的代碼更為簡(jiǎn)潔,僅為四行,但語(yǔ)言介紹內(nèi)容較多。
中文理解:洛陽(yáng)紙貴是什么意思?
作為一款國(guó)產(chǎn)AI大模型產(chǎn)品,通義千問對(duì)于中文的理解能力,同樣是大眾關(guān)心的問題。此前,百度創(chuàng)始人、董事長(zhǎng)兼首席執(zhí)行官李彥宏在發(fā)布文心一言時(shí),曾以洛陽(yáng)紙貴一詞演示文心一言對(duì)于中文語(yǔ)言的理解能力,同樣的問題,通義千問如何作答?
![]()
通義千問回答
![]()
文心一言回答
![]()
ChatGPT回答
點(diǎn)評(píng):通義千問給出的答復(fù)與文心一言有細(xì)微差異,但成語(yǔ)出處、基本語(yǔ)義等理解都已經(jīng)十分到位。需要指出的是,目前ChatGPT對(duì)于中文語(yǔ)義的理解能力也不弱,與前兩者的差距并沒有那么大。
提綱寫作:請(qǐng)寫5個(gè)對(duì)比爾·蓋茨進(jìn)行采訪的問題?
自ChatGPT推出以來,其對(duì)于文案創(chuàng)作、邀請(qǐng)函擬定等方面的功能引發(fā)了大量討論,由于極大地提升了工作效率,一些文員、記者也開始運(yùn)用ChatGPT來擬定采訪問題。
當(dāng)新浪財(cái)經(jīng)先后向通義千問、文心一言以及ChatGPT提出寫作“采訪比爾·蓋茨的問題提綱”這一要求時(shí),三款產(chǎn)品給出的問題各不相同。
![]()
通義千問回答
![]()
文心一言回答
![]()
ChatGPT回答
點(diǎn)評(píng):整體看來,提問方向各有千秋之外,通義千問在給出問題方向的同時(shí)也給出了更為詳盡的寫作思路,較后兩者更加用心、細(xì)致。
事件理解:張繼科最近為什么特別受關(guān)注?
對(duì)于熱點(diǎn)事件的回答質(zhì)量以及速度,是檢驗(yàn)一款A(yù)I問答產(chǎn)品對(duì)于網(wǎng)絡(luò)內(nèi)容即時(shí)獲取能力的關(guān)鍵,而這背后代表的則是問答產(chǎn)品知識(shí)更新以及獲取能力的關(guān)鍵。
近日,“網(wǎng)傳張繼科用前女友私照抵賭債”一事引發(fā)廣泛關(guān)注,三款大模型將如何作答?
![]()
通義千問回答
![]()
文心一言回答
![]()
ChatGPT回答
點(diǎn)評(píng):當(dāng)新浪財(cái)經(jīng)將這一近乎全網(wǎng)皆知的事件提問給通義千問、文心一言以及ChatGPT時(shí),三款產(chǎn)品給出的答案對(duì)近期事件一概不提,但都展開了大長(zhǎng)段的“忽悠”式分析。
寫作文章:請(qǐng)以“AIGC變革內(nèi)容生產(chǎn)模式”為題寫深度文章
![]()
通義千問回答
![]()
文心一言回答
![]()
ChatGPT回答
點(diǎn)評(píng):在寫“命題作文”方面,通義千問和文心一言整體表現(xiàn)不分上下,但是ChatGPT卻因?yàn)閷⒅形沫h(huán)境下的“AIGC”理解為AI、區(qū)塊鏈、大數(shù)據(jù)和云計(jì)算,最終導(dǎo)致對(duì)于文章主旨理解的錯(cuò)誤,直接跑題了。
從這一點(diǎn)可以看出,雖然ChatGPT開啟了生成式AI風(fēng)靡全球的序幕,但是由于不對(duì)中國(guó)市場(chǎng)開放,這導(dǎo)致了他的數(shù)據(jù)存在不適應(yīng)中國(guó)語(yǔ)境的情況,已經(jīng)出現(xiàn)被國(guó)產(chǎn)GPT產(chǎn)品局部超越的情況。
多輪次多維度對(duì)比測(cè)試之后,新浪財(cái)經(jīng)發(fā)現(xiàn),通義千問與問心一言、ChatGPT相比,在生成代碼、中文理解、寫文章等方面各有千秋;在提綱寫作方面更加細(xì)致貼心,能夠給出更加具體的內(nèi)容方向。不過,在熱點(diǎn)解讀等方面,三款產(chǎn)品均存在望文生義,隨口胡謅的傾向。
在內(nèi)容的時(shí)效性以及畫圖等能力方面,文心一言有一定優(yōu)勢(shì)。不過作為后來者,通義千問在回答問題的響應(yīng)速度、人機(jī)交互的操作形式方面,均比問心一言和ChatGPT有著大幅提升。
在輸入相同的問題時(shí),通義千問幾乎只需要3秒便可以開始回答,然而文心一言和ChatGPT在回答部分問題時(shí)可能提問4—6秒后才能開始回答。而這背后代表的,其實(shí)是算法效率、存儲(chǔ)訪問速度等方面的技術(shù)底蘊(yùn)。
![]()
此外,從三款產(chǎn)品的用戶界面也可以看出,通義千問的操作界面和窗口要顯得更加的簡(jiǎn)約大方,少了一些極客范兒,卻多了一些實(shí)用性和親民性。除首頁(yè)分別就寫郵件、短文、電影腳本等進(jìn)行分類,點(diǎn)擊可直接進(jìn)入相應(yīng)的對(duì)話框提問外,更是通過百寶袋將各種功能做了效率類、生活類、娛樂類分類,讓使用者有了更多體驗(yàn)的樂趣,交互引導(dǎo)性更強(qiáng)。
![]()
![]()
需要承認(rèn)的是,相比于當(dāng)前的業(yè)界標(biāo)桿ChatGPT(GPT-4),通義千問還有不少進(jìn)步空間。不過作為一款持續(xù)迭代的產(chǎn)品,快速迭代的通義千問已不容小覷。憑借著阿里云的算力資源以及阿里巴巴集團(tuán)整體的數(shù)字、資源優(yōu)勢(shì),通義千問的比較優(yōu)勢(shì)不言而喻。
可以預(yù)測(cè),隨著百度、360集團(tuán)以及阿里巴巴先后推出自己的“類ChatGPT”產(chǎn)品,一場(chǎng)新的大模型爭(zhēng)奪戰(zhàn)再次在國(guó)內(nèi)互聯(lián)網(wǎng)頭部企業(yè)之間打響。在市場(chǎng)規(guī)則的牽引之下,后續(xù)通義千問、問心一言等產(chǎn)品將會(huì)結(jié)合不同集團(tuán)公司的資源稟賦、技術(shù)特色,形成各自差異化的特征。
正在快速到來的大模型時(shí)代,需要中國(guó)企業(yè)的身影,而且不僅僅是一家企業(yè)的身影。
快報(bào)
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論