圖片來源@視覺中國(guó)

鈦媒體注:本文來源于微信公眾號(hào)新浪科技(ID:techsina),作者 | 周文猛,鈦媒體經(jīng)授權(quán)發(fā)布。

市場(chǎng)期待許久的阿里“通義千問”問世,并于昨日開啟測(cè)試體驗(yàn)。這是續(xù)百度、360之后,中國(guó)互聯(lián)網(wǎng)大廠的又一“玩家”首秀。

作為首批獲邀參與內(nèi)測(cè)的媒體,新浪財(cái)經(jīng)體驗(yàn)了“通義千問”,并與文心一言、ChatGPT兩款產(chǎn)品進(jìn)行對(duì)比。

這次對(duì)比中,我們列舉了5個(gè)維度的問題,分別為:生成代碼、中文理解、寫作文章、提綱寫作,以及熱點(diǎn)事件解讀。

三款產(chǎn)品,孰強(qiáng)孰弱?一測(cè)見分曉!

實(shí)測(cè)5問,性能如何?

生成代碼:請(qǐng)寫一段冒泡排序算法?

作為助推ChatGPT成功出圈的主要功能,ChatGPT自動(dòng)生成代碼的能力最廣為稱道。那么,通義千問的代碼生成能力如何呢?新浪財(cái)經(jīng)最先向它提出了“寫一段冒泡排序算法”的請(qǐng)求。以下是回答:

通義千問回答

文心一言回答

ChatGPT回答

點(diǎn)評(píng):從生成邏輯上來看,“通義千問”先是簡(jiǎn)單地描述冒泡算法的實(shí)現(xiàn)邏輯,然后給出具體的Python代碼,最后給出代碼實(shí)現(xiàn)思路的講解。就具體的“代碼段”而言,實(shí)現(xiàn)邏輯與文心一言生成的代碼一致,整體較為簡(jiǎn)潔,但實(shí)現(xiàn)能力不分伯仲。

相對(duì)而言,ChatGPT生成的代碼更為簡(jiǎn)潔,僅為四行,但語(yǔ)言介紹內(nèi)容較多。

中文理解:洛陽(yáng)紙貴是什么意思?

作為一款國(guó)產(chǎn)AI大模型產(chǎn)品,通義千問對(duì)于中文的理解能力,同樣是大眾關(guān)心的問題。此前,百度創(chuàng)始人、董事長(zhǎng)兼首席執(zhí)行官李彥宏在發(fā)布文心一言時(shí),曾以洛陽(yáng)紙貴一詞演示文心一言對(duì)于中文語(yǔ)言的理解能力,同樣的問題,通義千問如何作答?

通義千問回答

文心一言回答

ChatGPT回答

點(diǎn)評(píng):通義千問給出的答復(fù)與文心一言有細(xì)微差異,但成語(yǔ)出處、基本語(yǔ)義等理解都已經(jīng)十分到位。需要指出的是,目前ChatGPT對(duì)于中文語(yǔ)義的理解能力也不弱,與前兩者的差距并沒有那么大。

提綱寫作:請(qǐng)寫5個(gè)對(duì)比爾·蓋茨進(jìn)行采訪的問題?

自ChatGPT推出以來,其對(duì)于文案創(chuàng)作、邀請(qǐng)函擬定等方面的功能引發(fā)了大量討論,由于極大地提升了工作效率,一些文員、記者也開始運(yùn)用ChatGPT來擬定采訪問題。

當(dāng)新浪財(cái)經(jīng)先后向通義千問、文心一言以及ChatGPT提出寫作“采訪比爾·蓋茨的問題提綱”這一要求時(shí),三款產(chǎn)品給出的問題各不相同。

通義千問回答

文心一言回答

ChatGPT回答

點(diǎn)評(píng):整體看來,提問方向各有千秋之外,通義千問在給出問題方向的同時(shí)也給出了更為詳盡的寫作思路,較后兩者更加用心、細(xì)致。

事件理解:張繼科最近為什么特別受關(guān)注?

對(duì)于熱點(diǎn)事件的回答質(zhì)量以及速度,是檢驗(yàn)一款A(yù)I問答產(chǎn)品對(duì)于網(wǎng)絡(luò)內(nèi)容即時(shí)獲取能力的關(guān)鍵,而這背后代表的則是問答產(chǎn)品知識(shí)更新以及獲取能力的關(guān)鍵。

近日,“網(wǎng)傳張繼科用前女友私照抵賭債”一事引發(fā)廣泛關(guān)注,三款大模型將如何作答?

通義千問回答

文心一言回答

ChatGPT回答

點(diǎn)評(píng):當(dāng)新浪財(cái)經(jīng)將這一近乎全網(wǎng)皆知的事件提問給通義千問、文心一言以及ChatGPT時(shí),三款產(chǎn)品給出的答案對(duì)近期事件一概不提,但都展開了大長(zhǎng)段的“忽悠”式分析。

寫作文章:請(qǐng)以“AIGC變革內(nèi)容生產(chǎn)模式”為題寫深度文章

通義千問回答

文心一言回答

ChatGPT回答

點(diǎn)評(píng):在寫“命題作文”方面,通義千問和文心一言整體表現(xiàn)不分上下,但是ChatGPT卻因?yàn)閷⒅形沫h(huán)境下的“AIGC”理解為AI、區(qū)塊鏈、大數(shù)據(jù)和云計(jì)算,最終導(dǎo)致對(duì)于文章主旨理解的錯(cuò)誤,直接跑題了。

從這一點(diǎn)可以看出,雖然ChatGPT開啟了生成式AI風(fēng)靡全球的序幕,但是由于不對(duì)中國(guó)市場(chǎng)開放,這導(dǎo)致了他的數(shù)據(jù)存在不適應(yīng)中國(guó)語(yǔ)境的情況,已經(jīng)出現(xiàn)被國(guó)產(chǎn)GPT產(chǎn)品局部超越的情況。

總結(jié):回答各有千秋,通義千問交互體驗(yàn)更優(yōu)

多輪次多維度對(duì)比測(cè)試之后,新浪財(cái)經(jīng)發(fā)現(xiàn),通義千問與問心一言、ChatGPT相比,在生成代碼、中文理解、寫文章等方面各有千秋;在提綱寫作方面更加細(xì)致貼心,能夠給出更加具體的內(nèi)容方向。不過,在熱點(diǎn)解讀等方面,三款產(chǎn)品均存在望文生義,隨口胡謅的傾向。

在內(nèi)容的時(shí)效性以及畫圖等能力方面,文心一言有一定優(yōu)勢(shì)。不過作為后來者,通義千問在回答問題的響應(yīng)速度、人機(jī)交互的操作形式方面,均比問心一言和ChatGPT有著大幅提升。

在輸入相同的問題時(shí),通義千問幾乎只需要3秒便可以開始回答,然而文心一言和ChatGPT在回答部分問題時(shí)可能提問4—6秒后才能開始回答。而這背后代表的,其實(shí)是算法效率、存儲(chǔ)訪問速度等方面的技術(shù)底蘊(yùn)。

此外,從三款產(chǎn)品的用戶界面也可以看出,通義千問的操作界面和窗口要顯得更加的簡(jiǎn)約大方,少了一些極客范兒,卻多了一些實(shí)用性和親民性。除首頁(yè)分別就寫郵件、短文、電影腳本等進(jìn)行分類,點(diǎn)擊可直接進(jìn)入相應(yīng)的對(duì)話框提問外,更是通過百寶袋將各種功能做了效率類、生活類、娛樂類分類,讓使用者有了更多體驗(yàn)的樂趣,交互引導(dǎo)性更強(qiáng)。

結(jié)語(yǔ):大模型時(shí)代,需要更多中國(guó)力量

需要承認(rèn)的是,相比于當(dāng)前的業(yè)界標(biāo)桿ChatGPT(GPT-4),通義千問還有不少進(jìn)步空間。不過作為一款持續(xù)迭代的產(chǎn)品,快速迭代的通義千問已不容小覷。憑借著阿里云的算力資源以及阿里巴巴集團(tuán)整體的數(shù)字、資源優(yōu)勢(shì),通義千問的比較優(yōu)勢(shì)不言而喻。

可以預(yù)測(cè),隨著百度、360集團(tuán)以及阿里巴巴先后推出自己的“類ChatGPT”產(chǎn)品,一場(chǎng)新的大模型爭(zhēng)奪戰(zhàn)再次在國(guó)內(nèi)互聯(lián)網(wǎng)頭部企業(yè)之間打響。在市場(chǎng)規(guī)則的牽引之下,后續(xù)通義千問、問心一言等產(chǎn)品將會(huì)結(jié)合不同集團(tuán)公司的資源稟賦、技術(shù)特色,形成各自差異化的特征。

正在快速到來的大模型時(shí)代,需要中國(guó)企業(yè)的身影,而且不僅僅是一家企業(yè)的身影。

本文系作者 新浪科技 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請(qǐng)注明出處、作者和本文鏈接
本內(nèi)容來源于鈦媒體鈦度號(hào),文章內(nèi)容僅供參考、交流、學(xué)習(xí),不構(gòu)成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點(diǎn)和發(fā)現(xiàn),點(diǎn)擊這里投稿 。創(chuàng)業(yè)或融資尋求報(bào)道,點(diǎn)擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評(píng)論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論

請(qǐng) 登錄后輸入評(píng)論內(nèi)容

快報(bào)

更多

15:23

本周新增寶蓋新材、雙林股份等3家境外上市備案企業(yè)

15:10

日本民眾舉行抗議集會(huì),敦促日本政府就強(qiáng)闖使館事件道歉

15:07

華創(chuàng)證券:四重維度透視中國(guó)寬基指數(shù)的“中游制造”成色

15:01

國(guó)內(nèi)兆瓦級(jí)液氫燃料航空發(fā)動(dòng)機(jī)首次整機(jī)性能達(dá)標(biāo)

14:30

河南:聚焦老年用品研發(fā)生產(chǎn)培育龍頭企業(yè)和產(chǎn)業(yè)集群,建設(shè)高標(biāo)準(zhǔn)養(yǎng)老產(chǎn)業(yè)園區(qū)

14:28

河南:到2027年養(yǎng)老服務(wù)等領(lǐng)域民政服務(wù)供給不斷優(yōu)化

14:02

宇樹科技王興興:具身智能GPT時(shí)刻大概還需兩到三年

14:01

阿塞拜疆首都地區(qū)降水量打破百年紀(jì)錄

13:54

蒙古國(guó)執(zhí)政黨選定總理候選人

13:32

本周南向資金凈買入251億港元,泡泡瑪特凈買入超36億港元

13:17

沙特每日700萬桶石油繞過霍爾木茲

13:16

中東兩大鋁廠遇襲,恐影響全球供應(yīng)鏈

12:58

全國(guó)累計(jì)器官捐獻(xiàn)志愿登記人數(shù)超過733萬

12:46

宇樹科技具身智能體驗(yàn)館亞洲首店將于5月底落地上海

12:44

洛杉磯10萬人參加“不要國(guó)王”抗議,多人被捕

12:37

今年前兩月霍爾果斯口岸果蔬出口增長(zhǎng)29.3%

11:48

中國(guó)首臺(tái)商用12兆伏串列加速器成功下線

11:40

美副總統(tǒng)稱無意滯留伊朗,將很快撤出

11:39

中關(guān)村兩院具身通用智能基座模型與社會(huì)模擬器等科研成果發(fā)布

11:37

清明檔新片預(yù)售票房突破2000萬

掃描下載App