DeepSeek-R1與其他代表性模型比較,來(lái)源:DeepSeek

DeepSeek-R1高性?xún)r(jià)比的API定價(jià),極具商業(yè)化落地潛力。其定價(jià)為每百萬(wàn)輸入tokens 1元(緩存命中)/4 元(緩存未命中),每百萬(wàn)輸出tokens 16元,遠(yuǎn)低于可比大模型API服務(wù)。

且與專(zhuān)有模型不同,DeepSeek R1的代碼和訓(xùn)練方法在MIT許可下完全開(kāi)源,這意味著任何人都可以獲取、使用和修改該模型而不受限制,也有助于開(kāi)發(fā)者在使用后,加速模型的功能迭代,從而解決目前模型存在的不足。

近一個(gè)月來(lái),DeepSeek在開(kāi)源大模型領(lǐng)域的探索不可謂不吸睛。在2025年達(dá)沃斯論壇上,AI科技初創(chuàng)公司Scale AI創(chuàng)始人亞歷山大·王公開(kāi)表示,過(guò)去十年來(lái),美國(guó)可能一直在人工智能競(jìng)賽中領(lǐng)先于中國(guó),但DeepSeek的AI大模型發(fā)布可能會(huì)“改變一切”。

2024年12月26日,深度求索正式上線(xiàn)全新系列模型DeepSeek-V3首個(gè)版本并同步開(kāi)源。經(jīng)測(cè)試,在英語(yǔ)、代碼、數(shù)學(xué)、漢語(yǔ)以及多語(yǔ)言任務(wù)上,該模型不僅超越阿里云Qwen2.5-72B、Meta的Llama-3.1-405B等開(kāi)源模型,且在性能上逼近GPT-4o、Claude-3.5-Sonnet等世界頂尖閉源模型,大大縮小了開(kāi)源和閉源AI之間的差距。

根據(jù)DeepSeek-V3技術(shù)報(bào)告,該模型整個(gè)訓(xùn)練使用了277.8萬(wàn)個(gè)GPU小時(shí)(GPU為H800),訓(xùn)練成本為557.6萬(wàn)美元。通常這種能力水平的模型需要接近16K GPU的集群,而目前一些正在部署的集群規(guī)模已接近10萬(wàn)塊GPU。例如,Llama-3-405B耗費(fèi)了3080萬(wàn)GPU小時(shí),對(duì)比之下,DeepSeek-V3的算力需求減少約11倍。

其API也大幅下降,每百萬(wàn)輸入tokens 0.5元(緩存命中)/2元(緩存未命中),每百萬(wàn)輸出tokens 8元。DeepSeek為V3大模型提供了45天優(yōu)惠價(jià)格體驗(yàn)期,在2025年2月8日之前,所有用戶(hù)使用該模型API的價(jià)格分別下降80%(輸入命中)、50%(輸入未命中)、75%(輸出)。技術(shù)報(bào)告顯示,DeepSeek-V3成為唯一進(jìn)入“最佳性?xún)r(jià)比”三角區(qū)的模型。

DeepSeek-V3位于“最佳性?xún)r(jià)比”三角區(qū),來(lái)源:DeepSeek

DeepSeek-V3位于“最佳性?xún)r(jià)比”三角區(qū),來(lái)源:DeepSeek

長(zhǎng)江證券認(rèn)為,DeepSeek-V3說(shuō)明在有限算力預(yù)算下進(jìn)行模型預(yù)訓(xùn)練仍可以達(dá)到優(yōu)秀的性能,目前在數(shù)據(jù)和算法方面仍有大量?jī)?yōu)化空間,低成本的訓(xùn)練和高效推理應(yīng)用或?qū)⑹窍乱浑A段大模型發(fā)展的方向之一。后續(xù)有望在有限的預(yù)算下開(kāi)發(fā)強(qiáng)勁性能的大模型,從而降低大模型的準(zhǔn)入門(mén)檻,推動(dòng)AI應(yīng)用的落地進(jìn)程。

2024年5月,DeepSeek率先發(fā)起國(guó)內(nèi)大模型價(jià)格戰(zhàn),將100萬(wàn)token的價(jià)格降至1元人民幣,迅速引發(fā)市場(chǎng)震動(dòng)。字節(jié)跳動(dòng)豆包大模型緊隨其后,將價(jià)格進(jìn)一步壓低至100萬(wàn)token 0.8元人民幣。阿里云通義千問(wèn)則全線(xiàn)降價(jià),雖然輸出token降幅較小,但整體價(jià)格仍處市場(chǎng)低位。此外,百度、科大訊飛、騰訊等大廠(chǎng)也紛紛加入降價(jià)行列。

興業(yè)證券認(rèn)為,從豆包最新發(fā)布的視覺(jué)理解模型到Deepseekv3的全球關(guān)注,國(guó)內(nèi)AI大模型能力被低估。伴隨字節(jié)在AI領(lǐng)域的投入決心、豆包用戶(hù)目標(biāo)設(shè)定,2025年或?yàn)閲?guó)內(nèi)大模型真正算力軍備競(jìng)賽的第一年,大廠(chǎng)資本開(kāi)支有望持續(xù)超預(yù)期。

風(fēng)險(xiǎn)提示:產(chǎn)品升級(jí)不及預(yù)期;市場(chǎng)競(jìng)爭(zhēng)加劇;下游應(yīng)用需求不及預(yù)期;安全風(fēng)險(xiǎn)。

科股寶VIP由鈦媒體App與北京商報(bào)聯(lián)合推出,相關(guān)數(shù)據(jù)及信息已獲得北京商報(bào)授權(quán)。 風(fēng)險(xiǎn)提示:本產(chǎn)品內(nèi)容僅供參考,不構(gòu)成投資建議。投資有風(fēng)險(xiǎn),入市需謹(jǐn)慎。
科股一線(xiàn)拆解

快報(bào)

更多

2026-03-28 23:01

澤連斯基稱(chēng)與中東3國(guó)達(dá)成防務(wù)合作協(xié)議,涉聯(lián)合生產(chǎn)無(wú)人機(jī)

2026-03-28 22:35

山西太原一建筑發(fā)生火災(zāi),已致1人死亡25人受傷

2026-03-28 22:26

王文濤部長(zhǎng)發(fā)表書(shū)面致辭,支持世貿(mào)組織《電子商務(wù)協(xié)定》達(dá)成臨時(shí)實(shí)施安排

2026-03-28 21:54

40余家單位聯(lián)盟,中國(guó)最大人形機(jī)器人訓(xùn)練基地在京揭牌

2026-03-28 21:41

周鴻祎與劉慈欣在科幻大會(huì)預(yù)判:百億智能體或成新物種,AI推動(dòng)人類(lèi)文明分化

2026-03-28 21:38

第五代宏光MINIEV上市,售價(jià)4.48萬(wàn)-5.48萬(wàn)元

2026-03-28 20:42

烏稱(chēng)伊朗襲擊迪拜倉(cāng)庫(kù)并致烏克蘭人傷亡消息不實(shí)

2026-03-28 20:23

3月28日新聞聯(lián)播速覽23條

2026-03-28 20:05

美國(guó)務(wù)卿和歐盟官員被曝就烏克蘭問(wèn)題激烈交鋒

2026-03-28 19:44

“Token”這個(gè)詞的搜索量最高一天達(dá)到7.7萬(wàn)次,比去年日均搜索量高出1850%

2026-03-28 19:39

飛捷科思發(fā)布中國(guó)首個(gè)可微分物理仿真引擎Fysics

2026-03-28 19:13

“網(wǎng)售產(chǎn)品質(zhì)量安全提升系列行動(dòng)2026”在北京啟動(dòng)

2026-03-28 19:03

國(guó)務(wù)院食安辦、市場(chǎng)監(jiān)管總局約談相關(guān)地方市級(jí)人民政府負(fù)責(zé)人,督辦“3?15”晚會(huì)曝光問(wèn)題整改

2026-03-28 18:44

飛書(shū) CLI 開(kāi)源:AI 可直連飛書(shū)辦公套件

2026-03-28 18:36

馬來(lái)西亞說(shuō)伊朗允許馬滯留油輪通行霍爾木茲海峽

2026-03-28 18:02

今年前三個(gè)月中國(guó)創(chuàng)新藥對(duì)外授權(quán)交易總額超600億美元

2026-03-28 17:39

中國(guó)和菲律賓舉行南海問(wèn)題雙邊磋商機(jī)制第十一次會(huì)議

2026-03-28 17:30

印尼正式實(shí)施16歲以下社媒禁令,約7000萬(wàn)人受影響

2026-03-28 17:04

美國(guó)加州禁止官員借內(nèi)幕消息在預(yù)測(cè)市場(chǎng)牟利

2026-03-28 17:02

北京“超現(xiàn)場(chǎng)”生態(tài)共同體建設(shè)暨全國(guó)覆蓋啟動(dòng)

掃描下載App