文 | 航通社,作者 | 書航
歲末年初,杭州的大模型創(chuàng)業(yè)公司“深度求索”DeepSeek 不斷放出大新聞。它所公布的一個開源模型DeepSeek-V3,在各種基準(zhǔn)測試等方面,能夠大致打平需要付錢的GPT-4o。
而一個更重要的問題是,這是中國公司在受到制裁,算力有限,不能購買足夠數(shù)量顯卡的基礎(chǔ)上,使用小數(shù)據(jù)集蒸餾等方法,而得到的一個更節(jié)省成本的模型。
官方技術(shù)論文披露,v3模型的總訓(xùn)練成本僅為557.6萬美元,相比之下GPT-4o等模型的訓(xùn)練成本約為1億美元。因此DeepSeek還被稱為“AI界拼多多”。
這條新聞的重大意義在于,它可能會減少人們對于“大模型的智能程度=英偉達(dá)提供的算力”這樣一個認(rèn)知的依賴。因此,消息還被認(rèn)為是間接影響了英偉達(dá)的股價。
在整個消息發(fā)酵的過程當(dāng)中,是非常有趣的“出口轉(zhuǎn)內(nèi)銷”然后再出去的,變來變?nèi)サ姆绞健?/p>
兔撕雞在即刻上總結(jié)說,國外的消息被引到國內(nèi)的時候,大家都看闌夕發(fā)的微博。但那條微博正確地指出了,DeepSeek 突破的真正意義在于GPU需求變小。“這標(biāo)志著美國對中國的AI封鎖戰(zhàn)略不算成功,也不需要搭建GPU萬卡集群,就能獲得不錯的效果。”
這一層意思被重新譯介回Twitter/X上面,又讓硅谷的那幫人回過神來了,所以影響英偉達(dá)的股價。而且還需要對沖,the information說字節(jié)將會700億采購英偉達(dá)芯片,然后字節(jié)否認(rèn)。如果這個消息不是真實的,那么可以認(rèn)為,發(fā)出這個消息的,就是算力相關(guān)股票的護(hù)盤手。
總之,這種猜測甚是玄學(xué)。由此產(chǎn)生了兩個段子:
- 其一,杭州新四小龍:宇樹科技、DeepSeek、游戲科學(xué)、影視颶風(fēng);
- 其二,闌心一言,一個字近億美元。
12月27日,原先在DeepSeek的羅福莉加入小米的消息大范圍流傳,其實之前她早就自我官宣過,而且也在大模型業(yè)界小范圍流通。但是自從有媒體將羅形容為“95后天才少女”之后,情況就不一樣了。
這條消息獲得營銷加成,與其說利好小米,更不如說是加碼營銷了羅福莉的前東家DeepSeek,也就是證明了他們的團(tuán)隊確實有實力,足夠優(yōu)秀的人可以在團(tuán)隊內(nèi)做出非常厲害的事。
不得不說,在DeepSeek出圈前,AI業(yè)界對它的評價都非常高。因為,即使人們發(fā)現(xiàn)它的訓(xùn)練數(shù)據(jù)集有可能使用了來自ChatGPT的輸出結(jié)果——它曾在很多情況下都自稱為ChatGPT——這也只是無傷大雅的插曲。你行你也上啊,如果只要用ChatGPT輸出就能做這么好,你也可以試一試。
畢竟谷歌也在這么做。谷歌Gemini的事實核查人員是外包的,用來檢查雙子座模型所生成的結(jié)果是否屬實。而谷歌被曝光要放低人工核對的標(biāo)準(zhǔn),讓人員檢查跟自己本專業(yè)能力不相關(guān)的答案的準(zhǔn)確性,同時還允許他們借助類似Claude這樣的,其他模型生成的結(jié)果來核對。
當(dāng)某個階段你所做出的成績,是僅此一家別無分店的時候,那就說明潑天的富貴將會降臨到你的身上。
最近呢,當(dāng)然是快手的可靈,在Sora之前吸干了屬于它的關(guān)注度。之前另外一個華裔的作品Pika也類似。但Pika在初期版本比Runway強(qiáng)不少,之后就比較后勁乏力,連帶著聯(lián)合創(chuàng)始人郭文景,也不再繼續(xù)被稱作“天才少女”刷屏了。
但是這當(dāng)中最典型的案例則是月之暗面(Kimi)。
在差不多一年前。Kimi成為AI界當(dāng)紅炸子雞,因為它在國內(nèi)外的競品當(dāng)中,最早提出了一個新的概念,就是“超長文本(tokens)”。長文本成為各大模型開始卷的領(lǐng)域,而Kimi依靠這個單獨概念對用戶心智的教育,牢牢的吸了一波粉絲和媒體關(guān)注。
自從長文本概念首倡以后,Kimi獲得融資的規(guī)模和頻次就像瘋了一樣,終于到達(dá)了需要老股東掐架的程度。在這一年當(dāng)中,Kimi的產(chǎn)品發(fā)布,包括智能體、深度思考、聯(lián)網(wǎng),以及尚未發(fā)布的視頻生成,都只能說是按部就班。
但是Kimi獲得了充足的彈藥,不僅在開發(fā)周期上面可以比較舒緩,沒有壓力,而且可以鉚足了勁兒,在B站砸錢營銷,使得大模型推廣的價格水漲船高。
在豆包積極跟進(jìn)廝殺之余,連騰訊都熬不住這么玩了。目前混元大模型的能力被植入微信、QQ、讀書、輸入法等具體的產(chǎn)品內(nèi),單行版元寶則處于放養(yǎng)狀態(tài),不再用力宣傳。
這就是為什么社長認(rèn)為,在今年,如果各家大廠還想要新的投資標(biāo)的的話,最合適的選擇就是DeepSeek。因為這一次輪到它提出新概念了,這個概念是“低成本訓(xùn)練”。
如果論資本市場的青睞程度,能跟月之暗面媲美的還有智譜。但智譜的融資輪數(shù)已經(jīng)太多了,從目前的發(fā)展來看,它也沒有持續(xù)領(lǐng)先。
其實就算是強(qiáng)如OpenAI,也不可能永遠(yuǎn)“炸裂顛覆嚇尿革命”。它可能只需要一次嬰兒的啼哭,向世界證明它此時此刻是領(lǐng)先的。對它來說這個概念叫“ChatGPT”。
這樣的機(jī)會,這種對一個概念的定義權(quán),只要一個創(chuàng)業(yè)公司擁有一次,就已經(jīng)足夠幸運。在此之后它是否還能定義第二個概念,或許不太重要;蜂擁而至的融資將會是對它之前定義概念的獎賞。







快報
根據(jù)《網(wǎng)絡(luò)安全法》實名制要求,請綁定手機(jī)號后發(fā)表評論