月之暗面或因DeepSeek調(diào)整工作重心,強(qiáng)化學(xué)習(xí)成關(guān)注焦點(diǎn)
鈦媒體App 2月15日消息,據(jù)悉,月之暗面內(nèi)部已將“持續(xù)拿到SOTA結(jié)果”確定為最重要的工作目標(biāo)。2025年,他們計(jì)劃在模型能力方向上加強(qiáng)多模態(tài)和長(zhǎng)文本推理能力。然而,DeepSeek的成功讓外界重新審視了月之暗面的技術(shù)和用戶增長(zhǎng)模式。兩者在閉源與開源、預(yù)訓(xùn)練與蒸餾技術(shù)等方面存在差異。雖然尚未明確是否接入DeepSeek或開源,但有業(yè)內(nèi)人士透露可能會(huì)將強(qiáng)化學(xué)習(xí)作為一個(gè)工作重點(diǎn)方向。此舉被認(rèn)為是對(duì)抗DeepSeek等競(jìng)爭(zhēng)對(duì)手的一種改變或嘗試。
近日OpenAI發(fā)布研究論文報(bào)告《Competitive Programming with Large Reasoning Models》,提到中國(guó)的DeepSeek-R1和Kimi k1.5利用思維鏈學(xué)習(xí)方法,在數(shù)學(xué)解題與編程挑戰(zhàn)中表現(xiàn)出色。這也進(jìn)一步引發(fā)了對(duì)于強(qiáng)化學(xué)習(xí)路線帶來的模型能力提升的關(guān)注。
本文內(nèi)容僅供參考,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論