“今年3、4月份,中國科技企業(yè)都經(jīng)過了一段焦慮期。最怕睡覺,因為一起床就發(fā)現(xiàn)又有一個新的論文和新的產(chǎn)品要研究。”螞蟻集團副總裁、金融大模型負責人王曉航向鈦媒體App回憶。

每當AI浪潮涌起,作為數(shù)據(jù)密集型產(chǎn)業(yè)典型代表的金融業(yè),總是會被推上時代潮頭。最新的案例無疑是大語言模型(LLM),自ChatGPT異軍突起,國內外科技企業(yè)迅速涌入。

今年3月,彭博首度針對金融業(yè)推出大型語言模型BloombergGPT,引發(fā)市場對金融垂直領域大模型的關注;6月,哥倫比亞大學聯(lián)合上海紐約大學推出FinGPT 。在國內,7月,華為全新發(fā)布盤古大模型,金融行業(yè)大模型正是其中數(shù)個行業(yè)通用大模型之一;9月,螞蟻集團正式發(fā)布自研“螞蟻基礎大模型”,以及在此基礎上進行定制的“螞蟻金融大模型”。

此外,度小滿發(fā)布金融大模型“軒轅”,奇富科技發(fā)布“奇富GPT”,恒生電子發(fā)布“LightGPT”,“百模大戰(zhàn)”顯露硝煙。

事實上,金融行業(yè)對“模型”并不陌生。在營銷、風控、投研、客服等領域,基于機器學習驅動的建模能力已經(jīng)構成金融機構數(shù)智化轉型的基礎。但是,ChatGPT憑借其背后的大模型——本質是一個海量參數(shù)的深度學習算法,展現(xiàn)出的媲美人類水平的內容生成能力、理解能力和快速迭代能力,讓大家似乎窺見了未來AI“無所不能”的時刻。

行業(yè)進展轟轟烈烈,但真實情況可能并非如此樂觀。 

大模型潮涌

伴隨著科技公司爭相入局,金融機構跟進迅速。

郵儲銀行、興業(yè)銀行、中信銀行、江蘇銀行等已與百度展開合作;杭州銀行、臺州銀行等選擇阿里;一些國有大行與華為展開合作。比如,工行正通過盤古大模型來打造工行自己的金融大模型;建行、交行與華為當前的合作聚焦在代碼輔助、知識檢索等場景,已經(jīng)完成百億大模型部署。

剛剛過去的財報季中,工商銀行、農業(yè)銀行、中國銀行、交通銀行、招商銀行、中信銀行、興業(yè)銀行、華夏銀行、浙商銀行等9家銀行,都在半年報中明確提出正在探索大模型應用。比如,交通銀行明確提出已經(jīng)“組建GPT大模型專項研究團隊”。

騰訊云副總裁胡利明向鈦媒體App表示,“對于大模型,不同金融機構大方向是有共識的,即不管是短期還是長期,基于大模型的金融領域應用一定要積極去擁抱,如果不去擁抱一定會被淘汰。” 

從目前落地的情況看,與文本內容相關的營銷、宣傳、投研投顧是目前已經(jīng)落地的主要領域。

比如,招行信用卡基于ChatGPT撰寫宣傳稿件,寫出了“生命的舞臺上,我們都是基因的載體”等詩意十足的文案。

投研方面,業(yè)內首份采用ChatGPT撰寫的行業(yè)研究完成度頗高,這份研報介紹了當下輕醫(yī)美的崛起、中國醫(yī)美市場現(xiàn)狀及相關法律法規(guī)、合規(guī)要求,盤點了全球醫(yī)美行業(yè)主要參與者,甚至對疫情后中國和全球醫(yī)美市場進行了預測。

智能客服是另一大被看好的領域。比如,美國互聯(lián)網(wǎng)保險公司Lemonade推出了基于GPT-3技術面向用戶的銷售機器人瑪雅(AI.MAYA)。當客戶有購買保險的意圖時,只需與瑪雅約兩分鐘的簡單聊天便能識別與處理客戶信息,推薦適配的保險產(chǎn)品及報價,促成交易達成。

螞蟻集團發(fā)布的支小寶2.0和支小助兩款大模型落地產(chǎn)品同樣聚焦在客服及投研領域——前者面向投資者,可以提供行情分析、持倉診斷、資產(chǎn)配置和投教陪伴等專業(yè)服務;后者為從業(yè)人員在投研分析、信息提取、專業(yè)創(chuàng)作、商機洞察、金融工具使用等環(huán)節(jié)提供服務。

奇富科技則向鈦媒體App表示,經(jīng)過大模型陪練機器人的幫助,奇富的電銷系統(tǒng)通話時長提升了15.1%。通話時長的拉升,意味著用戶的對話體驗有了改善。 

順著這一邏輯再往上游走一步,一些金融機構已經(jīng)在嘗試利用大模型幫助進行產(chǎn)品設計。

以保險產(chǎn)品設計為例,某些險企正在嘗試利用大模型優(yōu)化風險因素識別,幫助分析健康險相關數(shù)據(jù),包括歷史賠付數(shù)據(jù)、人口統(tǒng)計和醫(yī)療資料等,從中識別出潛在的風險因素,產(chǎn)品精算人員可以更好地理解不同客戶的風險特征,并制定相應保險策略。

再往長遠觀察,大模型背后所蘊含的由AI驅動的自動化投資框架,未來可能會對投資行業(yè)產(chǎn)生較大影響和變革。比如,投資決策轉向數(shù)據(jù)與AI驅動,投資者將更多依賴于數(shù)據(jù)和模型,而非主觀判斷,這將改變投資行業(yè)的決策模式。

難以克服的“幻覺”

AI“無所不能”的時刻似乎近在咫尺,但真實情況并非如此樂觀。

在一級市場,Atom Capital通過梳理海外大語言模型+金融領域的創(chuàng)業(yè)公司之后指出,大語言模型在金融垂直場景的落地應用出現(xiàn)了“青黃不接”的局面:1,當前創(chuàng)業(yè)公司融資金額普遍較小,以100萬美金以下的種子輪居多;2,下注投資的大機構非常少;3,尚無能吸引市場注意的“明星項目”。  

在廣受關注的智能客服場景,一家頭部城商行客服部門負責人向鈦媒體App表示,“銀行客服強調規(guī)范化、制式化,目前來看大模型對于客服的提升效果有限。同時我們眼下預算有限,并不打算投入在錦上添花的事情上。”

在投研投顧場景,騰訊云副總裁胡利明則向鈦媒體App透露,“目前投研投顧的大部分嘗試還沒有出現(xiàn)明確的效果”。他提到,目前金融機構明確出效果的場景主要是客服助手和代碼助手——即提高代碼編寫效率。

“幻覺問題”是大模型在落地金融應用時被討論的最多的一個問題。

所謂“幻覺”,即大模型表現(xiàn)出的似乎具有理解和推理能力的現(xiàn)象,但實際上它們只是通過對大量數(shù)據(jù)進行模式匹配來實現(xiàn)預測。這種現(xiàn)象可能會給人一種錯覺,認為模型具有智能和理解的能力,而實際上它們只是通過統(tǒng)計和概率來進行預測。

上海市數(shù)據(jù)科學重點實驗室主任,復旦大學教授肖仰華將“幻覺”現(xiàn)象視作生成式大模型的“根本難題”。

“創(chuàng)造性是生成式大模型帶來的獨特價值,而創(chuàng)造性和追求事實之間往往存在矛盾。生成式大模型僅靠自身很難解決這一問題”。肖仰華向鈦媒體App表示。

肖仰華還提到了與“幻覺”現(xiàn)象密切關聯(lián)的缺乏忠誠度的問題,“行業(yè)中希望大模型按照我們給的規(guī)范、制度、文檔回答問題,而不是你從通用領域習得的知識回答問題(Closed QA而非Open QA),大模型因為擅長發(fā)揮創(chuàng)造,它很有可能跳出你給定的內容去胡編亂造。”

Atom Capital則認為,“幻覺問題”反映的是大語言模型與金融業(yè)存在著內生性矛盾 ——大語言模型能得到最快速應用的場景,是幻覺能作為“Feature”(優(yōu)勢)而不是“Bug“(缺點)的領域。但金融業(yè)的本質之一是對風險的精準定價與管理,基于此為客戶提供相應的產(chǎn)品與服務,以確保資產(chǎn)安全,保障投資者利益。

除了“幻覺問題”以外,大語言模型落地金融業(yè)還需要滿足其他需求。

比如,隱私需求——保護客戶賬戶信息、交易信息數(shù)據(jù)安全是機構的生命線;性能需求——大模型推理速度偏慢,但金融業(yè)常常要求實時決策;場景需求——金融領域有諸多特殊場景、特殊流程,特殊數(shù)據(jù)結構,或是特殊風險控制邏輯,一般的通用模型顯然無法直接適應這些場景;成本需求——通用大模型非常“燒錢”,僅僅是GPT-3的訓練所需算力成本就達到了1200萬美元。

逐鹿行業(yè)大模型

一個基本的判斷是:單單利用現(xiàn)在的通用大模型不足以解決以上諸多問題。

肖仰華教授建議,“當下我們要發(fā)展面向垂域的大模型,要發(fā)展通用大模型的外圍插件,要采取大模型和知識圖譜、傳統(tǒng)知識庫相結合的策略。”

與美國同業(yè)相比,中國確實普遍將目光聚焦在了針對垂域的行業(yè)大模型。騰訊、華為、螞蟻集團等都在自研通用大模型基礎上推出了金融行業(yè)大模型,度小滿、奇富科技、恒生電子等則密集發(fā)布金融行業(yè)大模型。

通用大模型過于燒錢,行業(yè)大模型則可以顯著降低成本。

AI大模型公司智譜CEO張鵬表示,“如果現(xiàn)在從頭買顯卡做大模型研發(fā),假設需要一萬張顯卡,一張顯卡十幾萬元,一次性就需要十幾億資金。并且現(xiàn)在這一賽道非常熱,有錢一時半會也買不到。”

而據(jù)鈦媒體App了解,目前金融機構與第三方公司合作私有化部署行業(yè)大模型的價格約在數(shù)千萬元級別。而金融機構如果選擇MaaS(Model as a Service)模式,開發(fā)者可以通過API調用來使用第三方公司的行業(yè)大模型功能,而不需要自己構建和訓練模型,成本將更加顯著下降。

胡利明提到,金融機構在與騰訊大模型合作時,騰訊可以基于已有行業(yè)大模型,以熱啟動的形式部署在金融機構內部,再疊加向量數(shù)據(jù)庫、導入金融行業(yè)專業(yè)數(shù)據(jù),整體訓練成本將降低到訓練大模型成本的幾十分之一甚至幾百分之一。 

行業(yè)大模型顯然也更加理解行業(yè)。中金公司在研報中形容,大模型的迭代是一場“暴力”填數(shù)據(jù)、拔規(guī)模而造就的“美學盛宴”。而小模型的訓練數(shù)據(jù)量與參數(shù)量較少,其優(yōu)勢在于“專精”,貼近真實場景(具備行業(yè)know-how),可滿足特定任務需求。

但是,行業(yè)大模型并無法改善“幻覺”現(xiàn)象。

對此,肖仰華教授提到,要“尤其注重大模型和相關技術,比如知識圖譜技術的協(xié)同”。他表示,知識圖譜技術往往擅長表達的是專業(yè)知識、私密知識,和可理解、可控的符號知識,其和大模型所表達的參數(shù)化的,不可理解的知識是一種緊密的互補關系,而不是對立關系。

對此,業(yè)內也已有所實踐。王曉航向鈦媒體App表示,螞蟻金融大模型采用了“知識圖譜與大模型相結合的雙驅動方式”。“在需要嚴謹程度更高的場景,通過已積累的金融領域知識圖譜來確保專業(yè)和嚴謹性。在投教或客服場景,會適當更放開一些,交給大模型參數(shù)知識。”王曉航表示。

同時,行業(yè)大模型往往需要處理敏感的行業(yè)數(shù)據(jù),對數(shù)據(jù)隱私和安全提出更高的要求,這一點在金融行業(yè)體現(xiàn)尤甚。

關于這一點,胡利明向鈦媒體App表示,數(shù)據(jù)同質化以及數(shù)據(jù)孤島問題的依然存在,依然在影響著模型訓練效果。“比如投研投顧方面,各家機構的數(shù)據(jù)比較同質化,與以前應用的數(shù)據(jù)源也比較類似,現(xiàn)在很難找到獨特的數(shù)據(jù)源來明顯提升模型訓練效果。”胡利明提到,期待國家層面出臺相關的具體標準和規(guī)范,使得行業(yè)和機構獲得更加明確的指引。

商業(yè)化為時尚早

技術門檻相對較低,商業(yè)化潛力更高,是行業(yè)大模型受到追捧的重要原因。

誠然,開源大大降低了數(shù)據(jù)處理與技術開發(fā)的門檻。基于大通用模型的開源,只需要使用特定行業(yè)的數(shù)據(jù)進行微調,即可產(chǎn)生“行業(yè)大模型”,而行業(yè)大模型的出現(xiàn)似乎為各個垂直領域帶來了巨大的機會。

國內金融機構對于大模型的早期探索正是主要基于彭博BloombergGPT與開源的金融大模型FinGPT,金融機構得以基于已有的開源框架進行指令微調,快速實現(xiàn)任務部署。

但目前情況正在出現(xiàn)某些變化。隨著《生成式人工智能服務管理暫行辦法》8月正式落地,傳統(tǒng)金融機構對境外開源大模型的使用愈發(fā)謹慎,逐步轉向基于境內開源大模型應用,為國內的金融行業(yè)大模型打開了更廣闊的市場空間。

但也有市場觀點認為,目前國內大量涌現(xiàn)的行業(yè)大模型可商用性比較低,并不具備真正的競爭壁壘。“技術上,因為它們大多基于相似的開源技術和通用大模型進行微調,很少有真正的技術創(chuàng)新。數(shù)據(jù)上,盡管行業(yè)數(shù)據(jù)是關鍵,但許多企業(yè)并沒有真正挖掘、整合和利用這些數(shù)據(jù)的能力,使得其微調的效果并不理想。”

恒生研究院院長、恒生電子首席科學家白碩則充分肯定了行業(yè)大模型的商用意義所在,“真正的專業(yè)能力和專業(yè)資源掌握在行業(yè)手中。?當大模型的語言能力幾近封頂時,比拼的必然是專業(yè)資源和專業(yè)能力。”

在他看來,行業(yè)大模型商用的關鍵是大模型與行業(yè)的“對接”,“行業(yè)大模型不是要把這些資源和能力復制或者嵌入到大模型里,而是要把大模型的語言能力與行業(yè)的專業(yè)資源和專業(yè)能力相對接。行業(yè)的專業(yè)資源和專業(yè)能力,才是行業(yè)自然語言的真正grounding(語義落地的根基)。”

綜合在國內金融大模型的應用接入情況,進展仍比較初步。度小滿開源的“軒轅”金融大模型宣稱已有上百家金融機構申請試用;恒生電子宣布已面向20家金融機構開啟金融大模型“LightGPT”內測;螞蟻集團 “支小助”正與螞蟻平臺合作機構內測共建。

螞蟻集團首席技術官何征宇認為,AI大模型現(xiàn)在還處于非常早期的階段,尚不足以明確的去談論商業(yè)化。同時,AI大模型的不精確性是阻礙其商業(yè)化的一大問題,“商業(yè)需要的是準確性,需要準確地衡量或者反饋價值,但AI大模型在某種意義上犧牲了精確性,而獲得了泛化能力,這需要未來探索出一個新的商業(yè)模式。”

“當前是一個技術的嬰兒期,你沒有辦法確定明天是當醫(yī)生還是當警察。”何征宇向鈦媒體App表示。 (本文首發(fā)于鈦媒體App,作者|蔡鵬程)

本文系作者 鵬程說 授權鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉載請注明出處、作者和本文鏈接。
本內容來源于鈦媒體鈦度號,文章內容僅供參考、交流、學習,不構成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點和發(fā)現(xiàn),點擊這里投稿 。創(chuàng)業(yè)或融資尋求報道,點擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評論
0 / 300

根據(jù)《網(wǎng)絡安全法》實名制要求,請綁定手機號后發(fā)表評論

登錄后輸入評論內容

快報

更多

15:50

宇信科技:2025年歸母凈利潤4.32億元,同比增長13.69%

15:50

美國多地舉行抗議示威反對特朗普政府政策

15:49

深紡織A:2025年歸母凈利潤6841.87萬元,同比下降23.44%

15:49

新華制藥:2025年歸母凈利潤2.9億元,同比下降38.32%

15:48

中國石油:2025年凈利潤1573億元,同比下降4.5%

15:47

天山鋁業(yè):2026年第一季度凈利同比預增107.92%

15:46

百邦科技:籌劃控制權變更事項,股票停牌

15:25

美軍地面戰(zhàn)數(shù)周速決方案曝光,欲復刻“42天滅伊”神話

15:24

本周新增范式智能、斯比特等4家上市輔導備案企業(yè)

15:23

本周新增寶蓋新材、雙林股份等3家境外上市備案企業(yè)

15:10

日本民眾舉行抗議集會,敦促日本政府就強闖使館事件道歉

15:07

華創(chuàng)證券:四重維度透視中國寬基指數(shù)的“中游制造”成色

15:01

國內兆瓦級液氫燃料航空發(fā)動機首次整機性能達標

14:30

河南:聚焦老年用品研發(fā)生產(chǎn)培育龍頭企業(yè)和產(chǎn)業(yè)集群,建設高標準養(yǎng)老產(chǎn)業(yè)園區(qū)

14:28

河南:到2027年養(yǎng)老服務等領域民政服務供給不斷優(yōu)化

14:02

宇樹科技王興興:具身智能GPT時刻大概還需兩到三年

14:01

阿塞拜疆首都地區(qū)降水量打破百年紀錄

13:54

蒙古國執(zhí)政黨選定總理候選人

13:32

本周南向資金凈買入251億港元,泡泡瑪特凈買入超36億港元

13:17

沙特每日700萬桶石油繞過霍爾木茲

掃描下載App