場(chǎng)景描述
隨著人工智能的迅猛發(fā)展,各行各業(yè)都在積極探索智能化工具賦能工作質(zhì)效的應(yīng)用方法。華發(fā)投控合規(guī)法務(wù)部秉承著創(chuàng)新為先的理念,與金科研究院進(jìn)行科技與業(yè)務(wù)的深入融合,在對(duì)AIGC應(yīng)用能力達(dá)成共識(shí)的基礎(chǔ)上,即主要是從一些重復(fù)性的、日常性的工作中解放人力,并由于其在大數(shù)據(jù)分析和決策支持方面的強(qiáng)大能力,使其能從龐大的數(shù)集中提取內(nèi)容,洞察和預(yù)測(cè)趨勢(shì),從而為人工決策提供決策依據(jù),從合規(guī)業(yè)務(wù)工作中的實(shí)際痛點(diǎn)出發(fā),在深度應(yīng)用LLMs的基礎(chǔ)能力基礎(chǔ)上,聯(lián)合開發(fā)了新的合規(guī)智能工具—華發(fā)AI小科智慧合規(guī)平臺(tái)。以實(shí)現(xiàn)業(yè)務(wù)推動(dòng)科技創(chuàng)新,科技賦能業(yè)務(wù)創(chuàng)新的良性循環(huán)。
痛點(diǎn)分析
在企業(yè)的各個(gè)業(yè)務(wù)板塊相應(yīng)合規(guī)、法務(wù)部門人員的日常合規(guī)工作開展中,無論是對(duì)內(nèi)規(guī)的制定還是對(duì)業(yè)務(wù)的合規(guī)性判斷,都高度依賴相應(yīng)外規(guī)制度的完整性和時(shí)效性,以及對(duì)內(nèi)外規(guī)的內(nèi)容掌握準(zhǔn)確度。然該場(chǎng)景下的合規(guī)工作存在下列4個(gè)共性痛點(diǎn):
一是目前公司內(nèi)外規(guī)制度內(nèi)容繁多,不但包括業(yè)務(wù)對(duì)應(yīng)法規(guī)還包括通用性法規(guī),且制度由于發(fā)布時(shí)間不同相對(duì)分散,目前由人工去整理和維護(hù)內(nèi)外規(guī)存在的投入時(shí)間長以及制度遺漏的問題。
二是合規(guī)部門在日常工作中,會(huì)高頻地被問到公司內(nèi)部的相關(guān)制度規(guī)范,此項(xiàng)工作不但需要投入專人去解答,并且由于制度的內(nèi)容較多,需花費(fèi)不少時(shí)間與精力去查找規(guī)章制度的原文,整個(gè)過程需耗費(fèi)大量的人力還有遺漏的風(fēng)險(xiǎn)。
三是外規(guī)出現(xiàn)經(jīng)常修訂或者廢止的實(shí)際情況,而公司層面維護(hù)的外規(guī)并不能判斷是同一個(gè)外規(guī)從而無法進(jìn)行實(shí)時(shí)更新維護(hù),導(dǎo)致本地外規(guī)更新不及時(shí)不能及時(shí)匹配監(jiān)管要求。
四是由于公司層面人工維護(hù)的外規(guī)更新不及時(shí),導(dǎo)致根據(jù)該外規(guī)制定的內(nèi)規(guī)也需要事后由人工篩選別和修改,無法保證內(nèi)規(guī)與最新外規(guī)一致,可能發(fā)生合規(guī)風(fēng)險(xiǎn)。
具體場(chǎng)景描述:
1)合規(guī)庫管理能力(財(cái)務(wù)公司庫為例):為解決目前公司內(nèi)外規(guī)規(guī)章制度內(nèi)容繁多,且制度由于發(fā)布時(shí)間不同相對(duì)分散,由人工去整理和維護(hù)內(nèi)外規(guī)存在的投入時(shí)間長、以及制度遺漏的問題。通過建立內(nèi)外規(guī)的法規(guī)知識(shí)庫,并通過AI去自動(dòng)獲取外規(guī)豐富知識(shí)庫內(nèi)容,對(duì)內(nèi)外規(guī)進(jìn)行分類管理。同時(shí)法規(guī)文本進(jìn)行了向量拆分,滿足對(duì)法規(guī)的快速查詢和獲取的業(yè)務(wù)需求,支持業(yè)務(wù)通過AI能力一鍵實(shí)時(shí)查詢內(nèi)外規(guī)的源文件和文檔內(nèi)容。
2)合規(guī)檢索能力(投控合規(guī)法務(wù)檢索助手為例):在投控合規(guī)法務(wù)部的制度規(guī)范性專項(xiàng)提升工作中,需要對(duì)海量外規(guī)進(jìn)行人工篩查以便對(duì)內(nèi)規(guī)進(jìn)行查漏補(bǔ)缺,通常一個(gè)文檔的檢索至少一人力需要30分鐘的時(shí)間。通過與業(yè)務(wù)方進(jìn)行詳細(xì)的需求訪談,AI小科上線外規(guī)檢索能力,支持用戶通過批量關(guān)鍵詞進(jìn)行全文檔的檢索和導(dǎo)出能力,海量文庫只需1分鐘的時(shí)間。主要功能包括支持單個(gè)牌照庫內(nèi)的文檔檢索;支持輸入單個(gè)關(guān)鍵詞進(jìn)行檢索;支持輸入多個(gè)檢索詞批量進(jìn)行檢索;支持將檢索結(jié)果導(dǎo)出到本地excel;支持在導(dǎo)出的excel內(nèi)一鍵打開PDF源文件等。
3)合規(guī)問答能力(證券外規(guī)問答為例): 為解決公司合規(guī)法務(wù)部在日常工作中,會(huì)高頻地被問到公司內(nèi)部的相關(guān)制度規(guī)范,需耗費(fèi)大量人力去重復(fù)回答的問題,并且由于制度內(nèi)容較多,需花費(fèi)不少時(shí)間與精力去查找規(guī)章制度的原文,整個(gè)過程不但需耗費(fèi)大量的人力還有遺漏的風(fēng)險(xiǎn)。由于嚴(yán)監(jiān)管口徑,證券公司合規(guī)性要求較高,合規(guī)法務(wù)同事的問詢工作相對(duì)較多,因此我們將集團(tuán)證券公司作為首個(gè)賦能業(yè)務(wù)單元進(jìn)行了合規(guī)問答的建設(shè)。
通過度應(yīng)用LLMs的基礎(chǔ)能力,利用合規(guī)數(shù)據(jù)對(duì)模型調(diào)優(yōu),建設(shè)了跨文檔跨知識(shí)庫的法規(guī)AI問答能力,證券問答助手將證券監(jiān)管外規(guī)文件建立為本地知識(shí)庫,通過對(duì)數(shù)據(jù)進(jìn)行加載和預(yù)處理、向量化等方式提取、整理相關(guān)法規(guī)資料,讓用戶可以快速搜索、解讀相關(guān)法規(guī)條款。主要功能點(diǎn)包括支持對(duì)證券合規(guī)知識(shí)庫內(nèi)的已有問題進(jìn)行回答;支持對(duì)回答內(nèi)容進(jìn)行打分并將打分結(jié)果進(jìn)行模型訓(xùn)練;支持查看答案內(nèi)容相對(duì)應(yīng)的原文條款出處并支持對(duì)條款出處打分。
問答助手的整體準(zhǔn)確率在90%左右,高效地實(shí)現(xiàn)以AI輔助人工的方式去開展此項(xiàng)工作,作為AI內(nèi)部客服解放合規(guī)同事針對(duì)相同問題反復(fù)回答的人力,賦能工作質(zhì)效。同時(shí)未來應(yīng)用于其他業(yè)務(wù)合規(guī)場(chǎng)景時(shí),只需批量進(jìn)行上傳合規(guī)文件即可自動(dòng)進(jìn)行模型調(diào)優(yōu),實(shí)現(xiàn)快速應(yīng)用和上線。
4)法規(guī)AI效力追蹤:在現(xiàn)實(shí)層面外規(guī)出現(xiàn)經(jīng)常修訂或者廢止的實(shí)際情況,而公司層面維護(hù)的外規(guī)并不能判斷是同一個(gè)外規(guī)從而無法進(jìn)行實(shí)時(shí)更新維護(hù),導(dǎo)致本地外規(guī)更新不及時(shí)不能及時(shí)匹配監(jiān)管要求。與此同時(shí)由于公司層面人工維護(hù)的外規(guī)更新不及時(shí),導(dǎo)致根據(jù)該外規(guī)制定的內(nèi)規(guī)也需要事后由人工篩選別和修改,無法保證內(nèi)規(guī)與最新外規(guī)一致,可能發(fā)生合規(guī)風(fēng)險(xiǎn)。通過AI聯(lián)網(wǎng)自動(dòng)比對(duì)監(jiān)管最新發(fā)布的外規(guī)和公司本地外規(guī)的一致性,對(duì)外規(guī)進(jìn)行持續(xù)效力追蹤并實(shí)時(shí)在公司庫自動(dòng)更新維護(hù)最新外規(guī),同時(shí)對(duì)依據(jù)該外規(guī)制定的內(nèi)規(guī)進(jìn)行AI預(yù)警,輔助相應(yīng)合規(guī)部門及時(shí)修訂內(nèi)規(guī),確保內(nèi)外規(guī)的一致性預(yù)防和降低合規(guī)風(fēng)險(xiǎn)。
解決方案
技術(shù)層面:AI小科基于LLMs的底層通用能力,使用LangChain+LLM方式搭建本地私有合規(guī)知識(shí)庫,通過鏈接多個(gè)模塊的組件形成基于已有知識(shí)庫的問答。其核心本地化知識(shí)庫的專屬問答助理構(gòu)建過程可簡單概括為四步:
一是數(shù)據(jù)加載&預(yù)處理:將數(shù)據(jù)源轉(zhuǎn)換為text,并做text split等預(yù)處理;
二是文本拆分和向量化:將文本進(jìn)行拆分,數(shù)據(jù)由Embedding模型處理;
三是召回:通過向量檢索工具Faiss等對(duì)Query相關(guān)文檔召回;
四是閱讀理解和總結(jié)答案:將Context與query傳給LLMs,由LLMs生成總結(jié)答案即AIGC。
模型調(diào)優(yōu):在Finetuning、Prompt tuning、LoRA、Prefix Tuning、Fine Tuner以及In-context learning等眾多模型微調(diào)的技術(shù)手段中,為確保業(yè)務(wù)效果達(dá)到最優(yōu)解,金科研究院不斷進(jìn)行AB驗(yàn)證,經(jīng)過多輪技術(shù)方案的調(diào)整和優(yōu)化,目前采用了Fine Tuner的方式進(jìn)行模型調(diào)優(yōu),主要流程如下:
數(shù)據(jù)準(zhǔn)備:通過問答助手或自定義方式,采集句子對(duì)并打分,形成調(diào)優(yōu)數(shù)據(jù)列表。這些數(shù)據(jù)將被整合成調(diào)優(yōu)模型所需的dataset數(shù)據(jù)集。
定時(shí)任務(wù):分布式定時(shí)任務(wù)定期掃描調(diào)優(yōu)模型dataset數(shù)據(jù)集,確保數(shù)據(jù)的新鮮度和準(zhǔn)確性。
模型加載與配置:使用uniem FineTuner工具,加載預(yù)訓(xùn)練模型至內(nèi)存,并同步加載dataset數(shù)據(jù)集。隨后,配置調(diào)優(yōu)參數(shù),如epochs、batch_size、學(xué)習(xí)率(lr)等。
模型調(diào)優(yōu):調(diào)用finetuner.run進(jìn)行模型調(diào)優(yōu),根據(jù)dataset數(shù)據(jù)集優(yōu)化模型性能。
模型保存與更新:調(diào)優(yōu)成功后,將新模型保存至臨時(shí)空間。同時(shí),備份原有模型,確保數(shù)據(jù)安全。最后,更新模型版本為最新模型。
知識(shí)庫嵌入:重新加載模型知識(shí)庫embedding,確保模型具備最新的知識(shí)信息。
整體而言,上述步驟形成了一個(gè)完整的模型自訓(xùn)練閉環(huán),并能保證模型持續(xù)優(yōu)化和更新,從而持續(xù)優(yōu)化業(yè)務(wù)效果更好賦能業(yè)務(wù)提質(zhì)增效。
成效
在能力層面AI小科智慧合規(guī)平臺(tái)打造了合規(guī)文庫、合規(guī)檢索、AI 問答的 1+3 模塊;場(chǎng)景建設(shè)層面建設(shè)了華發(fā)投控層面的合規(guī)知識(shí)庫、投控合規(guī)法務(wù)部內(nèi)外規(guī)檢索助手、證券法規(guī)問答場(chǎng)景等,助力合規(guī)風(fēng)險(xiǎn)防控前置,實(shí)現(xiàn)一線人員合規(guī)管理自動(dòng)化、智能化。
在業(yè)務(wù)成效上通過人工智能技術(shù)來降低成本并提高效率,業(yè)務(wù)單元越多地應(yīng)用人工智能技術(shù),便能更優(yōu)地優(yōu)化業(yè)務(wù)流程、提高生產(chǎn)效率并降低成本。通過AI降本增效各業(yè)務(wù)單元可以更好地利用大數(shù)據(jù)、機(jī)器學(xué)習(xí)和其他人工智能工具來提供效率優(yōu)化流程提高生產(chǎn)力。具體成效如下:
1)法規(guī)庫建設(shè)層面,分類搭建金融和類金融機(jī)構(gòu)9個(gè)合規(guī)庫(證券、期貨、保險(xiǎn)、融擔(dān)、小貸、保理等),引入法規(guī)2000多個(gè),初步完成華發(fā)金融板塊的合規(guī)平臺(tái)建設(shè)。
2)法規(guī)檢索能力層面,助力投控合規(guī)法務(wù)部的制度規(guī)范性專項(xiàng)提升工作,按照一年2次的排查頻率計(jì)算,為合規(guī)法務(wù)部一年節(jié)約1人力。
3)法規(guī)問答能力層面,證券AI合規(guī)客服為解放合規(guī)同事針對(duì)相同問題反復(fù)回答的人力,高效地實(shí)現(xiàn)以AI輔助人工的方式去開展此項(xiàng)工作,賦能業(yè)務(wù)工作質(zhì)效節(jié)約80%人力。
4)AI效力追蹤層面 解決法規(guī)維護(hù)核心痛點(diǎn):AI智慧合規(guī)平臺(tái)通過AI聯(lián)網(wǎng)自動(dòng)比對(duì)監(jiān)管最新發(fā)外規(guī)和公司本地外規(guī)的一致性,對(duì)外規(guī)進(jìn)行持續(xù)效力追蹤并實(shí)時(shí)在公司庫自動(dòng)更新維護(hù)最新外規(guī),同時(shí)對(duì)依據(jù)該外規(guī)制定的內(nèi)規(guī)進(jìn)行AI預(yù)警,輔助相應(yīng)合規(guī)部門及時(shí)修訂內(nèi)規(guī),有效解決法規(guī)維護(hù)缺失和效力無法追蹤的痛點(diǎn)。
5)技術(shù)快速應(yīng)用推廣 邊際效應(yīng)低:平臺(tái)在底座建設(shè)過程中,已完成基礎(chǔ)模型和模型調(diào)優(yōu)的方法建設(shè),通過Fine Tuner的方式形成了一個(gè)完整的模型自訓(xùn)練閉環(huán),能保證模型持續(xù)優(yōu)化和更新。因而未來應(yīng)用于其他業(yè)務(wù)合規(guī)場(chǎng)景時(shí),只需批量進(jìn)行上傳合規(guī)文件即可自動(dòng)進(jìn)行模型調(diào)優(yōu),完成場(chǎng)景快速應(yīng)用上線。
未來我們將持續(xù)對(duì)AI小科智慧合規(guī)平臺(tái)進(jìn)行全方位建設(shè),包括平臺(tái)場(chǎng)景建設(shè)、模型建設(shè)、市場(chǎng)推廣和綜合事項(xiàng)等。一是在平臺(tái)建設(shè)層面,接入華發(fā)集團(tuán)內(nèi)的金融和非金融行業(yè)合規(guī)事項(xiàng),全面建立華發(fā)集團(tuán)層面的合規(guī)管理平臺(tái);二是在平臺(tái)場(chǎng)景建設(shè)層面,逐步建設(shè)模型智能研報(bào)、智能風(fēng)控、智能投顧等其他模塊能力,打造金融行業(yè)大模型;三是在市場(chǎng)推廣層面:借助國資監(jiān)管場(chǎng)景場(chǎng)景等,沉淀產(chǎn)品能力逐步向國資體系推廣行成商業(yè)模式后,形成項(xiàng)目營收;四是在綜合業(yè)務(wù)層面:完成大模型備案和算法備案雙備案事宜,持證上崗;推進(jìn)完成專利申請(qǐng)、軟著申請(qǐng)工作以及其他課題申報(bào)等相關(guān)工作。






快報(bào)
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論
傳統(tǒng)nlp場(chǎng)景,確實(shí)很適合大模型替換。但是技術(shù)上沒什么護(hù)城河。。
這個(gè)場(chǎng)景有較大普遍性,相關(guān)大模型AI技術(shù)也成熱,可以完善后推出服務(wù)。
是個(gè)很好的應(yīng)用場(chǎng)景
技術(shù)前沿,不錯(cuò)
是痛點(diǎn)
我看行
合規(guī)那個(gè)厲害,準(zhǔn)確率達(dá)90%
這個(gè)確實(shí)厲害,效率提升很高啊
秀
優(yōu)