免费看在线a黄视频|99爽99操日韩毛片儿|91停婷在线无码观看|日韩三级片小视频|一级黄片免费播放|欧美成人视频网站导航|亚洲日韩欧美七区|国产视频在线观看91|人成视频免费在线播放|国产精品成人在线免费观看

RAG 架構(gòu)+向量數(shù)據(jù)庫,高效構(gòu)建企業(yè)級智能知識庫應(yīng)用 | 創(chuàng)新場景

創(chuàng)新場景
為了打通西門子中國內(nèi)部的知識孤島,運(yùn)用生成式 AI 推進(jìn)組織數(shù)字化轉(zhuǎn)型,西門子攜手亞馬遜云科技在3個月內(nèi)輕松構(gòu)建了基于 Amazon SageMaker、Amazon EKS、Amazon RDS、Amazon S3、Amazon OpenSearch Service 等產(chǎn)品開發(fā)的智能對話機(jī)器人“小禹”,為企業(yè)內(nèi)部提供了更優(yōu)秀的產(chǎn)品功能與體驗(yàn),在生成式 AI 領(lǐng)域邁出可喜的一步。

場景描述

運(yùn)用新興科技更好地發(fā)掘數(shù)據(jù)價值,是西門子中國持續(xù)發(fā)力的方向。西門子中國大禹團(tuán)隊?wèi)?yīng)用大數(shù)據(jù)技術(shù)、機(jī)器學(xué)習(xí)、云技術(shù)、低代碼來組建數(shù)據(jù)分析系統(tǒng),專注于創(chuàng)新領(lǐng)域,借助 AI 能力更好地發(fā)揮數(shù)據(jù)的價值。

在構(gòu)建知識庫的過程中,大禹團(tuán)隊通過調(diào)研認(rèn)識到,長期以來企業(yè)內(nèi)部資源的檢索和調(diào)用都存在結(jié)構(gòu)散亂、檢索速度慢、交互不便等問題。由于橫跨多個不同領(lǐng)域、涉及多個不同業(yè)務(wù)單元,如若以傳統(tǒng)方式打造知識庫,這些問題將一直是橫亙在部門間的長久之痛。因此,大禹團(tuán)隊決定將大數(shù)據(jù)庫和生成式 AI 應(yīng)用于一個全新的“智能知識庫”,從根本上提升知識庫的可用性。

解決方案

由于公司體量龐大,智能數(shù)據(jù)庫的構(gòu)建需面向多個不同業(yè)務(wù)部門,勢必涉及大量的業(yè)務(wù)數(shù)據(jù)和文本數(shù)據(jù)。因此,智能知識庫的存儲架構(gòu),成為亞馬遜云科技為西門子設(shè)計智能知識庫時的首要考慮。

智能知識庫的架構(gòu)設(shè)計,實(shí)質(zhì)上是大語言模型(LLM,Large Language Model)在知識檢索領(lǐng)域如何得到充分利用的問題。亞馬遜云科技決定采取檢索增強(qiáng)生成(RAG,Retrieval Augment Generation)方式增強(qiáng)模型,使之具有來自存檔知識源的增強(qiáng)上下文的模型架構(gòu)。

最終亞馬遜云科技為大禹團(tuán)隊提供的,是一個智能知識庫暨智能會話機(jī)器人的解決方案指南,其中包括預(yù)訓(xùn)練大語言模型,Amazon OpenSearch Service 的向量數(shù)據(jù)服務(wù),以及相關(guān)系統(tǒng)集成等。該解決方案指南具備自然語言處理能力、知識庫檢索能力、甚至是以數(shù)據(jù)去訓(xùn)練大語言模型的能力,這些核心關(guān)鍵能力讓解決方案指南能實(shí)現(xiàn)目標(biāo)知識庫約 80% 功能,西門子中國根據(jù)企業(yè)內(nèi)部需求再做 20% 定制化開發(fā),最終形成完整的解決方案。

其中,最大的亮點(diǎn)在于“RAG 架構(gòu)+向量數(shù)據(jù)庫”設(shè)計:

•核心主體知識庫以向量方式構(gòu)建,能夠存儲超大規(guī)模的向量數(shù)據(jù)。通過對數(shù)據(jù)進(jìn)行向量嵌入處理,跨部門、跨業(yè)務(wù)、跨場景的數(shù)據(jù)之間也能夠進(jìn)行關(guān)系考量。而 Amazon OpenSearch Service 的 k 近鄰(kNN)插件為它提供了核心向量數(shù)據(jù)庫功能,現(xiàn)在向量嵌入可以與單個混合請求中基于文本的關(guān)鍵字組合,查詢時在幾毫秒內(nèi)就可獲得數(shù)十億向量的上下文相關(guān)響應(yīng)。

•另一方面,RAG 架構(gòu)極大地拓展了大模型的可用性。普通情況下當(dāng)知識庫新增內(nèi)容時,相應(yīng)的大模型必須進(jìn)行微調(diào),甚至是重新訓(xùn)練。而 RAG 允許對新增部分使用相同的模型處理,無需調(diào)整模型。這就相當(dāng)于知識庫在不影響訪問速度的前提下,擁有了近乎無限的可擴(kuò)展性。由向量數(shù)據(jù)庫保障的杰出性能,再加上 RAG 架構(gòu)提供的無限潛力,這就是智能會話機(jī)器人“小禹”能夠在用戶以簡單語言進(jìn)行提問的前提下,快速反饋生成式回答的秘密。

Amazon SageMaker 也為架構(gòu)的伸縮性以及大語言模型持續(xù)迭代提供了很大幫助。借助 SageMaker Endpoint 的彈性伸縮能力,系統(tǒng)可以自動按照負(fù)載調(diào)整用于實(shí)時推理的資源,保證訪問需求的同時提升整體性價比。Amazon SageMaker 上提供了豐富的模型開發(fā)和訓(xùn)練工具,保證客戶可以在云端輕松實(shí)現(xiàn)大語言模型的調(diào)優(yōu)以及測試更多不同類型的開源模型。

成效

相對于傳統(tǒng)機(jī)器人,“小禹”智能會話機(jī)器人的回答內(nèi)容不僅生成速度更快,其對搜索關(guān)鍵詞的命中率也更高,整體使用體驗(yàn)遠(yuǎn)超傳統(tǒng)機(jī)器人。西門子中國專屬智能知識庫上線后,首周就有超過 4000 位內(nèi)部用戶參與使用,超過 12000 個問題被提出并解答。作為智能知識庫,它不但解決了各業(yè)務(wù)部門之間需求相似、重復(fù)開發(fā)的問題,更以云上彈性資源和托管的 Amazon OpenSearch Service 、Amazon SageMaker 等服務(wù)節(jié)約了系統(tǒng)在運(yùn)維和擴(kuò)展方面的投入成本。

本文系作者 亞馬遜云科技 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請注明出處、作者和本文鏈接。
本內(nèi)容來源于鈦媒體鈦度號,文章內(nèi)容僅供參考、交流、學(xué)習(xí),不構(gòu)成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點(diǎn)和發(fā)現(xiàn),點(diǎn)擊這里投稿 。創(chuàng)業(yè)或融資尋求報道,點(diǎn)擊這里。
發(fā)表評論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請綁定手機(jī)號后發(fā)表評論

登錄后輸入評論內(nèi)容
  • 知識庫構(gòu)建不性感,但可能是大企業(yè)開始大規(guī)模應(yīng)用AI的最可行、也見效最快的場景

    回復(fù) 2024.09.06 · via miniapp_iphone
  • 數(shù)據(jù)架構(gòu)和治理是實(shí)現(xiàn)數(shù)字化和智能化的基礎(chǔ)

    回復(fù) 2024.09.04 · via miniapp_android

快報

更多

2026-03-28 23:01

澤連斯基稱與中東3國達(dá)成防務(wù)合作協(xié)議,涉聯(lián)合生產(chǎn)無人機(jī)

2026-03-28 22:35

山西太原一建筑發(fā)生火災(zāi),已致1人死亡25人受傷

2026-03-28 22:26

王文濤部長發(fā)表書面致辭,支持世貿(mào)組織《電子商務(wù)協(xié)定》達(dá)成臨時實(shí)施安排

2026-03-28 21:54

40余家單位聯(lián)盟,中國最大人形機(jī)器人訓(xùn)練基地在京揭牌

2026-03-28 21:41

周鴻祎與劉慈欣在科幻大會預(yù)判:百億智能體或成新物種,AI推動人類文明分化

2026-03-28 21:38

第五代宏光MINIEV上市,售價4.48萬-5.48萬元

2026-03-28 20:42

烏稱伊朗襲擊迪拜倉庫并致烏克蘭人傷亡消息不實(shí)

2026-03-28 20:23

3月28日新聞聯(lián)播速覽23條

2026-03-28 20:05

美國務(wù)卿和歐盟官員被曝就烏克蘭問題激烈交鋒

2026-03-28 19:44

“Token”這個詞的搜索量最高一天達(dá)到7.7萬次,比去年日均搜索量高出1850%

2026-03-28 19:39

飛捷科思發(fā)布中國首個可微分物理仿真引擎Fysics

2026-03-28 19:13

“網(wǎng)售產(chǎn)品質(zhì)量安全提升系列行動2026”在北京啟動

2026-03-28 19:03

國務(wù)院食安辦、市場監(jiān)管總局約談相關(guān)地方市級人民政府負(fù)責(zé)人,督辦“3?15”晚會曝光問題整改

2026-03-28 18:44

飛書 CLI 開源:AI 可直連飛書辦公套件

2026-03-28 18:36

馬來西亞說伊朗允許馬滯留油輪通行霍爾木茲海峽

2026-03-28 18:02

今年前三個月中國創(chuàng)新藥對外授權(quán)交易總額超600億美元

2026-03-28 17:39

中國和菲律賓舉行南海問題雙邊磋商機(jī)制第十一次會議

2026-03-28 17:30

印尼正式實(shí)施16歲以下社媒禁令,約7000萬人受影響

2026-03-28 17:04

美國加州禁止官員借內(nèi)幕消息在預(yù)測市場牟利

2026-03-28 17:02

北京“超現(xiàn)場”生態(tài)共同體建設(shè)暨全國覆蓋啟動

2

掃描下載App