圖片來(lái)源@pixabay

當(dāng)下,多數(shù)云計(jì)算企業(yè)的生成式AI布局,往往局限于自家訓(xùn)練的基礎(chǔ)大模型,然后招攬生態(tài)伙伴以拓寬能力邊界。

這一舉措出于企業(yè)自身商業(yè)利益考量可以理解,但是對(duì)于客戶而言,卻并不能完全接受。顯然,能夠有更多模型的選擇對(duì)客戶而言非常重要。這一方面在于,大模型創(chuàng)新的天花板還遠(yuǎn)遠(yuǎn)沒(méi)有打開(kāi),不同模型提供商的能力自然也會(huì)有參差,另一方面也跟客戶需求場(chǎng)景相關(guān),沒(méi)有任何一個(gè)模型能滿足所有場(chǎng)景,那么針對(duì)不同的用例,客戶需要有多個(gè)選擇,可能還不是一兩家,會(huì)有多個(gè)模型同時(shí)參與,去彌補(bǔ)這種參差。

不是以O(shè)penAI為中心,也不是以其他任何一個(gè)模型為中心,而是以客戶為中心。過(guò)去,亞馬遜云科技90%以上的產(chǎn)品都是從客戶需求推導(dǎo)而來(lái)。亞馬遜云科技的生成式AI戰(zhàn)略也基本跟隨這種路徑。

當(dāng)然,亞馬遜云科技也構(gòu)建有自己的基礎(chǔ)大模型Amazon Titan,于2023年4月發(fā)布。這源自亞馬遜云科技自身在人工智能技術(shù)方面的積累,比如此前知名的語(yǔ)音助手Alexa、無(wú)人機(jī)Prime Air、無(wú)人零售Amazon Go等,就用到了大量語(yǔ)音、語(yǔ)義、視覺(jué)相關(guān)的機(jī)器學(xué)習(xí)技術(shù)。

亞馬遜云科技Amazon Bedrock總經(jīng)理Atul Deo指出,如果亞馬遜云科技沒(méi)有自己的一方模型,意味著必須完全依賴合作伙伴。而從頭開(kāi)始構(gòu)建模型,其實(shí)也在給自己提供了“事必躬親”的問(wèn)題解決思路。

為此,我們能看到一個(gè)蠻有意思的現(xiàn)象:由于Amazon Bedrock提供了企業(yè)構(gòu)建生成式AI應(yīng)用程序所需的一系列功能,能夠在實(shí)現(xiàn)簡(jiǎn)化開(kāi)發(fā)的同時(shí)確保隱私性和安全性。在Amazon Bedrock上,客戶能夠找到Amazon Titan,也能夠找到當(dāng)前業(yè)內(nèi)主流的大模型版本,包括Anthropic、Stability AI、AI21 Labs、Meta、Cohere、Mixtral的模型……這個(gè)名單仍在快速擴(kuò)充。

北京時(shí)間4月23日晚間,亞馬遜云科技公布了Amazon Bedrock的多項(xiàng)功能更新,這些能力整體上為客戶提升了開(kāi)發(fā)生成式AI應(yīng)用的效率。包括:

1、全新專有模型導(dǎo)入功能推出預(yù)覽版:可將客戶的定制模型(包括使用Amazon SageMaker機(jī)器學(xué)習(xí)平臺(tái)或其他工具開(kāi)發(fā)的模型)集成至Amazon Bedrock,以完全托管的API形式進(jìn)行訪問(wèn),減少運(yùn)營(yíng)成本并加速應(yīng)用程序的開(kāi)發(fā)。Amazon Bedrock專有模型導(dǎo)入功能現(xiàn)已推出預(yù)覽版并支持三種受歡迎的開(kāi)放模型架構(gòu):Flan-T5、Llama和Mistral,并計(jì)劃未來(lái)支持更多模型。

2、模型評(píng)估功能正式可用:為客戶評(píng)估、比較和選擇適合其應(yīng)用程序的最佳模型,將評(píng)估模型的時(shí)間從幾個(gè)星期縮短到幾個(gè)小時(shí),促使客戶應(yīng)用創(chuàng)新并改善用戶體驗(yàn)。通過(guò)選擇預(yù)定義的評(píng)估標(biāo)準(zhǔn)(如準(zhǔn)確性和魯棒性)并上傳自有數(shù)據(jù)集/提示詞庫(kù),或者從內(nèi)置的、公開(kāi)可用的資源中進(jìn)行選擇。對(duì)于主觀標(biāo)準(zhǔn)或需要細(xì)致判斷的內(nèi)容,Amazon Bedrock將人工審核融入工作流程中,以根據(jù)特定應(yīng)用場(chǎng)景的指標(biāo)(如相關(guān)性、風(fēng)格和品牌聲音)對(duì)模型進(jìn)行評(píng)估。評(píng)估后還會(huì)提供評(píng)估報(bào)告,以為更多模型使用者提供參考。

3、Guardrails安全功能正式可用:在基礎(chǔ)模型的原生能力之上提供安全保護(hù),能夠阻止高達(dá)85%的有害內(nèi)容。允許客戶在單一服務(wù)中同時(shí)擁有內(nèi)置和定制的防護(hù)機(jī)制,并可與Amazon Bedrock中的所有大語(yǔ)言模型以及經(jīng)過(guò)微調(diào)的模型一起使用。可實(shí)施防護(hù)措施,去除個(gè)人信息和敏感信息、褻瀆語(yǔ)言、特定詞匯并屏蔽有害內(nèi)容。

功能更新之外,亞馬遜云科技此次還在Amazon Bedrock上提供了一系列新模型,包括正式可用的Amazon Titan Image Generator圖像生成模型、Meta Llama 3(8B和70B),以及Amazon Titan Text Embeddings V2預(yù)覽版,Cohere的Command R和Command R+三款模型也即將推出。

其中,Amazon Titan Text Embeddings V2預(yù)覽版,針對(duì)使用RAG檢索增強(qiáng)生成的應(yīng)用場(chǎng)景進(jìn)行了優(yōu)化,非常適合如信息檢索、問(wèn)答聊天機(jī)器人和個(gè)性化推薦等任務(wù)。許多企業(yè)采用RAG技術(shù),通過(guò)連接到知識(shí)源以增強(qiáng)基礎(chǔ)模型的生成結(jié)果,但問(wèn)題是運(yùn)行這些操作可能會(huì)消耗大量計(jì)算和存儲(chǔ)資源。Amazon Titan Text Embeddings V2在降低了存儲(chǔ)和計(jì)算成本的同時(shí),保持了使用RAG檢索結(jié)果的準(zhǔn)確性。

生成式AI不僅僅是大模型,同樣也需要加速芯片、數(shù)據(jù)庫(kù)、數(shù)據(jù)分析、數(shù)據(jù)安全服務(wù)等服務(wù)做支撐。從底層的加速層如加速芯片、存儲(chǔ)優(yōu)化,到中間層模型構(gòu)建工具和服務(wù),再到最上層的生成式AI相關(guān)應(yīng)用,能夠看到,亞馬遜云科技試圖為客戶提供構(gòu)建生成式AI所需的端到端技術(shù)棧。

在此次發(fā)布前夕,Atul Deo與鈦媒體進(jìn)行獨(dú)家交流,Atul分享了對(duì)生成式AI的價(jià)值判斷,技術(shù)方法論,以及Amazon Bedrock助力客戶成功等看法。Atul目前負(fù)責(zé)Amazon Bedrock的產(chǎn)品管理和工程工作。在亞馬遜云科技機(jī)器學(xué)習(xí)團(tuán)隊(duì)期間,Atul負(fù)責(zé)推出和發(fā)展了多項(xiàng)云服務(wù),包括Amazon Q、Amazon CodeWhisperer、Amazon Transcribe和Amazon Connect的Contact Lens。

觀點(diǎn)摘錄:

1.“數(shù)據(jù)衛(wèi)生這項(xiàng)工作非常具有挑戰(zhàn)性”

2.“(改變的)一切都取決于客戶以及我們?cè)噲D解決的具體問(wèn)題”

3.我們無(wú)法徹底消除幻覺(jué),但會(huì)有越來(lái)越多的前沿研究涌現(xiàn)

4.“過(guò)早地指出哪些模型被廣泛應(yīng)用還為時(shí)尚早”

5.“技術(shù)所帶來(lái)的顛覆性、對(duì)客戶體驗(yàn)的改變及其可能性都是真實(shí)存在”

以下是對(duì)話實(shí)錄,經(jīng)鈦媒體編輯整理。

鈦媒體:大公司和小而精的團(tuán)隊(duì),在當(dāng)下實(shí)現(xiàn)AI技術(shù)創(chuàng)新、產(chǎn)業(yè)賦能方面,會(huì)有哪些不同優(yōu)勢(shì)?

Atul:就針對(duì)客戶應(yīng)用部署而言,我不認(rèn)為大公司和小企業(yè)之間會(huì)存在哪些明顯差異,它們之間有很多共通之處。我們都想為大公司嘗試不同模式。當(dāng)前Data Hygiene(數(shù)據(jù)衛(wèi)生)這項(xiàng)工作非常具有挑戰(zhàn)性。當(dāng)你為較小的公司部署應(yīng)用時(shí),管理并確保模型訓(xùn)練所需的私域數(shù)據(jù)實(shí)現(xiàn)高質(zhì)量和一致性相對(duì)容易。但對(duì)于規(guī)模較大的公司,有大量差異化數(shù)據(jù),且數(shù)據(jù)更加分散,管理數(shù)據(jù)會(huì)更具挑戰(zhàn)性。另一方面,初創(chuàng)企業(yè)可以通過(guò)承擔(dān)更多的風(fēng)險(xiǎn)更快地行動(dòng),它們沒(méi)有像大型客戶這樣的現(xiàn)有客戶群,可能會(huì)出錯(cuò),也會(huì)在試錯(cuò)中快速迭代創(chuàng)新。

鈦媒體:AWS想要做GenAI這件事情,最終希望解決什么問(wèn)題?

Atul:我們正在積極探索新的可能性。無(wú)論客戶希望自主構(gòu)建模型,還是希望對(duì)現(xiàn)有模型進(jìn)行深度定制,我們希望構(gòu)建一套生成式AI堆棧,讓客戶使用到豐富且一流的工具,除此之外,還有Amazon SageMaker,基于NVIDIA提供的豐富實(shí)例類型,我們還積極研發(fā)定制芯片,涵蓋訓(xùn)練和推理兩大領(lǐng)域,以滿足更精細(xì)化的需求。

通過(guò)這一系列從底層到中間層的創(chuàng)新,我們的目標(biāo)是:讓企業(yè)內(nèi)的任何開(kāi)發(fā)人員都能夠自由構(gòu)建生成式AI應(yīng)用,而無(wú)需關(guān)注復(fù)雜的機(jī)器學(xué)習(xí)或底層基礎(chǔ)設(shè)施。我們堅(jiān)信,所提供的工具將達(dá)到行業(yè)最高水準(zhǔn),幫助他們實(shí)現(xiàn)應(yīng)用的創(chuàng)新突破。

目前,我們推出了Amazon Q business和Amazon Q developer兩個(gè)版本。Amazon Q business旨在為企業(yè)中的每位員工配備一位專業(yè)顧問(wèn),確保他們能夠快速獲得解答并高效完成任務(wù);而Amazon Q developer則專注于提升開(kāi)發(fā)人員的工作效率,為之提供即時(shí)的解答,以順利完成手頭的具體工作。這正是Amazon Q的最終目標(biāo),也是我們不懈追求的方向。

鈦媒體:對(duì)AWS自身的產(chǎn)品和業(yè)務(wù)結(jié)構(gòu)真正意義上帶來(lái)改變,可能需要多久?如何在這個(gè)領(lǐng)域建立我們的領(lǐng)導(dǎo)力?

Atul:實(shí)際上,一切都取決于客戶以及我們?cè)噲D解決的具體問(wèn)題。我們已經(jīng)看到數(shù)以萬(wàn)計(jì)的客戶正在使用SageMaker來(lái)改變其客戶體驗(yàn)。這些變化有的已經(jīng)發(fā)生,有的則需要一些時(shí)間。因此,對(duì)于何時(shí)能夠期待顯著變化,確實(shí)沒(méi)有一個(gè)固定的答案。

舉例來(lái)說(shuō),紐約證券交易所正在利用Bedrock來(lái)分析處理眾多監(jiān)管文件,并將復(fù)雜的法規(guī)內(nèi)容轉(zhuǎn)化為易于理解的語(yǔ)言,這一舉措將對(duì)最終用戶產(chǎn)生深遠(yuǎn)影響;同時(shí),電子健康記錄技術(shù)供應(yīng)商N(yùn)etsmart通過(guò)應(yīng)用相關(guān)技術(shù),成功將患者健康管理記錄的時(shí)間縮短了50%,這無(wú)疑為醫(yī)生騰出了更多時(shí)間,使他們能夠照顧到更多的病人。

今天我們已經(jīng)看到了對(duì)最終用戶的一些積極影響,但我相信這仍然是一個(gè)需要時(shí)間來(lái)逐步發(fā)展和普及的過(guò)程。然而,這一進(jìn)程的進(jìn)展速度是相對(duì)較快的,已經(jīng)形成了不可小覷的勢(shì)頭。因此,我無(wú)法確切預(yù)測(cè)是在今年年底還是明年,生成式人工智能將變得非常普遍。不過(guò),可以肯定的是,它正在逐步改變我們的世界,為我們帶來(lái)更多的便利和可能性。

鈦媒體:像RAG用于解決幻覺(jué)問(wèn)題,但有些論文里提了幻覺(jué)僅靠RAG也無(wú)法解決,在企業(yè)級(jí)應(yīng)用中,如何測(cè)評(píng)幻覺(jué)存在程度,以及在具體應(yīng)用時(shí)的影響?

Atul:盡管我們無(wú)法徹底消除這個(gè)問(wèn)題,但隨著時(shí)間的推移,我相信會(huì)有越來(lái)越多的前沿研究涌現(xiàn)。你將看到客戶在處理幻覺(jué)方面取得了更多的進(jìn)步與改進(jìn)。我可以明確地告訴你,這個(gè)問(wèn)題雖然無(wú)法完全解決,但作為我們行動(dòng)的一部分,它確實(shí)有助于減少其影響,只是無(wú)法徹底消除。隨著時(shí)間的推移,無(wú)論是模型內(nèi)部還是外部,都將出現(xiàn)創(chuàng)新,從而幫助客戶更好地應(yīng)對(duì)這種模式。

鈦媒體:模型間的協(xié)作問(wèn)題,客戶在多個(gè)模型使用時(shí),AWS目前有哪些比較好的解決思路?

Atul:對(duì)于客戶而言,這個(gè)問(wèn)題顯而易見(jiàn)。因此,我們特別推出了一項(xiàng)名為模型評(píng)估的功能,該功能已于去年12月發(fā)布,并計(jì)劃于明天全面上線。從本質(zhì)上來(lái)說(shuō),這一功能旨在幫助客戶在給定的一組提示上比較不同模型的性能,以便它們能夠選擇更符合自身特定用例的模型。

要實(shí)現(xiàn)這一目標(biāo),客戶有三種方式可供選擇。首先,他們可以在控制臺(tái)中根據(jù)給定的提示比較不同模型的性能;其次,客戶可以利用自動(dòng)化評(píng)估功能,在不同數(shù)據(jù)集上運(yùn)行不同的模型或使用標(biāo)準(zhǔn)行業(yè)數(shù)據(jù)集,從而查看哪些模型表現(xiàn)優(yōu)異;最后,客戶還可以借助公司內(nèi)部的專業(yè)團(tuán)隊(duì),以不同的方式評(píng)估模型,確定哪種模型符合他們的期望。最終,客戶將從Bedrock獲得一份詳盡的報(bào)告,根據(jù)他們?cè)O(shè)定的標(biāo)準(zhǔn),報(bào)告將展示模型的表現(xiàn)以及如何決定哪些模型對(duì)其有意義。

鈦媒體:AWS在AI倫理方面的舉措有哪些?

Atul:我們正與多個(gè)政府組織進(jìn)行廣泛合作。以我們推出的Titan圖像生成器為例,該工具具備水印功能,能夠添加不可見(jiàn)的水印,幫助客戶判斷生成的圖像是否由人工智能生成。除此之外,我們還與一些列其他組織合作,確保以負(fù)責(zé)任的方式使用人工智能。

鈦媒體:AWS在自研芯片方面的經(jīng)驗(yàn)是什么?

Atul:多年來(lái),我們一直在芯片領(lǐng)域進(jìn)行投資,且早在2015年收購(gòu)了芯片設(shè)計(jì)公司Annapurna Labs。盡管我們最初的重點(diǎn)是面向虛擬化和通用計(jì)算芯片,但隨后我們專注于開(kāi)發(fā)專門用于機(jī)器學(xué)習(xí)的AI芯片。例如,用于人工智能訓(xùn)練和推理的兩款專用芯片Amazon Trainium和Amazon Inferentia。

得益于多年來(lái)對(duì)芯片開(kāi)發(fā)的持續(xù)投資,我們有了更多機(jī)會(huì)對(duì)這些芯片進(jìn)行迭代和改進(jìn),以確保其性能和穩(wěn)定性。這些改進(jìn)恰逢其時(shí),因?yàn)樯墒饺斯ぶ悄軐?duì)計(jì)算能力的需求日益增長(zhǎng)。

鈦媒體:Bedrock上有很多模型,你是否觀察到哪個(gè)模型最受客戶歡迎,比如Meta和Anthropic?

Atul:目前,我們尚不會(huì)透露各模型提供商的具體性能表現(xiàn)。但我想說(shuō)的是,這些模型受到了廣大用戶的青睞。這主要是因?yàn)槟P偷倪x擇取決于具體的應(yīng)用場(chǎng)景,人們會(huì)根據(jù)不同的需求來(lái)選用不同的模型。因此,過(guò)早地指出哪些模型被廣泛應(yīng)用還為時(shí)尚早。(本文首發(fā)于鈦媒體APP, 作者|楊麗,編輯 | 蓋虹達(dá))  

本文系作者 TechHorizon 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請(qǐng)注明出處、作者和本文鏈接。
本內(nèi)容來(lái)源于鈦媒體鈦度號(hào),文章內(nèi)容僅供參考、交流、學(xué)習(xí),不構(gòu)成投資建議。
想和千萬(wàn)鈦媒體用戶分享你的新奇觀點(diǎn)和發(fā)現(xiàn),點(diǎn)擊這里投稿 。創(chuàng)業(yè)或融資尋求報(bào)道,點(diǎn)擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評(píng)論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論

請(qǐng) 登錄后輸入評(píng)論內(nèi)容
  • 【繼續(xù)思考】AWS構(gòu)建的大模型基礎(chǔ)設(shè)施優(yōu)勢(shì)已經(jīng)凸顯,觀點(diǎn)摘錄4還是提到“過(guò)早指出哪些模型被廣泛應(yīng)用還為時(shí)尚早”,是因?yàn)榕艿臉I(yè)務(wù)場(chǎng)景還不夠多,即數(shù)據(jù)量不夠做分析,是嗎?

    回復(fù) 2024.04.29 · via pc
  • 【內(nèi)容提煉】 AWS公布了Amazon Bedrock多項(xiàng)功能更新,包括: (1) 全新專有模型導(dǎo)入功能(預(yù)覽版) (2) 模型評(píng)估功能(正式版,正式可用);效果:將模型評(píng)估時(shí)間從幾周縮短到幾小時(shí) (3) Guardrails安全功能正式可用;效果:能夠阻85%的有害內(nèi)容 生成式AI不僅是大模型,同時(shí)需要加速芯片、數(shù)據(jù)庫(kù)、數(shù)據(jù)分析和安全等服務(wù)做支撐。從底層的加速曾如加速芯片、存儲(chǔ)優(yōu)化,到中間層模型構(gòu)建工具和服務(wù),再到最上層的生成式AI應(yīng)用,能夠看到,AWS試圖為客戶提供構(gòu)建生成式AI所需的端到端技術(shù)棧。 【繼續(xù)思考】

    回復(fù) 2024.04.29 · via pc
  • 過(guò)去,AWS九成以上產(chǎn)品都是由客戶需求推導(dǎo)而來(lái)?,F(xiàn)在,生成式AI也遵循這條路徑。希望有機(jī)會(huì),能通過(guò)具體的案例,講講具體是怎么由客戶需求推導(dǎo)而來(lái)的。

    回復(fù) 2024.04.28 · via pc
  • 大模型也還是在初級(jí)階段,需要完善

    回復(fù) 2024.04.26 · via iphone
  • 如同改革之初也是摸著石頭過(guò)河

    回復(fù) 2024.04.26 · via iphone
  • 大模型客戶需要有多個(gè)選擇是正常的訴求

    回復(fù) 2024.04.26 · via iphone
  • 現(xiàn)在的大模型是早期的,需要彌補(bǔ)完善

    回復(fù) 2024.04.26 · via android
  • 總有個(gè)過(guò)程,新車還有個(gè)磨合期呢

    回復(fù) 2024.04.25 · via iphone

快報(bào)

更多

11:48

中國(guó)首臺(tái)商用12兆伏串列加速器成功下線

11:40

美副總統(tǒng)稱無(wú)意滯留伊朗,將很快撤出

11:39

中關(guān)村兩院具身通用智能基座模型與社會(huì)模擬器等科研成果發(fā)布

11:37

清明檔新片預(yù)售票房突破2000萬(wàn)

11:30

約千人“包圍”洛杉磯政府機(jī)構(gòu)大樓,兩人被捕

10:59

中穎電子:有序推進(jìn)車規(guī)芯片研發(fā),新產(chǎn)品預(yù)期今年推出

10:50

德研究報(bào)告:中國(guó)工業(yè)數(shù)字化水平全球領(lǐng)先

10:39

訊飛醫(yī)療2025年?duì)I收增長(zhǎng)25%,虧損收窄

10:14

廣東省市場(chǎng)監(jiān)管局聯(lián)合廣州市市場(chǎng)監(jiān)管局召開(kāi)平臺(tái)企業(yè)座談會(huì)

10:10

貝殼啟動(dòng)戰(zhàn)略變革:管理者站上一線,經(jīng)紀(jì)人KPI減負(fù)

10:06

中東戰(zhàn)事致燃油短缺,越南多家航司將削減航班數(shù)量

10:06

新研究估計(jì)全球每年逾25萬(wàn)人死于腦膜炎

10:02

印尼16歲以下人群“社媒禁令”正式生效

10:01

調(diào)查顯示日本市場(chǎng)逾2500種食品4月份將漲價(jià)

10:01

西南首個(gè)商業(yè)衛(wèi)星遙感測(cè)運(yùn)控站啟用

09:25

美國(guó)全國(guó)范圍爆發(fā)反對(duì)特朗普政府集會(huì),預(yù)計(jì)超900萬(wàn)人參與,或?yàn)椤懊绹?guó)歷史上規(guī)模最大”抗議活動(dòng)

09:23

馬斯克旗下AI公司初創(chuàng)“11羅漢”全部離職

09:21

巴基斯坦稱伊朗已同意再放行20艘巴船只通過(guò)霍爾木茲海峽

09:20

法國(guó)警方挫敗美資銀行門前爆炸企圖

09:18

美軍否認(rèn)其人員在迪拜遭襲

9

掃描下載App