歐盟GDPR認(rèn)證

日前,第四范式先知(Sage)企業(yè)級(jí)AI平臺(tái)完成了PrivacySealEU認(rèn)證工作程序,率先通過歐盟GDPR認(rèn)證,成為國內(nèi)第一款通過該認(rèn)證的AI平臺(tái)產(chǎn)品。

眾所周知,數(shù)據(jù)隱私保護(hù)一直是大眾和企業(yè)用戶關(guān)心的AI應(yīng)用焦點(diǎn)問題,而歐盟GDPR則是隱私保護(hù)領(lǐng)域最為權(quán)威和細(xì)致的立法,是全球個(gè)人數(shù)據(jù)保護(hù)和企業(yè)AI應(yīng)用的最高標(biāo)準(zhǔn),被稱為“史上最嚴(yán)個(gè)人數(shù)據(jù)保護(hù)法”,其通過約束信息處理行為,賦予公民對(duì)其個(gè)人數(shù)據(jù)更大的控制權(quán)。

此次先知(Sage)平臺(tái)通過歐盟GDPR認(rèn)證,在證明第四范式產(chǎn)品及隱私計(jì)算技術(shù)的數(shù)據(jù)安全性和可信任性的同時(shí),也帶來給我們一些思考,國內(nèi)的AI企業(yè)想要走出去,GDPR是一張不可或缺的入場劵和法律保障,更進(jìn)一步從行業(yè)角度來分析,眼下我們距離拿到這張門票還有多遠(yuǎn)的路要走,路又該怎么走?

“先知”完成歐盟GDPR認(rèn)證,其中蘊(yùn)含了哪些邏輯?

歐盟GDPR認(rèn)證的這條路,并不好走。

“我們一年多前就開始準(zhǔn)備相關(guān)的申請(qǐng),PrivacySealEU不同于其它標(biāo)準(zhǔn)認(rèn)證,在條款上已經(jīng)細(xì)化到具體數(shù)據(jù)流問題,GDPR的條款‘多且細(xì)’,只有在確保所有條款‘絕對(duì)合規(guī)’時(shí),對(duì)方才會(huì)給予通過,因此我們準(zhǔn)備了大量的材料,涉及產(chǎn)品架構(gòu)設(shè)計(jì)、數(shù)據(jù)處理流程、技術(shù)端和法律、管理端等方方面面。”在接受鈦媒體專訪時(shí),第四范式主任科學(xué)家涂威威對(duì)鈦媒體表示。

在談及先知平臺(tái)之所以能夠通過歐盟GDPR認(rèn)證時(shí),涂威威告訴鈦媒體,主要有以下兩個(gè)方面的原因:

其一,得益于第四范式在隱私保護(hù)領(lǐng)域的持續(xù)投入和深厚積累,第四范式很早便投入到隱私保護(hù)技術(shù)探索中,并取得了一些實(shí)質(zhì)性的成果,比如第四范式的差分隱私算法,與其它差分隱私工作相比,在獲得相同隱私保護(hù)強(qiáng)度的同時(shí),擁有著還能得到更有效的分析結(jié)果;

其二,第四范式在安全性和合規(guī)性的意識(shí)較好,自成立之初便開始服務(wù)于金融類客戶,而金融正是安全高敏感行業(yè),因而客戶對(duì)于數(shù)據(jù)隱私的要求往往比其它領(lǐng)域要高,因此第四范式也更加了解企業(yè)對(duì)于隱私保護(hù)的要求和標(biāo)準(zhǔn)。

近年來,企業(yè)逐漸認(rèn)識(shí)到了AI的價(jià)值,將其視為“數(shù)智化轉(zhuǎn)型”的利器。AI的本質(zhì)在于能更有效、更精細(xì)化地挖掘數(shù)據(jù)的價(jià)值,而挖掘數(shù)據(jù)的同時(shí),伴隨著泄露隱私的風(fēng)險(xiǎn)。因此,企業(yè)以及AI技術(shù)廠商在應(yīng)用AI的同時(shí),更加注重在流程規(guī)范、人員培訓(xùn)、產(chǎn)品設(shè)計(jì)及功能、技術(shù)等方面“把好每一道關(guān)”。

從產(chǎn)品側(cè)來看舉個(gè)簡單的例子,為了提高AI模型效果,業(yè)界有些做法是通過網(wǎng)絡(luò)上爬數(shù)據(jù)或從第三方獲得一些數(shù)據(jù)來使用。而第四范式在先知產(chǎn)品的建模技術(shù)不依賴于任何第三方數(shù)據(jù),“客戶在完成工作后,其相應(yīng)的數(shù)據(jù)也隨之銷毀,數(shù)據(jù)無痕是先知平臺(tái)的基本特性。”第四范式國際化產(chǎn)品負(fù)責(zé)人王榮興對(duì)鈦媒體補(bǔ)充到。

不僅如此,第四范式資深研究員郭夏瑋介紹說:“先知平臺(tái)從一開始的系統(tǒng)設(shè)計(jì)以及算法設(shè)計(jì)就做了很多合規(guī)性方面的準(zhǔn)備。因?yàn)槲覀兊睦砟钍菍I賦能給企業(yè),讓企業(yè)擁有AI的能力,我們提供安全合規(guī)的數(shù)據(jù)治理加上客戶提供的合規(guī)數(shù)據(jù),再基于我們自研的保護(hù)隱私的AI算法,在保護(hù)用戶隱私的同時(shí)也可實(shí)現(xiàn)優(yōu)秀的效果,這樣的理念也得到了客戶的認(rèn)可和信任。因此,我們主要集中在技術(shù)上的打磨和產(chǎn)品的迭代。

另外,先知平臺(tái)還提供數(shù)據(jù)破解保護(hù),對(duì)于用戶地址、電話、身份證號(hào)、姓名等敏感信息進(jìn)行常規(guī)的匿名化處理,同時(shí)還支持更加嚴(yán)格的防止撞庫、差分攻擊等攻擊手段的先進(jìn)數(shù)據(jù)匿名化技術(shù),所有的可訪問接口均由完善的多層權(quán)限保護(hù)系統(tǒng)來控制。值得一提的是,先知平臺(tái)無論是公有云、私有云還是私有化部署,均達(dá)到了GDPR的要求。

在隱私保護(hù)中,技術(shù)起到了哪些關(guān)鍵作用?

事實(shí)上,AI模型訓(xùn)練涉及到大量用戶數(shù)據(jù)的使用,這些數(shù)據(jù)或多或少包含了敏感信息。

然而,以往常用的加密手段并不能完全保證數(shù)據(jù)安全,攻擊者還可以對(duì)分析結(jié)果的差分攻擊以及查表撞庫等方法反推原數(shù)據(jù)。此前,卡內(nèi)基梅隆大學(xué)Latanya Sweeney教授在《簡單的人口統(tǒng)計(jì)往往能識(shí)別出人的獨(dú)特性》報(bào)告中提到,在基于美國選舉人公共注冊(cè)信息的基礎(chǔ)上,87%的美國人基于郵編、性別、出生日期即有可能被識(shí)別出個(gè)人身份。“甚至是統(tǒng)計(jì)數(shù)據(jù)也可能泄露用戶隱私”,涂威威提到,“有一種針對(duì)統(tǒng)計(jì)數(shù)據(jù)的重建攻擊,可以通過數(shù)據(jù)方發(fā)布的大量統(tǒng)計(jì)數(shù)據(jù)、模型等,反向求解重建數(shù)據(jù)信息,例如美國2010年人口普查,基于3億人口,發(fā)布50億統(tǒng)計(jì)指標(biāo),通過求解線性系統(tǒng)就可以很大程度上重建原數(shù)據(jù),早在2003年就有公開論文詳細(xì)描述了這種攻擊方法”。

在兼顧發(fā)揮AI價(jià)值以及保護(hù)隱私的情況下,有著充分理論基礎(chǔ)的差分隱私技術(shù)正在成為隱私保護(hù)以及AI領(lǐng)域的關(guān)注焦點(diǎn)。在《麻省理工科技評(píng)論》最新發(fā)布的2020“全球十大突破性技術(shù)”中,該技術(shù)位列其中。

針對(duì)于此,涂威威對(duì)鈦媒體談到,“差分隱私是一個(gè)數(shù)學(xué)上的約束定義,假設(shè)把一個(gè)操作當(dāng)成一臺(tái)機(jī)器,輸入是數(shù)據(jù),輸出是根據(jù)數(shù)據(jù)產(chǎn)生的一些結(jié)果,那么這些結(jié)果是可能泄露數(shù)據(jù)隱私的。我們所說的這臺(tái)機(jī)器滿足差分隱私,直觀上就是假如輸入數(shù)據(jù)在有限的改變情況下,輸出的改變也應(yīng)該滿足一定范圍,如果輸出改變很大,那么就容易使用類似“差分攻擊”的手段從輸出結(jié)果來竊取用戶隱私。具體的方法,是對(duì)原操作中的某些步驟,通過注入噪聲、混淆等形式,來使得操作得到差分隱私保證。然而就目前的大多數(shù)方法以及對(duì)應(yīng)的理論來看,對(duì)于隱私保護(hù)的要求越高,需要注入的噪聲強(qiáng)度越大,從而對(duì)算法效果造成嚴(yán)重負(fù)面影響。

第四范式對(duì)目前的差分隱私技術(shù)進(jìn)一步優(yōu)化,通過更好的分配隱私預(yù)算、更有效的分配噪聲等方法,做到了在保護(hù)數(shù)據(jù)隱私的同時(shí),提升分析結(jié)果的有效性。目前,該技術(shù)可廣泛應(yīng)用于數(shù)據(jù)收集、數(shù)據(jù)分析、數(shù)據(jù)發(fā)布等階段。

值得一提的是,該方法還可以直接拓展到遷移學(xué)習(xí)上來,第四范式與瑞金醫(yī)院合作的“瑞寧知糖”,便應(yīng)用了該方法,系統(tǒng)可從數(shù)據(jù)較為完善的大型醫(yī)院中遷移出有價(jià)值且受隱私保護(hù)的知識(shí),去幫助地方醫(yī)院、社區(qū)醫(yī)院、體檢中心等機(jī)構(gòu)做更加完善的醫(yī)療診斷。

更進(jìn)一步,當(dāng)前的隱私保護(hù)技術(shù)使用門檻較高,在保護(hù)隱私的前提下,多方聯(lián)合數(shù)據(jù)建模的常見做法依然需要比較多的專家人工介入到數(shù)據(jù)預(yù)處理、特征工程、模型調(diào)參當(dāng)中,第四范式也進(jìn)一步提出了保護(hù)隱私的自動(dòng)多方機(jī)器學(xué)習(xí)的方法,綜合差分隱私技術(shù)、自動(dòng)化機(jī)器學(xué)習(xí)技術(shù),減少了專家人工的介入,一方面進(jìn)一步提升了安全性,另一方面也大幅降低了隱私保護(hù)技術(shù)的使用門檻,使得廣泛落地成為可能。

同時(shí),涂威威也指出,以差分隱私為代表的隱私保護(hù)技術(shù)仍需要在理論、效果、應(yīng)用、成本等方面進(jìn)一步解決和優(yōu)化。

在隱私保護(hù)這條道路上,AI企業(yè)是否有捷徑可走?

隨著人工智能與各類行業(yè)、多個(gè)場景深度融合加速,針對(duì)數(shù)據(jù)隱私、數(shù)據(jù)安全的防護(hù)已然成為產(chǎn)品不可或缺的一環(huán)。

但隱私泄漏事件在AI圈卻屢見不鮮,就在日前,美國人臉識(shí)別創(chuàng)企Clearview AI就被爆出重大數(shù)據(jù)泄露丑聞,企業(yè)稱其整個(gè)客戶名單都被盜,包括美國警方、執(zhí)法機(jī)構(gòu)和銀行,在社會(huì)上掀起軒然大波的同時(shí),這家公司目前也面臨多起訴訟和調(diào)查。

根據(jù)相關(guān)報(bào)道稱,Clearview AI從網(wǎng)絡(luò)社交媒體上抓取了超過30億張照片,形成了龐大的生物特征信息數(shù)據(jù)庫,有600多家執(zhí)法機(jī)構(gòu)及一些私人安保公司都在使用它的人臉識(shí)別產(chǎn)品。只要上傳任何一張照片到Clearview AI的軟件,就能查到這個(gè)人在各社交媒體平臺(tái)上的照片,甚至是姓名、地址以及其他身份信息,而且這些數(shù)據(jù)還未經(jīng)過被抓取照片者本人同意,這顯然是AI產(chǎn)品不合規(guī)化發(fā)展帶來的必然結(jié)果。

眼下,國內(nèi)在數(shù)據(jù)合規(guī)方面的整體意識(shí)不斷增強(qiáng),無論是政府、企業(yè)還是大眾,都越來越重視隱私保護(hù)。這就意味著,AI企業(yè)在隱私保護(hù)和數(shù)據(jù)安全這條道路上并沒有什么捷徑可走,AI企業(yè)必須靜下心來做好產(chǎn)品本身。在涂威威看來,數(shù)據(jù)隱私、數(shù)據(jù)安全將會(huì)是接下來的行業(yè)熱點(diǎn)話題,而數(shù)據(jù)作為AI技術(shù)應(yīng)用的核心基礎(chǔ),更必須要打牢。

從某種程度上來分析,第四范式先知成為國內(nèi)首個(gè)通過GDPR認(rèn)證AI平臺(tái)對(duì)于行業(yè)來說,很有可能讓國內(nèi)AI企業(yè)對(duì)于數(shù)據(jù)隱私、數(shù)據(jù)安全的建設(shè)提上日程,而日后的AI競爭格局,也將上升到更高的維度。

(本文首發(fā)鈦媒體,作者/桑明強(qiáng))

本文系作者 桑明強(qiáng) 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請(qǐng)注明出處、作者和本文鏈接。
本內(nèi)容來源于鈦媒體鈦度號(hào),文章內(nèi)容僅供參考、交流、學(xué)習(xí),不構(gòu)成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點(diǎn)和發(fā)現(xiàn),點(diǎn)擊這里投稿 。創(chuàng)業(yè)或融資尋求報(bào)道,點(diǎn)擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評(píng)論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論

請(qǐng) 登錄后輸入評(píng)論內(nèi)容

快報(bào)

更多

2026-03-28 23:01

澤連斯基稱與中東3國達(dá)成防務(wù)合作協(xié)議,涉聯(lián)合生產(chǎn)無人機(jī)

2026-03-28 22:35

山西太原一建筑發(fā)生火災(zāi),已致1人死亡25人受傷

2026-03-28 22:26

王文濤部長發(fā)表書面致辭,支持世貿(mào)組織《電子商務(wù)協(xié)定》達(dá)成臨時(shí)實(shí)施安排

2026-03-28 21:54

40余家單位聯(lián)盟,中國最大人形機(jī)器人訓(xùn)練基地在京揭牌

2026-03-28 21:41

周鴻祎與劉慈欣在科幻大會(huì)預(yù)判:百億智能體或成新物種,AI推動(dòng)人類文明分化

2026-03-28 21:38

第五代宏光MINIEV上市,售價(jià)4.48萬-5.48萬元

2026-03-28 20:42

烏稱伊朗襲擊迪拜倉庫并致烏克蘭人傷亡消息不實(shí)

2026-03-28 20:23

3月28日新聞聯(lián)播速覽23條

2026-03-28 20:05

美國務(wù)卿和歐盟官員被曝就烏克蘭問題激烈交鋒

2026-03-28 19:44

“Token”這個(gè)詞的搜索量最高一天達(dá)到7.7萬次,比去年日均搜索量高出1850%

2026-03-28 19:39

飛捷科思發(fā)布中國首個(gè)可微分物理仿真引擎Fysics

2026-03-28 19:13

“網(wǎng)售產(chǎn)品質(zhì)量安全提升系列行動(dòng)2026”在北京啟動(dòng)

2026-03-28 19:03

國務(wù)院食安辦、市場監(jiān)管總局約談相關(guān)地方市級(jí)人民政府負(fù)責(zé)人,督辦“3?15”晚會(huì)曝光問題整改

2026-03-28 18:44

飛書 CLI 開源:AI 可直連飛書辦公套件

2026-03-28 18:36

馬來西亞說伊朗允許馬滯留油輪通行霍爾木茲海峽

2026-03-28 18:02

今年前三個(gè)月中國創(chuàng)新藥對(duì)外授權(quán)交易總額超600億美元

2026-03-28 17:39

中國和菲律賓舉行南海問題雙邊磋商機(jī)制第十一次會(huì)議

2026-03-28 17:30

印尼正式實(shí)施16歲以下社媒禁令,約7000萬人受影響

2026-03-28 17:04

美國加州禁止官員借內(nèi)幕消息在預(yù)測市場牟利

2026-03-28 17:02

北京“超現(xiàn)場”生態(tài)共同體建設(shè)暨全國覆蓋啟動(dòng)

1

掃描下載App