數(shù)據(jù)共享與隱私矛盾:技術(shù)未滿,向現(xiàn)實(shí)妥協(xié)
大數(shù)據(jù)經(jīng)濟(jì)浪潮已撲面而來。
幾十年來,全球IT行業(yè)遵循著摩爾定律所預(yù)測的速度發(fā)展著,直到現(xiàn)在,這一定律依然發(fā)揮著效用。當(dāng)5G、云計(jì)算、物聯(lián)網(wǎng)等技術(shù)越來越成熟,海量數(shù)據(jù)的生產(chǎn)、采集、存儲(chǔ)和處理成為了現(xiàn)實(shí),智能化時(shí)代來臨,數(shù)據(jù)潛力也得到了空前釋放。
據(jù)國際數(shù)據(jù)公司和希捷公司的報(bào)告顯示,2020年中國數(shù)據(jù)總量將會(huì)超過8萬億GB,占全球數(shù)據(jù)總量達(dá)20%左右,中國將成為數(shù)據(jù)生產(chǎn)量最大、類型最豐富的國家。
數(shù)據(jù)量爆發(fā),依托數(shù)據(jù)的產(chǎn)業(yè)經(jīng)濟(jì)規(guī)模也會(huì)空前擴(kuò)大。據(jù)前瞻產(chǎn)業(yè)研究院發(fā)布報(bào)告顯示,預(yù)測在2020年我國大數(shù)據(jù)產(chǎn)業(yè)市場規(guī)模將突破萬億,2023年將增長至15700億元,同比增長15.4%。
大數(shù)據(jù)產(chǎn)業(yè)上升為國家戰(zhàn)略,數(shù)據(jù)也已成為國家、企業(yè)、個(gè)人的核心資產(chǎn),數(shù)據(jù)共享和流通成為了剛性需求。例如,人工智能的發(fā)展就依托于龐大的數(shù)據(jù)規(guī)模和數(shù)據(jù)多樣性。
然而,數(shù)據(jù)隱私保護(hù)與數(shù)據(jù)流通和使用效率之間的矛盾卻日益凸顯。2018年,歐洲GDPR數(shù)據(jù)保護(hù)條例的頒發(fā)將Facebook、Google等互聯(lián)網(wǎng)巨頭推上了風(fēng)口浪尖,數(shù)據(jù)隱私被竊取、安全泄漏等事件層出不窮。
Facebook布局加密貨幣,表明了利用互聯(lián)網(wǎng)平臺(tái)中心化搜集用戶數(shù)據(jù),實(shí)現(xiàn)平臺(tái)化的精準(zhǔn)營銷的商業(yè)模式不再可持續(xù)。
去年,騰訊進(jìn)行第三次組織架構(gòu)調(diào)整,馬化騰發(fā)朋友圈強(qiáng)調(diào),鑒于騰訊各平臺(tái)數(shù)據(jù)的用戶個(gè)人隱私性較強(qiáng),“我們更強(qiáng)調(diào)的是數(shù)據(jù)保護(hù)而非打通數(shù)據(jù)和唯算法論。”
以密碼學(xué)為核心的區(qū)塊鏈技術(shù),似乎有望打破數(shù)據(jù)的流動(dòng)壁壘,開啟數(shù)據(jù)經(jīng)濟(jì)時(shí)代新的商業(yè)模式。
在保證隱私安全的基礎(chǔ)上實(shí)現(xiàn)數(shù)據(jù)共享,已經(jīng)有越來越多的公司加入這條賽道,但技術(shù)發(fā)展的速度似乎很難適應(yīng)日益增長的商業(yè)需求。
2019年的科技圈,“數(shù)據(jù)中臺(tái)”是最火的概念之一。從去年年中到今年6月,“數(shù)據(jù)中臺(tái)”的百度指數(shù)從120一路狂奔達(dá)到了500多。人們對于數(shù)據(jù)中臺(tái)概念的理解普遍為實(shí)現(xiàn)大集團(tuán)各子公司,或者大公司各子部門之間數(shù)據(jù)交換、資產(chǎn)化和業(yè)務(wù)化的工具。
公信寶創(chuàng)始人黃敏強(qiáng)卻認(rèn)為,這一概念的內(nèi)涵似乎可以拓展到企業(yè)與企業(yè)之間的數(shù)據(jù)交換與共享,甚至可以從B端邁向C端,實(shí)現(xiàn)企業(yè)到個(gè)人的數(shù)據(jù)利用和隱私保護(hù)。
據(jù)了解,早在2017年,數(shù)據(jù)共享平臺(tái)就已經(jīng)超過了100家,但還未有去中心化的數(shù)據(jù)共享平臺(tái)出現(xiàn)。
隨后,公信寶便上線了去中心化數(shù)據(jù)交易平臺(tái)。
黃敏強(qiáng)表示,數(shù)據(jù)共享與隱私問題可以通過可信計(jì)算+區(qū)塊鏈技術(shù)的方案來解決!爱(dāng)可信計(jì)算運(yùn)行在區(qū)塊鏈上,就擁有了中立性強(qiáng)、合規(guī)性高、商務(wù)成本低的特點(diǎn),從而使得商業(yè)中的通用型訴求得到解決”。
趣鏈科技于2018年末開始搭建數(shù)據(jù)共享平臺(tái)BitXMesh,大概半年后,一期產(chǎn)品上線。據(jù)其負(fù)責(zé)人汪小益向鋅鏈接介紹,趣鏈把整個(gè)項(xiàng)目的核心技術(shù)稱為“聯(lián)邦計(jì)算”,主要分三步走。
首先是分布式計(jì)算,利用趣鏈搭建的BitXMesh平臺(tái)將模型分發(fā)到各個(gè)數(shù)據(jù)中心,這些數(shù)據(jù)中心分屬不同的機(jī)構(gòu)或企業(yè),共同配合完成一定的計(jì)算任務(wù)。
其次是分布式的安全計(jì)算,借助TEE(Trusted Execution Environment)可信性執(zhí)行環(huán)境,結(jié)合傳輸網(wǎng)絡(luò)的安全,實(shí)現(xiàn)分布式的安全計(jì)算。
最后是聯(lián)邦學(xué)習(xí),這是谷歌在近幾年提出的一類機(jī)器學(xué)習(xí)算法。趣鏈將打造聯(lián)邦學(xué)習(xí)平臺(tái),支持用戶自定義相關(guān)學(xué)習(xí)模型,在保護(hù)用戶數(shù)據(jù)隱私的前提下充分發(fā)揮分散數(shù)據(jù)的價(jià)值,構(gòu)建完善的AI模型。
與公信寶和趣鏈所采用的硬件+密碼學(xué)結(jié)合的可信計(jì)算方式不同,PlatON堅(jiān)持采用純密碼學(xué)方式實(shí)現(xiàn)數(shù)據(jù)共享過程中的隱私安全。
PlatON首席投資官唐虹剛介紹,PlatON屬于這一領(lǐng)域?qū)嵺`較為早期的“首倡者和先行者”。數(shù)據(jù)流通和共享平臺(tái)方案將于今年第四季度到明年上半年推出。“這一平臺(tái)將基于MPC為核心的隱私計(jì)算技術(shù),不依賴第三方硬件,實(shí)現(xiàn)Trustless下的數(shù)據(jù)隱私保護(hù)和數(shù)據(jù)確權(quán),且具有更高的靈活性和通用性!
唐虹剛認(rèn)為,數(shù)據(jù)共享和流通是一個(gè)非常有潛力的市場。未來,數(shù)據(jù)是繼水電煤網(wǎng)之后第五個(gè)基礎(chǔ)社會(huì)資源,預(yù)計(jì)市場規(guī)模將會(huì)超過萬億美元。
黃敏強(qiáng)和唐虹剛的預(yù)測并非虛言,除了以上項(xiàng)目還有Trias、ARPA、TEEX等。今年以來,除了這些原生態(tài)區(qū)塊鏈技術(shù)公司,互聯(lián)網(wǎng)巨頭也紛紛搶灘數(shù)據(jù)共享與隱私安全領(lǐng)域。
螞蟻金服在區(qū)塊鏈技術(shù)的隱私保護(hù)領(lǐng)域動(dòng)作不斷,投資QEDIT研究零知識(shí)證明,并提出TEE+預(yù)言機(jī)技術(shù)方案。
支付寶介紹:“支付寶十分重視區(qū)塊鏈隱私保護(hù)技術(shù)領(lǐng)域,認(rèn)為這個(gè)領(lǐng)域是未來各大區(qū)塊鏈平臺(tái)競爭力的核心體現(xiàn)。支付寶從密碼學(xué)上的同態(tài)加密、零知識(shí)證明到基于硬件的可信執(zhí)行環(huán)境(TEE)技術(shù)都進(jìn)行了全面布局,并已經(jīng)在不同的業(yè)務(wù)線上利用場景反復(fù)打磨!
百度于今年3月份上線了基于區(qū)塊鏈的數(shù)據(jù)流通平臺(tái)XuperData。百度向鋅鏈接介紹,XuperData計(jì)算方案可以實(shí)現(xiàn)數(shù)據(jù)可用不可見,在保障數(shù)據(jù)隱私和安全的前提下實(shí)現(xiàn)組織機(jī)構(gòu)信用數(shù)據(jù)共享。
“這一平臺(tái)當(dāng)前主要用于解決金融機(jī)構(gòu)以及其他組織機(jī)構(gòu)之間信息不對等問題,提升金融機(jī)構(gòu)風(fēng)控能力,減輕信貸風(fēng)險(xiǎn),從而也解決企業(yè)特別是小微企業(yè)的貸款難的問題”。
互聯(lián)網(wǎng)巨頭紛紛涌入,數(shù)據(jù)共享與隱私安全保護(hù)這一賽道,注定越來越擠。
在當(dāng)前的區(qū)塊鏈基礎(chǔ)架構(gòu)中,隱私保護(hù)功能往往存在著隱私性、可拓展性、鏈上計(jì)算三個(gè)維度的“不可能三角”,這意味著任意兩個(gè)維度都與第三者沖突。
區(qū)塊鏈的隱私協(xié)議也經(jīng)歷了CryptoNote、Zk-SNARKs、TEE、MimbleWinble、以及Zether(Quorum)、MPC等的演進(jìn),應(yīng)用范圍不斷擴(kuò)大,從單純的保護(hù)加密貨幣交易隱私升級到數(shù)據(jù)共享的流通隱私。
支付寶方介紹,“TEE+預(yù)言機(jī)技術(shù)”是因?yàn)橹Ц秾毰袛鄥^(qū)塊鏈要在產(chǎn)業(yè)大規(guī)模落地,還需要突破單條鏈的局限性,讓更多的鏈下實(shí)體參與進(jìn)來,需要擴(kuò)展出二層、三層的鏈下網(wǎng)絡(luò),與鏈上能力互補(bǔ),形成新的協(xié)作網(wǎng)絡(luò)。
百度稱,XuperData是通過區(qū)塊鏈構(gòu)建一個(gè)去中心化的數(shù)據(jù)聯(lián)盟,“TEE或者安全多方計(jì)算是數(shù)據(jù)聯(lián)盟里面支持的兩種安全計(jì)算方式,我們支持用戶選擇合適的一種來提供!
趣鏈汪小益坦言,安全多方計(jì)算,就目前的技術(shù)手段來說,對參與方的數(shù)量是有限制的,三方相對可以的,但是往三方以上再去擴(kuò)展,復(fù)雜度會(huì)呈現(xiàn)指數(shù)級上升。“我們認(rèn)為目前這兩個(gè)技術(shù)可以并行來用,選擇最優(yōu)的技術(shù)方案賦能具體應(yīng)用場景。”
就當(dāng)前所需的場景,通過多個(gè)TEE之間共同組成可信計(jì)算網(wǎng)絡(luò)達(dá)成相應(yīng)聯(lián)邦計(jì)算任務(wù)對于趣鏈來說,是更合理的一種技術(shù)路線。
由此,隱私技術(shù)協(xié)議的演化路徑反映了市場需求的方向,對于企業(yè)而言,自身商業(yè)模式選擇決定了他們所采用技術(shù)的發(fā)展路徑。
安全多方計(jì)算(MPC)的雛形可追溯到中國科學(xué)院院士、圖靈獎(jiǎng)獲得者姚期智于1982年提出的百萬富翁問題,以及后續(xù)以混淆電路為主題的系列研究,姚期智是 Conflux 的聯(lián)合創(chuàng)始人和首席科學(xué)家。
Conflux 研究總監(jiān)楊光向鋅鏈接介紹,由于適合在區(qū)塊鏈上使用的數(shù)據(jù)共享與數(shù)據(jù)隱私保護(hù)技術(shù)還不夠成熟,所以該領(lǐng)域目前不是 Conflux 項(xiàng)目最主要的突破方向。
據(jù)楊光介紹,安全多方計(jì)算、零知識(shí)證明、同態(tài)加密是以功能劃分的抽象概念,而不是具體的技術(shù)實(shí)現(xiàn)方案,每個(gè)方向都有基于不同密碼學(xué)技術(shù)的和基于 TEE 等可信硬件的多種方案。
“就像造汽車一樣,‘汽車’是按照最終實(shí)現(xiàn)的功能定義的。具體是搞電動(dòng)的還是燒油的,用哪種電池或者燒哪種油,發(fā)動(dòng)機(jī)前置還是后置,都存在很多截然不同的技術(shù)路線!
楊光認(rèn)為,其實(shí)早在比特幣誕生之前,丹麥就已經(jīng)開始大規(guī)模使用 MPC 技術(shù)解決社會(huì)問題。當(dāng)時(shí)的MPC技術(shù)主要應(yīng)用場景是只有兩個(gè)或少數(shù)幾個(gè)參與者,這跟區(qū)塊鏈上的應(yīng)用場景差距很大,因此直接把現(xiàn)有技術(shù)搬到區(qū)塊鏈上必然會(huì)水土不服。
零知識(shí)證明技術(shù)也有類似的問題。因?yàn)榱阒R(shí)證明是基于交互式證明完成的,需要證明者和驗(yàn)證者之間一來一回的頻繁互動(dòng)才能向驗(yàn)證者完成證明。但是在區(qū)塊鏈的應(yīng)用場景下,不但難以進(jìn)行多輪交互,往往還要求證明比較簡短并且可以被任何第三方(而不僅僅驗(yàn)證者自己)公開驗(yàn)證。
按照當(dāng)前的研究水平,采用適合區(qū)塊鏈的實(shí)現(xiàn)方案會(huì)提高使用成本,大部分企業(yè)會(huì)選擇在鏈下進(jìn)行交互運(yùn)算,只把最終結(jié)果上鏈完成結(jié)算。
在技術(shù)尚未發(fā)展成熟的條件下,這也不失為一種可行的隱私保護(hù)方案,但這樣一來,隱私安全性也就打了折扣。
至于TEE硬件+密碼學(xué)的方式,楊光認(rèn)為,這個(gè)方案本身非常簡單,唯一的缺點(diǎn)在于需要用戶相信硬件廠商等中心化節(jié)點(diǎn)!暗珜(shí)際上,任何企業(yè)或者機(jī)構(gòu)的可靠性都比不上完備的數(shù)學(xué)證明加上合理的安全性假設(shè)。想要正面攻破有嚴(yán)格證明的密碼學(xué)方案,需要解決某些很難的數(shù)學(xué)難題,這比搞定一家企業(yè)難多了!
因此,純密碼學(xué)技術(shù)應(yīng)用,目前不大可能實(shí)現(xiàn)大規(guī)模的商業(yè)化應(yīng)用,而TEE+密碼學(xué)的使用,只是技術(shù)為現(xiàn)實(shí)應(yīng)用場景需求的妥協(xié)罷了。
技術(shù)未滿,但需求規(guī)模卻不斷增長,而且需求緊急程度還不一樣。
汪小益認(rèn)為,金融屬于信息化程度較高的應(yīng)用場景,其次是政務(wù)、醫(yī)療。同時(shí),物聯(lián)網(wǎng)在全面鋪開的情況下對隱私安全的需求越來越迫切,因此數(shù)據(jù)共享與隱私安全在這些領(lǐng)域呈現(xiàn)較強(qiáng)、較緊急的需求。
在趣鏈和PlatON 的規(guī)劃中,區(qū)塊鏈技術(shù)與人工智能技術(shù)的結(jié)合使用是未來可預(yù)見的發(fā)展方向。
唐虹剛則稱,未來PlatON會(huì)以隱私AI為重點(diǎn)發(fā)展方向,基于隱私計(jì)算實(shí)現(xiàn)的AI算法分析,可消除數(shù)據(jù)源之間的交互壁壘,通過數(shù)據(jù)的多樣性來提升AI算法的處理能力與數(shù)據(jù)覆蓋維度。
由最初的加密貨幣隱私協(xié)議向數(shù)據(jù)共享與隱私安全保護(hù)領(lǐng)域拓展,區(qū)塊鏈的隱私協(xié)議經(jīng)歷了一系列的技術(shù)演進(jìn),在金融、政務(wù)、醫(yī)療、物聯(lián)網(wǎng)應(yīng)用場景需求不斷爆發(fā)的今天,隱私安全計(jì)算的技術(shù)實(shí)現(xiàn)似乎心有余而力不足。
然而,正如吳軍在《浪潮之巔》中對蘋果公司的評論:“喬布斯改變世界的發(fā)明絕非一時(shí)的靈感所致,而是數(shù)十年的深思熟慮和經(jīng)驗(yàn)積累......大部分產(chǎn)品經(jīng)理之所以做不出改變世界的產(chǎn)品,是因?yàn)樗麄冎豢匆娏顺晒φ咦詈蟮呐R門一腳,而忽視了人的長期思考。
數(shù)據(jù)共享是趨勢,隱私安全是保障。如今技術(shù)未滿,不能完全解決兩者之間的矛盾,數(shù)據(jù)隱私安全領(lǐng)域只能做出“妥協(xié)”,但隨著技術(shù)不斷迭代,臨門一腳的那天或許已不遠(yuǎn)了。
發(fā)表評論
登錄 | 注冊