在過去的2018年,外媒統(tǒng)計已經確認的數據泄露事件高達2,216起。數據泄露發(fā)生在各行各業(yè),從社交媒體,到酒店集團,甚至到街邊不起眼的三明治小店都不安全。
去年3月發(fā)生的facebook事件,超過8700萬條數據被泄露和濫用。4月,國外廣受歡迎的三明治連鎖店Panera Bread因網站漏洞泄露顧客信息。8月,華住旗下多個連鎖酒店開房信息數據在暗網出售,總量近5億。11月,萬豪酒店發(fā)布公告稱旗下喜達屋5億房客信息泄露,被索賠125億美元。12月底,國民購票軟件12306的470萬條用戶數據因第三方平臺而遭到泄露。
2018年,是數據泄露的灰色之年,卻啟發(fā)了各界共同關注隱私保護。
1月4日,由萬向區(qū)塊鏈董事長兼CEO肖風博士、矩陣元創(chuàng)始人兼CEO孫立林、算力智庫創(chuàng)始人燕麗共同編撰的國內首部基于MPC的隱私計算報告——《基于MPC的隱私計算:開啟數字經濟時代數據共享新商業(yè)模式》(“報告”)重磅發(fā)布。這是算力智庫繼打造國內首個專注隱私計算領域專業(yè)聯盟平臺——振金社之后,在“隱私計算”領域的又一階段性成果。

“振金社由矩陣元、算力智庫、萬向區(qū)塊鏈實驗室、Crypto Innovation School (CIS) 和上海市股份公司聯合會共同發(fā)起,希望用‘振金’這種科幻中的黑科技金屬為隱私計算保駕護航。而此次發(fā)布的隱私計算報告是對學術界和產業(yè)界最新研究成果的總結,以推動‘隱私計算’相關理論和應用快速發(fā)展,開啟數字經濟時代數據利用新商業(yè)模式”,算力智庫創(chuàng)始人兼總裁燕麗表示。
矩陣元創(chuàng)始人兼CEO孫立林認為,現在所謂的大數據本質上是小數據,因其存在于不同機構主體的數據庫中,彼此就像數據孤島,而以MPC為代表的隱私計算是數據孤島的隱形橋梁,只有隱私計算的落地才有可能讓小數據成為廣域的大數據。
該報告嚴格界定了隱私安全和隱私計算概念,梳理了以安全多方計算為代表的隱私計算理論和方法,介紹了隱私安全技術。同時,報告詳細分析了隱私計算在金融、醫(yī)療健康、交通三個細分行業(yè)的應用,介紹了隱私計算領域的典型企業(yè)及案例,并對隱私計算的未來發(fā)展趨勢做出展望。
根據中國信息通信研究院調研數據顯示,2017年我國大數據產業(yè)規(guī)模為4700億元人民幣,同比增長30.56%。未來三年,大數據產值預計將從2018年的6200億增長到2020年的超過1萬億,年復合增長率(CAGR)為17.66%,處于快速增長階段。
中國大數據市場規(guī)模(單位:億元)

數據來源:《大數據白皮書(2018)》,中國信息通信研究院。
數字經濟時代,數據已成為企業(yè)和國家具有戰(zhàn)略價值的核心資產,數據共享和流通將成為剛性業(yè)務需求,但隱私保護和數據高效流動之間的矛盾日益凸顯。隱私安全正是為解決這一矛盾而誕生,而隱私計算則是隱私安全的具體方法論。
報告提出,隱私計算是指通過技術手段實現在保護數據隱私的前提下,完成對數據的安全處理。從密碼學角度來看,隱私計算是指采用以安全多方計算和同態(tài)加密等為代表的現代密碼學技術,在保證原始數據安全隱私性的同時,實現對數據的分析計算。
隱私計算具有重要產業(yè)應用價值
報告指出,以大數據、人工智能等為代表的數字經濟時代的新興技術已經滲透到社會的方方面面,從社保、政府等部門,到金融、醫(yī)療、交通等實體行業(yè),再到電商、社交等行業(yè)領域均獲得廣泛應用,但各行各業(yè)普遍面臨著數據隱私安全導致的數據孤島現象。數據的流動和協(xié)同分析在金融、醫(yī)療健康、交通領域有極其重要的應用價值。
在金融行業(yè),大數據、人工智能技術應用主要集中在精準營銷、風險控制兩大領域。
在現實中,銀行擁有的客戶信息以交易數據,客戶自主提供數據等為主,很不全面;阢y行自身擁有的數據很難得出理想的分析結果,甚至可能得出錯誤的結論。所以銀行必須借助大量的外部數據,以彌補內部數據的不足。
但出于數據泄露及自身利益考慮,金融機構往往不愿開放自己的內部數據,尤其是核心數據。借助MPC等隱私計算進行多方數據協(xié)同計算,將徹底改變傳統(tǒng)的互聯網用戶標簽和畫像處理方式,改善大數據收集、清洗、分析模式下的營銷和風控模型,提高整體金融業(yè)的個性化服務水平。

醫(yī)療大數據應用主要體現在兩大方向:第一個方向是對傳統(tǒng)醫(yī)療的優(yōu)化。比如,提升患者到醫(yī)院就診的流程,提升臨床診療效果等。第二個方向是對傳統(tǒng)醫(yī)療的補充,覆蓋傳統(tǒng)醫(yī)療服務未滿足的市場需求,比如診數據跟蹤及反饋等個人健康管理服務。
令人遺憾的是,由于缺乏統(tǒng)籌規(guī)劃和頂層設計,在現實情況中,各地醫(yī)院信息化改造絕大多數都是獨立的信息系統(tǒng),無法進行數據共享和交易,造成研究某種疾病無法獲得全量數據,使診斷的精確性大打折扣。
在醫(yī)院體系之外,醫(yī)療健康數據的共享和交易同樣并不樂觀。一方面,藥企、保險公司等對數據的需求相對較高,主要用于縮短研發(fā)周期、提升營銷精準率等等。另一方面,醫(yī)院擁有80%藥品的流通數據、醫(yī)療活動的診斷數據以及醫(yī)保報銷的數據。
通過設置有效授權和MPC等隱私計算算法進行數據方之間的協(xié)同計算,確保各方數據都未離開本地,完全杜絕數據泄露可能的同時,實現健康記錄、疾病數據等行業(yè)數據共享。
智能交通系統(tǒng)有利于減少城市交通的擁堵問題,促進城市經濟的可持續(xù)發(fā)展,成為目前交通管理和建設的重要手段。交通系統(tǒng)一體化是智能交通系統(tǒng)非常重要一個環(huán)節(jié),在這個環(huán)節(jié)中,交通信息資源的共享成為關鍵所在。
長期以來,我國的交通行業(yè)的管理在體制上分屬不同的主管部門。部門之間的系統(tǒng)建設呈現系統(tǒng)的獨立性,多個系統(tǒng)形成了信息孤島。造成跨部門的系統(tǒng)數據共享難以打通的絕不僅僅是技術問題,更主要的是管理機制的問題。
通過設置有效授權和MPC等隱私計算算法進行數據方之間的協(xié)同計算,確保各方數據都未離開本地,完全杜絕了數據泄露可能,有效解決了智能交通行業(yè)的痛點。
從報告中明確看到,受制于數據獲取、數據質量、技術成本、法律法規(guī)等多方面因素制約,隱私計算在垂直產業(yè)應用仍處于早期階段,但已存在兩種技術路徑的技術供應商可以實現行業(yè)應用需求。一種是以矩陣元、ARPA、Enigma為代表的MPC技術路徑,另一種是以Oasis Labs、TRIAS為代表的TEE(Trusted Execution Environment,可信執(zhí)行環(huán)境)技術路徑。

矩陣元MPC技術架構
隱私計算的未來發(fā)展趨勢
算力智庫研究部負責人趙建民表示,縱觀隱私計算所有業(yè)務環(huán)節(jié),隱私信息共享和流通問題處于中后期環(huán)節(jié)。事實上,仍有諸多比如數據質量問題、數據定價問題以及隱私立法問題等前期環(huán)節(jié)同樣亟待解決。
提高原始數據質量,完善數據治理機制是當務之急
基于隱私安全技術進行數據協(xié)同計算的一個基本前提條件各參與方擁有海量數據。但是在現實中,每個參與方所擁有的數據來源不同、格式不同,往往存在數據冗余、數據缺值諸多等問題,數據質量參差不齊。提高原始數據質量,完善數據治理機制是數據共享和流通的基本前提。
針對同一數據產品進行差異化定價需要持續(xù)探索
在數據定價方面,同樣的數據,對于不同用戶,其數據價值是不一樣的,所以理應針對不同行業(yè)、不同用戶采取歧視定價。但是如何針對同樣數據產品具體確定既合理又不同的價格,需要社會各界共同持續(xù)探索。
亟待建立專注于隱私信息共享和流通的法律法規(guī)體系
在立法方面,直到今年5月25日,隨著歐盟《一般數據保護條例》(GDPR)的正式實施,全球第一部真正意義上的隱私保護立法真正落地。但其立足點都是一種“靜態(tài)”的隱私數據保護策略,并不涉及隱私數據在處理、流轉過程中的“動態(tài)”保護策略。真正專注于隱私信息共享和流通的法律法規(guī)亟待建立起來。
獲取報告全文,請點擊https://img.sli.top/uploads/imgs/20190104/c886748cd3a5892935a74f1c11991d64.pdf