基于TEE的隐私計算應用模型
  • 作者:dylbc
  • 發(fā)表時間:2021-07-13 14:15
  • 來源:未知

一、背景

近日數據安全問題再次成(chéng)爲關注焦點,從對(duì)“滴滴出行”、運滿滿”、“貨車幫”、“BOSS直聘”啓動網絡安全審查,到直接下架“滴滴企業版”等25款App,再到監管部門針對(duì)數據安全問題陸續發(fā)文及出台相關政策法規:
  • 中共中央辦公廳、國(guó)務院辦公廳公開(kāi)發(fā)布《關于依法從嚴打擊證券違法活動的意見》。意見提出,完善數據安全、跨境數據流動、涉密信息管理等相關法律法規
  • 國(guó)家互聯網信息辦公室關于《網絡安全審查辦法(修訂草案征求意見稿)》公開(kāi)征求意見,辦法規定掌握超過(guò)100萬用戶個人信息的運營者赴國(guó)外上市,必須向(xiàng)網絡安全審查辦公室申報網絡安全審查。
  • 央行要求網絡平台的個人信息與金融機構全面(miàn)“斷直連”,平台機構在與金融機構開(kāi)展引流、助貸、聯合貸等業務合作中,不得將(jiāng)個人主動提交的信息、平台内産生的信息或從外部獲取的信息以申請信息、身份信息、基礎信息、個人畫像評分信息等名義直接向(xiàng)金融機構提供。
  • 深圳發(fā)布《深圳經(jīng)濟特區數據條例》,這(zhè)是國(guó)内數據領域首部基礎性、綜合性立法。《條例》堅持個人信息保護與促進(jìn)數字經(jīng)濟發(fā)展并重,對(duì)市民深惡痛絕的APP“不全面(miàn)授權就(jiù)不讓用”、大數據“殺熟”、個人信息收集任性、強制個性化廣告推薦等問題說“不”,并給予重罰。
其實在此之前,網絡安全法、數據安全法、個人信息保護法(草案)等法規已發(fā)布,但爲何如此多的企業甚至互聯網巨頭依然視而不見、铤而走險?利用數據獲取利益當然是誘因,另一方面(miàn)也說明解決數據安全問題還(hái)缺乏低成(chéng)本、高效率技術手段,如何在保護數據隐私的情況下發(fā)揮數據價值是一個技術難題。除個人數據隐私保護外,企業和機構之間的數據協作更具挑戰。據IDC預測,2025年全球大數據規模將(jiāng)增長(cháng)至163ZB,但據統計98%的企業數據都(dōu)存在數據孤島問題,各自存儲難以流通,使得數據價值無法得到充分利用。
 

二、基于TEE的隐私計算技術

隐私計算作爲近年來興起(qǐ)的面(miàn)向(xiàng)隐私信息全生命周期保護的計算方法,將(jiāng)爲解決數據安全問題帶來根本性轉變。隐私計算是一種(zhǒng)由兩(liǎng)個或多個參與方聯合計算的技術和系統,參與方在不洩露各自數據前提下通過(guò)協作對(duì)他們的數據進(jìn)行聯合機器學(xué)習和聯合分析。隐私計算技術近年來在金融、醫療、政務等多個場景開(kāi)始陸續落地應用,2021年被(bèi)認爲是隐私計算應用元年。隐私計算伴随著(zhe)密碼技術、硬件技術的發(fā)展加速商業化,其技術路徑也處于高速的演進(jìn)和變化狀态,其中聯邦學(xué)習、多方安全計算和可信計算(TEE)是當前主流技術路徑,也是當下産品化的主要方向(xiàng),而可信計算(TEE)是發(fā)展最早、技術相對(duì)最成(chéng)熟、當前最具可行性的隐私計算技術
TEE全名爲可信執行環境(Trusted Execution Environment)是計算平台上由軟硬件方法構建的一個安全區域,可保證在安全區域内加載的代碼和數據在機密性和完整性方面(miàn)得到保護。其目标是确保一個任務按照預期執行,保證初始狀态的機密性、完整性,以及運行時狀态的機密性、完整性。
TEE相關标準組織的成(chéng)立:1999年,康柏、HP、IBM、Intel、微軟等企業發(fā)起(qǐ)成(chéng)立了可信計算平台聯盟TCPA(Trusted Computing Platform Alliance)該組織于2003年改組爲可信計算組織TCG,并制定了關于可信計算平台、可信存儲和可信網絡鏈接等一系列技術規範。
TEE的實現:2009年OMTP(Open Mobile Terminal Platform,開(kāi)放移動終端平台)率先提出了一種(zhǒng)雙系統解決方案:即在同一個智能(néng)終端下,除了多媒體操作系統外再提供一個隔離的安全操作系統,這(zhè)一運行在隔離的硬件之上的隔離安全操作系統用來專門處理敏感信息以保證信息的安全。
TEE相關标準的規範:2011年GlobalPlatform(全球最主要的智能(néng)卡多應用管理規範的組織,簡稱爲GP)從2011年起(qǐ)開(kāi)始起(qǐ)草制定相關的TEE規範标準,并聯合一些公司共同開(kāi)發(fā)基于GP TEE标準的可信操作系統。因此,如今大多數基于TEE技術的Trust OS都(dōu)遵循了GP的标準規範。
TEE相關的芯片廠商:在國(guó)外 ARM公司、Intel和AMD公司分别于2006、2015和2016年各自提出了硬件虛拟化技術TrustZone、 Intel SGX和AMD SEV技術及其相關實現方案,在國(guó)内由中關村可信計算産業聯盟2016年發(fā)布TPCM可信平台控制模塊,爲國(guó)産化可信執行環境TEE技術的發(fā)展起(qǐ)到了指導作用,國(guó)内芯片廠商兆芯、海光分别在2017年和2020年推出了支持可信執行環境技術ZX-TCT、海光CSV(ChinaSecurity Virtualization)。
TEE存在以下技術特點:
(1)隔離性:X86架構的隔離機制從Intel 80286處理器開(kāi)始,Intel提出了CPU的兩(liǎng)種(zhǒng)運行模式,并且逐步衍生出後(hòu)來的不同的特權界别,再後(hòu)來提出了安全區域更小的SGX機制實現可信執行環境TEE。同樣(yàng)的,ARM架構通過(guò)TrustZone技術實現了相關軟硬件的隔離性,實現安全世界與非安全世界的隔離。TEE通過(guò)隔離的執行環境,提供一個執行空間,該空間有更強的安全性,比安全芯片功能(néng)更豐富,提供其代碼和數據的機密性和完整性保護。
(2)軟硬協同性:雖然标準定義可以通過(guò)軟件方式或硬件方式實現TEE,但實際生産場景下,行業内更多通過(guò)軟硬結合的方式進(jìn)行安全性的保障與支持。
(3)富表達性:TEE與單純的安全芯片或純軟件的密碼學(xué)隐私保護方案相比支持的上層業務表達性更強,由于隻需要定義好(hǎo)業務層面(miàn)隐私區域和非隐私區域的邏輯劃分,而不會(huì)對(duì)定義隐私區域内的算法邏輯的語言有可計算性方面(miàn)的限制(圖靈完備的)。同時由于TEE已經(jīng)提供了”安全黑盒“,安全區域内數據無需進(jìn)行密态運算,從而支持更多的算子及複雜算法。
可信計算(TEE)相對(duì)于安全多方計算和聯邦學(xué)習等技術路線的優劣勢如下:
可信計算(TEE)優勢
  • 可信區域内可支持多層次、高複雜度的算法邏輯實現。
  • 運算效率高,相較于明文計算僅有3-4倍損耗,相比MPC及聯邦學(xué)習100+倍的運算損耗具有一定的優勢。
  • 能(néng)夠應對(duì)惡意攻擊模型下的攻擊手段,通過(guò)可信度量的方式保證TEE的運行邏輯的可信及可度量性。
可信計算(TEE)劣勢
  • 方案實現依賴底層硬件架構,更新升級需要同步進(jìn)行軟硬件升級。
  • 不同廠商的TEE技術互聯互通方面(miàn)有待加強形成(chéng)更統一的生産級行業标準與事(shì)實标準。
 

三、基于TEE的隐私計算産品架構

鼎鏈數科作爲一家新型國(guó)産密碼基礎設施和服務提供商,正在積極布局隐私計算領域,研發(fā)基于TEE的隐私計算産品,并在政務數據開(kāi)放、醫療數據共享等領域進(jìn)行應用探索。

(基于TEE的隐私計算平台架構)
基于TEE的隐私計算平台由下至上分爲4層:
TEE硬件基礎設施層:其核心支持TEE的芯片。
密碼技術層:TEE在進(jìn)行遠程證明、數據密封、安全通信時需用到多種(zhǒng)密碼技術,包括非對(duì)稱密碼算法、摘要算法、簽名驗證,以及一些新型密碼協議。
TEE技術服務組件層:這(zhè)是平台核心層,主要包括遠程證明、可信信道(dào)、數據密封、LibOS等核心技術,以及分布式服務調度、聯合建模、隐私策略管理、監管審計等功能(néng)組件。
應用層:TEE因其較強的算法通用性和較小的性能(néng)損失,基于TEE的隐私計算平台可用于政務數據開(kāi)放、聯合風控、聯合營銷、醫療數據共享、數據資産交易等多種(zhǒng)場景。
 

四、基于TEE的隐私計算應用模型

典型應用模型如下,通常有多個數據節點作爲參與方(可同時爲數據提供方和數據使用方,也可爲其中一方),由可信的第三方作爲隐私計算平台服務方。
(基于TEE的隐私計算應用模型)
隐私計算簡要過(guò)程:服務平台通過(guò)聯合建模的方式,將(jiāng)計算模型下發(fā)到各數據節點。數據節點先對(duì)本地原數據進(jìn)行可信計算和加密處理,然後(hòu)將(jiāng)密文通過(guò)可信信道(dào)傳輸到服務平台,服務平台對(duì)各節點的數據進(jìn)行聯合計算,計算完成(chéng)後(hòu)將(jiāng)結果加密回傳給數據節點,同時服務平台銷毀本地計算數據。
結語:在市場和政策雙重驅動下,數據安全問題迫在眉睫。基于TEE隐私計算技術相對(duì)于安全多方計算和聯邦學(xué)習具有更強的算法通用性、更低的性能(néng)消耗(明文計算的3-4倍)、更好(hǎo)的抗攻擊能(néng)力,將(jiāng)可能(néng)率先應用于計算邏輯複雜、數據量大、時效性強的需求場景,是目前實現“數據可用不可見、數據不動模型動”的最容易落地的方式。