重磅發布 阿里云數據中臺全新產品DataTrust聚焦企業數據安全保障
簡介: DataTrust(隱私增強計算產品)是基于阿里云底層多項基礎安全能力,經過阿里云數據中臺豐富的客戶業務實踐,構建的一款為企業數據安全流通的產品。
隨著包括零售、制造、金融等多行業數字化轉型加速推進,數據的價值正在被越來越多的企業廣泛認知,國家亦出臺多項政策,明確數據要素的基礎性、戰略性地位,要求加強數據資源整合、應用于安全管理,提升數據資源價值。
同時,面對持續擴大的安全威脅維度和行業監管要求,企業對數據安全的防護力度要求也在不斷加碼,亟需一套完整的數據安全產品,實現不同場景應對的數據安全保護。
響應國家及市場要求,近日,阿里云數據中臺產品矩陣之一的隱私增強計算產品DataTrust正式對外發布。
記者了解到,DataTrust依托阿里云底層多項基礎安全能力,及阿里云數據中臺豐富的應用場景實踐,能夠在保障數據安全的前提下完成多方數據聯合分析、聯合訓練、聯合預測,實現數據價值的流通,為企業提供立足數據業務原生的數據安全流通解決方案。
可用不可見 保障數據多方計算安全
營銷投放是零售企業最常面對的商業場景之一。
零售企業選擇一個媒介渠道進行營銷投放時,為了保證相對最優投放效果,往往需要提供自身已覆蓋市場數據與渠道數據交叉計算分析,并進行模型訓練和預測,以確保此次營銷投放的確能夠觸達目標市場。
但在這個過程中,企業往往又不希望自身市場數據被媒介渠道獲悉,因此在數據處理過程中,需要有個“安全環境”,做到在數據不流通的前提下實現數據價值的流通,達到包括數據分析、匹配、分層等動作都局限在“安全環境”范圍內產生,待數據處理完成后,直接產生數據結果,以方便后續基于業務場景的直接使用。
“安全環境”的作用就在于,能夠讓企業和平臺都在無法獲悉對方基礎數據的前提下,完成數據業務分析及數據應用,做到數據的可用不可見。
而Datatrust就充當了“安全環境”角色,基于業內領先的隱私增強技術,它能夠為數據參與多方構建一個統一的數據安全融通環境,實現ID去標識化、特征標簽保護、商業數據保護等多方面目的——此外,DataTrust通過一體化的使用交互和體驗,大大降低了企業使用門檻,同時數據處理動作和流程能夠被清晰表達。
目前,DataTrust產品能力已通過阿里云數據中臺在多個行業獲得實踐,尤其是在“智能營銷”“智能廣告推薦”等場景,獲得企業極大認可。
多維核心技術 數據安全背后的多重把關
為什么DataTrust一經推出就能經受多行業不同數據安全場景挑戰?除了依靠阿里云數據中臺在零售、金融、互聯網等多個細分行業解決方案的切入外,更重要的一點還在于,其內嵌的四大核心技術,可針對不同行業數據安全標準及企業個性化數據隱私需求,給予特定匹配。
比如,零售企業在數據安全層面核心保障數據合規使用及防泄漏(隱私保護),需要充分遵守包括《網絡安全法》《電商法》《消費者保護法》等法律法規的要求;但在金融或者醫療行業,有更高的基于行業的數據安全保障標準,因此在這些行業,在數據安全技術上也必須提出更高要求。
據介紹,DataTrust現階段已擁有四大隱私增強計算核心技術。
一、可信執行環境(Trusted Execution Environment,TEE)
TEE是硬件中的一個獨立的安全環境,與操作系統并行運行。硬件本身保證TEE中代碼和數據的機密性和完整性,也就是說,TEE是硬件服務提供商應用硬件在現實世界中構造的安全計算環境。
應用TEE實現隱私增強計算的過程可以通過下圖描述。
· 步驟1:各個參與方將自己的數據x通過安全鏈路傳輸給TEE;
· 步驟2:TEE在保證機密性和完整性的條件下完成計算任務;
· 步驟3:TEE通過安全鏈路將計算結果發送給各個參與方。
目前,DataTrust應用英特爾的軟件防護擴展(Software Guard Extensions,SGX)作為TEE。
SGX是Intel CPU提供的一組指令集和內存訪問機制,應用程序可以通過這組指令集和內存訪問機制實現一個被稱為安全區(Enclave)的容器,在應用程序的地址空間中劃分出一個被保護的區域,為容器內的代碼和數據提供機密性和完整性保護,免受擁有特殊權限的惡意軟件的破壞。
二、安全多方計算(Secure Multi-Party Computation,MPC)
MPC是密碼學中的定義,意為在無可信計算方的情況下,多個參與方各自持有秘密輸入完成對某個函數的計算,但每個參與方最終只能得到計算結果和能從自己輸入和計算結果中推出的信息,其他信息均可得到保護。
安全多方計算的定義可以通過下圖描述。
DataTrust目前支持專用MPC協議隱私集合求交(Private Set Intersection,PSI)實現兩方數據的安全匹配;同時,支持上億級別輸入的PSI協議,并根據單次匹配、周期性匹配、增量匹配等實際業務場景提供不同類型PSI協議的支持。
三、聯邦學習(Federated Learning,FL)
聯邦學習是一種多個參與方在保證各自原始私有數據不出數據方定義的私有邊界的前提下,協作完成某項機器學習任務的機器學習模式。
根據隱私安全訴求與訓練效率的不同,可以通過MPC、同態加密(Homomorphic Encryption,HE)、差分隱私(定義見下)等多種方式實現聯邦學習。
DataTrust支持基于差分隱私的聯邦學習,相應技術方案在保證效果和性能的前提下,擁有安全上的理論支撐。值得注意的是,DataTrust支持的聯邦學習算法已覆蓋神經網絡和決策樹等常用算法。
四、差分隱私(Differential Privacy,DP)
DP是一種基于對數據引入隨機擾動,并從理論層面度量隨機擾動所帶來的隱私保護程度的隱私保護方法。根據隨機擾動方式的不同,DP分為在原始數據層面進行隨機擾動的本地差分隱私(Local Differential Privacy,LDP)和在計算結果層面進行隨機擾動的中心差分隱私(Central Differential Privacy,CDP)。
DataTrust在FL層面應用DP實現訓練/預測過程中的個人隱私保護,并綜合使用CDP/LDP技術,以支持不同的學習/預測任務。
需要注意的是,DataTrust的多套核心技術并非一成不變,而是能夠依據企業日益豐富的數據安全場景,進行升級更迭,同時還將繼續引入更多行業領先的隱私增強計算技術,充盈產品底層能力,“持續響應政策數據監管要求,順應市場數據安全訴求,將保障數據安全的能力全量開放給有需要的企業,將會是DataTrust未來相當長時間內的戰略目標?!盌ataTrust產品負責人如是說。
數據中臺是企業數智化的必經之路,阿里巴巴認為數據中臺是集方法論、工具、組織于一體的,“快”、“準”、“全”、“統”、“通”的智能大數據體系。
目前正通過阿里云對外輸出系列解決方案,包括通用數據中臺解決方案、零售數據中臺解決方案、金融數據中臺解決方案、互聯網數據中臺解決方案、政務數據中臺解決方案等細分場景。
其中阿里云數據中臺產品矩陣是以Dataphin為基座,以Quick系列為業務場景化切入,包括:
- Dataphin,一站式、智能化的數據構建及管理平臺;
- Quick BI,隨時隨地 智能決策;
- Quick Audience,全方位洞察、全域營銷、智能增長;
- Quick A+, 跨多端全域應用體驗分析及洞察的一站式數據化運營平臺;
- Quick Stock, 智能貨品運營平臺;
- Quick Decision,智能決策平臺;
————————————————
云棲號
閱讀排行
推薦教程
- 04-26重磅發布 阿里云數據中臺全新產品DataTrust聚焦企業數據安全保障
- 04-22亞馬遜云科技發布新功能 云數據倉庫查詢實現10倍速
- 04-22中國開通“未來互聯網試驗設施”高性能主干網
- 04-21Kyligence完成D輪7000萬美元融資
- 04-21Gartner:阿里云排名全球前三,市場份額連續五年上漲
- 04-21微軟將向云客戶提供一些商業機密 幫助降低能源消耗
- 04-20亞馬遜云科技推出基于機器學習的工業設備預測性維護服務
- 04-20IBM第一季度營收177.3億美元 云與認知軟件業務占三成
- 04-19Nacos 2.0 性能提升十倍,貢獻者 80% 以上來自阿里之外
- 04-19從前端智能化看“低代碼/無代碼”