如何打通生產中存在的數據孤島,讓數據安全有效的協作,釋放數據價值,成為所有大數據行業參與者不斷探索和思考的問題。9月11日,在2020騰訊全球數字生態大會大數據專場上,騰訊云AI平臺總監陶陽宇透露,騰訊目前正在打造聯合安全計算平臺,將安全加密技術與大數據計算、人工智能相結合,能夠有效解決跨機構跨公司之間的數據協作問題。 陶陽宇介紹,騰訊很早就提出了通用意義下的聯合安全計算的概念。技術上,騰訊一方面在分布式技術之上加入安全因子,另一方面引入硬件加速解決安全加密帶來的計算量增加的問題,最終構建出騰訊聯合安全計算平臺。 詳細來說,騰訊聯合安全計算平臺擴展了現有的大數據和AI計算框架,基于聯合計算編譯和基礎安全算子,將數據分析、數據建模的任務,翻譯成由安全算子組成的物理執行計劃,在多個數據源之間完成安全、協同的聯合計算。整個平臺提供聯合數據庫、安全求交、隱私安全查詢、聯合分析、聯合建模等計算能力,可以廣泛應用在政府機構、金融服務、廣告平臺等多種行業。 在安全方面,平臺采用了去中心化的聯邦協議,無論部署和計算,都不依賴第三方,增強了系統的安全性和實用性。系統采用Freedman多項式加密技術來確保求交時的安全性,同時還采用高強度同態加密運算。所有消息在參與方之間都是加密傳輸,沒有隱私泄露。 在性能方面,騰訊聯合安全計算平臺在設計和實現時,針對系統性能做了重點優化。例如機器學習場景,支持異步并發mini-batch訓練,加速模型收斂速度,對計算量大的同態加密也進行了優化,比如Paillier3加密能達到單線程每秒1萬次加密和1千次解密的性能。系統支持海量數據,比業界框架快5倍以上,提升效果明顯。 同時,平臺在AI建模方面支持了全棧的功能,內置LR、GBDT、DNN等多種模型。在數據分析方面,提供了多方的SQL查詢,多維表分析等功能。提供了可視化拖拽操作,大大降低了聯合計算的使用門檻。 陶陽宇透露,騰訊聯合安全計算平臺目前還是內部Alpha版本,正在計劃接下來在騰訊云的TI-ONE平臺上線聯合建模產品。事實上,平臺的兩款產品聯邦機器學習PowerFL和安全數據分析SuperSQL目前在金融、廣告等場景中實際應用并取得了不錯的成效。 以某金融服務場景為例,聯邦學習PowerFL通過平臺提供的聯合建模能力,多個數據源實現安全融合。10萬樣本50維特征,雙方的原始特征不出本地,采用聯邦邏輯回歸模型,傳輸經過同態加密后的梯度信息,最后進行聯邦預測打分,與金融業務系統對接。聯邦建模相比與單側建模,其中KS從B側原來的39.9提升到46.4,提升16,效果明顯。 另外,聯合計算大數據分析產品SuperSQL已經應用在廣告專區中,支持多方數據融合,實現更精準更有效的廣告投放,開啟了新的數據合作方式。聯合計算的技術還在推薦、風控、營銷等更多場景大規模應用。 陶陽宇表示:“騰訊聯合安全計算技術正在快速迭代中,提供典型的聯合分析、聯合建模功能。未來將聯合更多合作伙伴,實現更多場景下的數據應用和挖掘,助力業務騰飛。” |