日本是一個科技大國,即使經歷了泡沫經濟破裂以後「丟失的20年」,在科技領域,尤其是應用技術研發方面,日本依然實力很強。日本的報章在報導新的科技發明時,往往喜歡用「世界首發(日文爲「世界初」)」這樣的字眼。
最近,千葉大學與NTT Com公司共同推進的「祕密計算深度學習」技術進行臨牀數據分析研究,據說就是採用了NTT「世界首發」的祕密計算深度學習技術。
那麼,祕密計算是一種什麼樣的技術呢?祕密計算是英語Secure computation的日文對應詞,漢語應該是「安全計算」。考慮到安全計算對絕大多數人來說是一個陌生的領域,在該領域日文報導更加頻繁,因此,本文直接採用日文的名稱。
祕密計算,顧名思義就是在保存資料本身私密性的前提下進行的計算。
譬如,某地區教育局想要統計所管轄的各個高中的國語與數學的平均成績,但不可以泄露學校、學科與學生姓名這樣的隱私資訊。這些隱私資訊如下圖所示,歸各個高中獨自管理。顯然不可以將這樣的列表用平文來傳送。
因此,一種變通的方法就是將各校管理的成績單資料加密,然後再輸入一個「祕密計算系統」進行統計。經過加密的成績資料上,不可能知道是哪個學校的哪個學生的成績(見下圖)。
「祕密計算系統」對加密的成績資料進行統計後,就可以得到整個地區的各學級與各科目的平均成績。該事例的「祕密計算」示意圖如下。其兩個特點爲:一、資料的演算在加密狀態下進行;二、僅對所需要的演算結果進行解密處理。這樣就可以使原始數據的隱祕性得到保存。
千葉大學醫院,是日本厚生勞動省認定的具有提供高度醫療、技術開發及研修服務的綜合醫院。該醫院臨牀研究所使用的資料,因爲包含私密性高的醫療資訊,在資料的收集、保管、分析等方面需要高水平的資訊安全。資訊共用既要因應趨於對雜異化、嚴重化的安全風險,也要滿足多個臨牀研究設施之間對資料共享的需求。千葉大學與NTT Com公司的合作就是在這樣的背景下應運而生。
該研究的目的是實施這樣一種機制:即在單一醫療設施只研究病例數限定的稀有疾病,其診療資訊等臨牀研究的私密資料對其他設施非公開的同時,建立多個設施都可以參與的「多設施共同研究」的機制。利用「祕密計算系統」,驗證從多個設施收集的臨牀研究資料,在設施之間相互隱藏的狀態下能否分析。由此,擴展千葉大學醫院的各診療科使用多個設施的臨牀研究資料實施臨牀研究必要的橫向與縱向研究。
千葉大學與NTT Com共同研究的系統構成示意圖:圖片出自千葉大學官網
透過利用「祕密計算深度學習」技術,可以在隱藏從多個設施收集的臨牀研究資料的狀態下製作AI模式,以縮短用以往的方法診斷疾病所需要的時間。另外,還可以製作輔助處方藥劑選定的AI模式,根據患者的狀態開出最合適的藥劑,從而進行抑制病情進展的研究。
從千葉大學醫院的事例可以看出,祕密計算可以做很多應用。凡是一個計算任務需要用到來自多個參與者的資料,而各個參與者又不願意(或不允許)交換或公開資料,這時,祕密計算就可派上用場。
醫療部門是涉及個人隱私較多的地方,譬如對目前收治的新冠肺炎傳染者的冶癒,如果我們想根據病人的各項資訊訓練一個模式,預測未確診者傳染新冠肺炎的機率,又要保存受診者的隱私,那麼這項工程就可以應用「祕密計算深度學習」技術。
此外,信貸、金融、拍賣等涉及私密資訊較多的業務都可以應用「祕密計算深度學習」技術,以解決既要保存隱私又要共享資料的兩難困境。
祕密計算並不是一種新鮮的技術,日本的很多通訊公司如NEC、富士通從通訊安全的角度,早就在研究該技術。但是,將祕密計算與AI的深度學習相結合並不見諸報導。所以NTT Com的「世界首發」還是有一定的含金量的。
隨着DX(數位革新)的推廣,「祕密計算與深度學習」或許會開拓一片新的應用。
供稿 / 戴維(文中圖片除千葉大學官網以外,皆爲作者製作)
編輯修改:JST客觀日本編輯部