NEC(日本電氣株式會社)於3月25日宣佈,為推動醫療數據的二次利用,成功利用生成式AI及醫療資訊專業知識,生成了規模達15萬人的醫療合成數據。該數據為反映了日本人統計學特徵的虛擬患者數據集。NEC將通過把該數據轉換為符合國際醫療數據分析通用標準的「OMOP」格式,並與合作機構及夥伴企業進行評估,驗證未來醫療的數據二次利用流程,同時確認研究過程的有效性。
圖1 實驗概要圖(供圖:NEC)
檢查結果、處方內容以及醫療費(醫療費用明細)等各類醫療數據的應用,可分為用於個人治療與健康管理的一次利用,以及用於醫學研究與藥物研發的二次利用兩種形式。
歐洲現已出臺《歐洲醫療健康數據空間規則(EHDS)》,正在持續推進搭建統一的數據流通與應用基礎設施。在日本,政府及科研機構緊跟國際趨勢,也在加速推進醫療等數據的二次利用的相關探討。
然而,儘管日本此前已開展過各種二次利用的相關研究,但各醫療機構的數據格式與編碼體系並不統一,將其整理至可供分析狀態的「初步處理」工作耗時巨大,一直是一大課題。
此外,醫療數據一直在各醫療機構與研究項目中獨立封閉存儲,難以開展跨國數據協同應用,這也是一個課題。再加上真實數據的使用涉及嚴格的隱私保護與審批流程,這也成為阻礙研發加速推進的一大因素。
此次,NEC圍繞未來醫療數據二次利用平台的建設,開展了一項涵蓋大規模醫療合成數據生成、數據適配國際通用標準「OMOP」的格式轉換,以及模擬真實研究流程的實證研究。
在實證實驗中,通過將AI學習與合理性檢驗相結合,在不需使用真實患者資訊的情況下,成功地在短時間內合成了能夠再現日本人統計學特性(年齡構成、性別比例、病史等)的、規模達15萬人的模擬醫療數據。
同時,研究人員還生成了模擬不同數據源的合成數據,例如醫療費數據、DPC數據(符合診斷群分類制度醫院向厚生勞動省報送的住院醫療相關數據)、處方FHIR數據(依照國際標準HL7 FHIR結構化呈現處方資訊的數據)等,並將這些數據統一轉換至OMOP格式,最終確認了跨多個數據源進行綜合分析的可能性。
此外,為驗證其在科研一線的實際應用價值,研究團隊聯合行業專家,圍繞三項核心科研課題,評估了轉換為OMOP格式的數據是否能夠應用於實際研究流程。
在日本各都道府縣地方公務員的應用案例中,分析了居家療養支援介入對終末期癌症患者減少院內死亡及達成居家臨終的影響。
在急診醫學研究者的應用案例中,針對因急性心肌梗塞(AMI)入院並接受PCI(經皮冠狀動脈介入手術)的患者,驗證了相較於工作日,接受PCI手術的日期為周末或節假日的患者,心力衰竭再入院風險的差異。
在醫療政策效果分析人員的應用案例中,統計了老年人長期使用安眠藥與抗焦慮藥,以及多藥聯用的合理用藥趨勢。
上述實證實驗結果表明,經該研究轉換的數據與OMOP標準的匹配率達到98%,並成功構建了各研究所需的有效分析環境。同時,實驗得以先行驗證未來將實際醫療等數據轉換為通用標準的流程。此外,實驗結果也證明了利用醫療合成數據進行數據關聯分析,以及提前驗證了研究人員需求的有效性。
未來,NEC將探討把本次實證中獲得的技術方案,應用於各類醫療數據的二次利用基礎平台中,以此推動安全、高水平醫療數據應用,助力醫學研究的發展與國民健康水平的提升。
原文:《科學新聞》
翻譯:JST客觀日本編輯部

