很多疾病的冶癒藥物都是靶向蛋白質的,但很多時候會因爲不清楚蛋白質的三維構造而導致新藥研究受阻。九州大學生體防禦醫學研究所的中山敬一主任教授、哈佛醫學院生物系統分類學部門的清水秀幸研究員以及北海道大學人獸共通傳染症國際共同研究所的澤洋文教授組成的研究團隊,開發出了LIGHTHOUSE(Lead Identification with GrapH-ensemble network for arbitrary Targets by Harnessing Only Underlying primary SEquence)人工智慧系統,能夠透過胺基酸序列,而不是利用致病蛋白質的三維結構探索冶癒藥物。研究團隊利用該系統發現了抑制參與癌症惡化的酶——PPAT蛋白化合物,此外還從現有藥物中發現了有望冶癒新冠電腦病毒的藥物。相關成果已在bioRxiv上公開。
很多藥物都是透過與蛋白質結合抑制或激活其功能來發揮作用的。人活體內大約有2萬種蛋白質,雖然胺基酸序列(一維結構)已經明確,但三維結構有很多都是未知的。地球上的低分子化合物的數量據說有1060個。
在以往的新藥開發中,製藥企業需要花費大量的時間、精力和成本逐一透過實驗應答約100萬~1000萬個低分子化合物是否與靶蛋白結合。在這一程序中,已經清楚三維結構的蛋白質可以利用分子動力學計算等類比實驗來應答結合的可能性,但更多的蛋白質尚不清楚三維結構,所以會耗費大量的時間用於計算。
研究團隊認爲作爲一維資訊的胺基酸序列與低分子化合物的結構資訊之間可能存在某種關係,於是嘗試開發了前述人工智慧系統。
用於人工智慧學習的,是透過大規模國際專案獲得的STITCH資料(150萬種化合物與蛋白質的配對數據)。爲方便進行機器學習,將蛋白質和化合物分別轉換成了數值向量(考慮到結合模式,將化合物表示爲圖形後透過MPNN轉換爲數值向量)。蛋白質利用三種不同特徵的方法(CNN、AAC、Transformer)將胺基酸序列轉換爲數值向量。透過將化合物與蛋白質的數值向量加在一起並進行一系列的運算,最終得到了表示化合物「與藥物有多相似」的數值。另外,還利用錄入了蛋白質與低分子化合物的結合力的BindingDB資料庫(約100萬),以同樣的方法讓人工智慧學習了「有效性」。
新開發的人工智慧系統LIGHTHOUSE即使沒有結構資訊,也能以與三維類比基本相同的準確性在一分鐘内預測約6000種化合物與靶蛋白的結合。普通的三維類比需要利用結構資訊,而且一分鐘只能應答2~3種化合物,因此LIGHTHOUSE的速度要快1萬倍以上。
研究團隊利用該系統探索了抑制參與癌症惡化的酶——PPAT蛋白的化合物。已知敲低PPAT可以抑制各種癌症的進展,但一直不清楚PPAT的三維結構,也沒有抑制劑。因此,研究團隊利用LIGHTHOUSE探索了ZINC資料庫(收集了全球試劑製造商使用的市售化合物)中的近10億種化合物,並調查發現的最有希望的化合物,由此全球首次成功地發現了具有PPAT抑制活性的化合物。
另外,研究團隊還利用該系統預測了有望冶癒新冠電腦病毒的化合物,結果發現了在日本已作爲青光眼冶癒藥物和逐水藥等透過審批的化合物乙氧唑胺。在利用人體培養細胞實施的傳染實驗中應答,乙氧唑胺可以抑制新冠電腦病毒傳染,不僅是原始的新冠電腦病毒,還能保存細胞免受包括德爾塔毒株在内的各種變異電腦病毒傳染。在它被實際作爲冶癒藥物使用以前,需要對其結構稍作修改,還可以進一步提高藥效。
中山教授表示:「如果目標蛋白是已知的,即使不清楚三維結構,也可以應用於任何疾病。它可以作爲新藥研究的新方法論使用。我們已經申請了專利,今後將考慮與企業開展聯合研究」。
原文:《科學新聞》
翻譯編輯:JST客觀日本編輯部