客觀日本

理研開發出預測聚合體表面蛋白質吸附量的新型AI,加速藥物和生物材料的開發

2026年05月26日 生物醫藥

日本國立研究開發法人理化學研究所生命功能科學研究中心生物計算研究團隊的蘇奭維(Su Shiwei)特別研究員、田中信行上級技師等人組成的研究團隊,開發出了能夠高精度預測聚合體表面會吸附多少蛋白質的AI模型「BB-EIT」。該模型將聚合體的厚度、表面電學性質等物理及生物化學特徵量組合起來進行學習,同時兼具可針對廣泛材料與蛋白質組合準確推導吸附傾向的通用性,有望應用於針對特定疾病優化的藥物遞送系統及高端診斷器件等領域。相關研究成果已發表在期刊《ACS Applied Materials & Interfaces》的4月6日刊上。

title

圖1 AI模型BB-EIT的結構(供圖:理化學研究所)
ChemBERTa將轉換為SMILES字符串的單體化學結構式作為「上下文」加以理解,並輸出(編碼)為電脳可處理的形式(768維的化學固有向量)。將該化學固有向量與表示「膜(聚合體刷)的厚度」「表面親疏水性」「表面電位」以及蛋白質的「表面電位」「分子量」這些物理及生物化學特徵的5維向量進行結合。由此,將針對一個單體所得到的共計773維的固有向量輸入機器學習模型(神經網路),輸出預測值(蛋白質吸附量)。

在人工器官等生物材料的開發中,需要精密控制表面覆蓋的聚合體材料上的蛋白質吸附,以滿足「抗吸附」與「固定化」這對相互矛盾的需求。

此前,該領域的研究一直依靠研究者基於經驗的海量試錯來推進。近年來,利用AI的材料開發也在不斷推進,但實驗數據的獲取需要耗費巨大的時間和成本,且此前運用機器學習的預測模型也僅被限定於特定的蛋白質或材料。

因此,本次研究團隊旨在開發一種通過融合大規模語言模型與材料科學專業知識來彌補數據不足的方法。

生物材料中常用的聚合體是一類生態毒性低、易於加工且可大規模生產的聚合體材料,由特定單體像鏈條一樣大量連接而成。通過選擇不同的單體,即可調控其化學與物理性質。

本研究採用了作為這種聚合體應用形態、相關研究正在推進之中的「聚合體刷」結構。大量聚合體被固定在固體表面並向上伸展,形成刷狀結構,可對表面特性進行精密調控。

本次開發的AI模型能夠高精度預測由特定單體構成的聚合體刷表面會吸附多少蛋白質。

「BB-EIT」模型的基礎,採用了預先學習海量化學結構數據、能夠將這些化學結構作為「上下文」理解的大規模語言模型「ChemBERTa」。

「BB-EIT」模型將聚合體厚度、表面電學性質等物理及生物化學特徵量組合起來進行學習,並通過對結構式進行數學重組的數據增強法擴充數據量,從而利用少量實驗數據也實現了高預測精度,能夠針對廣泛的材料與蛋白質組合準確推導吸附傾向。

在預測過程中,研究人員首先將聚合物的最小單位——單體的結構以「SMILES字符串」形式輸入ChemBERTa,並從中提取768維的化學固有向量。

在此基礎上,將重要的物理及生物化學參數——聚合體刷材料的膜厚、表面親疏水性、表面電位(表徵材料表面處於何種電學狀態的指標),以及蛋白質的表面電位、分子量——作為5維向量與上述化學固有向量直接結合。

模型學習中利用了前期研究收集的高質量實驗數據。此外,為彌補數據量的不足,引入了「數據增強法」,通過添加高斯噪音來再現實驗測量誤差。針對測試資料的預測精度評估指標達到了0.88,創下了極高的預測精度記錄。

AI是「科學的夥伴」

蘇奭維特別研究員表示:「最新的AI已不再僅是文本生成工具,更是支撐開發提升醫療安全性的防污材料,以及捕捉疾病細微徵兆的生物感測器的‘可靠科學夥伴’,AI已開始滲透到社會中。通過融合最新的AI與材料科學知識,我們在全球首次以單一框架成功實現了材料的蛋白質吸附量的準確預測,同時實現了適用於未知材料的高通用性。我們計劃推動該模型的應用,使其成為大幅加速新一代生物材料開發的重要基礎之一,同時致力於開發性能更優的升級版BB-EIT。」

原文:《科學新聞》
翻譯:JST客觀日本編輯部

【論文資訊】
期刊:ACS Applied Materials & Interfaces
論文:BB-EIT: A Generalized Prediction Model for Protein Adsorption on Polymer Brushes Using Augmented Chemical Embeddings
DOI:10.1021/acsami.5c25223