用於研究化學反應的計算極為複雜,以往需要對數量龐大的候選路徑進行反復試算。日本北海道大學綜合創新創發機構化學反應創成研究基地(ICReDD)的P. Nath特任助教、該校研究生院理學研究院的小野Yuri子博士研究員、ICReDD的原渕祐特任教授、山本靖典特任教授、前田理教授、武次徹也教授、吉岡真治教授等組成的研究團隊,通過將化學家的經驗與判斷基準加以體系化,開發出能夠高效控制作為計算化學反應路徑探索手法的人工力誘導反應(AFIR)法的知識系統「ChemOntology」。藉助該系統,計算得以集中在反應的主要候選路徑上進行,從而大幅減少計算所需的時間與精力。今後,該成果有望加速新藥、電池材料及觸媒開發等諸多領域化學反應的發現與優化。相關研究成果已發表在《ACS Catalysis》的線上版上。
圖1:將化學知識轉化為機器可讀的規則,智慧引導反應探索(供圖:北海道大學)
為了弄清楚化學反應是如何推進的,僅靠實驗往往很困難,因此通過電脳預測反應路徑的計算化學得到了廣泛應用。研究團隊的前田教授開發的AFIR法能夠通過計算導出所有可能發生的化學反應,但由於它會把既有反應以及化學家憑直覺就能判斷為不可能存在的結構——換言之,在實驗化學家看來「沒有意義」的候選,也一併進行探索,所以會導致計算過程耗費大量時間。
此次,研究團隊將化學家所具備的經驗與判斷基準加以整理形成的知識系統「ChemOntology」,與AFIR法進行了結合。
在ChemOntology中,研究團隊將化學家用來理解反應的基本反應知識(如氧化性加成)整理為用於控制AFIR法反應探索的知識,同時開發了多個知識引擎,用於執行實驗化學家在解析反應進程時所進行的「結構單元識別」、「化學單元識別」、「反應中心識別」、「官能基識別」等過程。隨著這些引擎協同發揮作用,系統便能夠像化學家在實驗中分析反應時間那樣,對分子結構進行分類,並在判斷關鍵部分的同時,指引包含適當基本反應組合的反應路徑探索。其結果是,AFIR能從「有意義的反應候選」中開始優先展開探索。
為了將人類知識轉化為電脳可處理的形式,研究人員將化學反應相關的專業知識拆解為「概念」、「分類」、「判斷基準」、「例外」等要素,並將其整理為層級化的規則體系。例如,化學家理所當然做出的「這個鍵容易斷開」、「這個結構不可能存在」之類的直覺判斷,被定義為清晰的條件式或分類詞典,並以可重複利用的知識形式實現。藉助這一機制,電脳也能夠像化學家那樣「一邊篩選候選一邊開展探索」。而這一結構實質上是讓機器「代替化學家在頭腦中進行思考」,其最大特點是不把人類知識作為搜尋引擎的資訊呼叫,而是直接嵌入探索演算法的內部。
一般來說,利用AI技術的數據驅動型研究方法需要通過大規模数據集進行學習,但在知識驅動的ChemOntology中,由於可以將化學家用於分析化學反應的知識直接應用於AFIR法,因此不再需要這種學習。同時,其判斷並非基於機器的圖形辨識,而是以化學知識為依據,使反應路徑探索的判斷基礎更加清晰,在降低計算成本的同時,也能夠探索到更加完整的反應路徑。過去以考慮能量條件的「試錯式探索」為主,而隨著ChemOntology的引入,計算得以「利用化學家的知識,以更為合理的方式推進」。
此次開發的系統,有望加速發現新藥候選、探索新一代電池材料以及催化反應的設計等多種化學用途。尤其是在實驗、計算科學與資訊科學相結合的研究不斷推進的情況下,人類的知識與AI協同發揮作用,可為新型化學反應的發現與優化作出貢獻。
原文:《科學新聞》
翻譯:JST客觀日本編輯部
【論文資訊】
期刊:ACS Catalysis
論文:ChemOntology: A Reusable Explicit Chemical Ontology-Based Method to Expedite Reaction Path Searches
URL:https://pubs.acs.org/doi/10.1021/acscatal.5c06298

