客觀日本

日本統數研與東京理科大等發布準晶體和近似晶體的大規模組據庫「HYPOD-X」

2024年12月12日 化學材料

日本統計數理研究所、東京理科大學、物質與材料研究機構等的聯合研究團隊發布了關於準晶體及其相關「近似晶體」的大規模組據庫「HYPOD-X」。準晶體是一種既具有非週期性的原子排列又具備有序結構的物質,其物理可用能特性與傳統晶體完全不同。HYPOD-X是全球首個專注於準晶體和近似晶體的大規模組據庫,提供了從論文和書籍的本文及圖表中提取的有關準晶體和近似晶體的組成、結構、物理可用能特性的數據,便於研究人員和工程師加以利用。相關成果已發表在期刊《Scientific Data》上。

title

圖1:構成HYPOD-X的三個數據集和數據收集步驟(供圖:統計數理研究所)

HYPOD-X由組成數據集、相圖數據集、物性數據集三個數據集組成。這些數據通過手動或半自動方式提取,並經專家的嚴格驗證後以CSV格式發布。

成分數據集是關於準晶體和近似晶體的最基本資訊。包含組成、結構分類、熱處理條件等數據,經過專家的嚴密校驗後錄入數據庫。此外,通過引入自動化誤差資料萃取演算法,顯著提高了資料品質。數據量大約達到了之前整理準晶體成分的研究文獻的10倍。研究團隊通過使用了該數據集進行機器學習,成功發現了新的準晶體。

物性數據集包含從論文和書籍的圖表中提取的熱物性、電物性、磁物性等性質的溫度依賴性曲線。通過統觀這些數據,有望發現連準晶體專家都易忽視的新規律。例如,準晶體的熱導率往往隨著溫度的升高而增加。這是一種在普通金屬或晶體中沒有的特性。通過利用這一特性,就可以開發出控制熱量向特定方向流動的熱整流材料。通過從海量的數據中識別出表現最佳溫度依賴性的準晶體,能夠加速新型熱管理器件的開發。

相圖數據集包含將論文和書籍的圖片數值化後得到的數據。這些數據顯示了準晶體和近似晶體熱力學穩定的成分範圍和其他條件。通過將機器學習應用於這些數據,就可以預測準晶體或近似晶體的新型物質相。

目前,物質科學和材料科學的各個領域都在推動數據驅動型研究的基礎建設。然而,由於準晶體領域此前缺乏全面的開放數據,所以該領域的數據驅動型研究進展受到了制約。

此次,通過整備開放數據庫,未來將有望開展多種數據驅動型研究。此外,藉助對海量數據的全面分析,有望在準晶體研究中找到嶄新的視角和科學規律。

研究團隊表示,今後還將持續擴展數據庫内容,推動準晶領域的進一步發展。

原文:《科學新聞》
翻譯:JST客觀日本編輯部

【論文資訊】
期刊:Scientific Data
論文:Comprehensive experimental datasets of quasicrystals and their approximants
DOI:10.1038/s41597-024-04043-z