在「富嶽」主機上投影富士山
「科學大設施」的第二回將介紹日本引以爲豪的理化學研究所的超級計算機「富嶽」。 富嶽自2020年春季投入使用以來,先後用於類比來勢兇猛的新型冠狀病毒的解析及傳播模式,在過去三年多的時間裏取得了衆多成果。本文就來介紹一下,至今仍擁有世界頂級性能的「富嶽」的驚人性能以及支援其運行的設施狀況。
分析棒球選手大谷的變化球,預測線狀降水帶
大谷翔平是美國職業棒球大聯盟中投打雙優的超級選手。他作爲投手的制勝法寶「橫掃滑球」的祕密,已被富嶽解開。根據東京工業大學等研究團隊的分析,這種球由於旋轉軸的傾斜使球很難向下滑落,而會在橫向有較大的行程。
此外,日本氣象廳在6月起動了基於類比的預報實驗,也是利用「富嶽」對導致集中暴雨的線狀降水帶進行的預測。該實驗將持續到10月。雖然氣象廳提供了去年以來的線狀降水帶的生成預測資訊,但使用過去的超級計算機的方法的預測精度並不理想。此次的目標是使用「富嶽」在高解析度影像資料的基礎上進行類比計算,以提高天氣預報的精度。
「富嶽」設置於神戶市沿海的一個人工島嶼「港島」的一角。從神戶市中心的三宮搭乘輕軌港灣線大約15分鐘就可以到達計算科學中心站。出站後步行不遠即可到達理研計算科學研究中心,「富嶽」就在這裏運行,富嶽是爲了取代上一代超級計算機「京」而構建的。
計算科學研究中心的外觀。前面矗立的雕塑是一個算盤珠,表示「京」的計算速度的位數。「富嶽」的計算速度高達京的100 倍。
正式完成前就進行了飛沫傳染類比
「富嶽」在日本廣爲人知,是因爲它類比了新冠電腦病毒傳染症(COVID-19)的電腦病毒飛沫傳播情況。類比結果在電視節目等媒體上被多次報導,讓許多一般人知道了「富嶽」這個名字。這一結論是理研計算科學研究中心複雜現象統一解法研究小組的組長坪倉誠(神戸大學研究生院系統資訊學研究科教授)等人研究分析出來的。
除此之外,「富嶽」還從多個角度進行了有關新冠電腦病毒的研究,包括預測疫情對經濟的影響、尋找候選冶癒藥物、解析電腦病毒侵入細胞的機制等。這些研究不僅是在科學領域,在社會上也產生了重大影響。理研計算科學研究中心的主任松岡聰自豪地說道:「我們在設法抑制傳染的同時,還避免了國內生產毛額(GDP)的大幅下降。」
事實上,這些研究都是在「富嶽」正式完成前的試運行期間進行的。作爲「京」的繼任者,「富嶽」的搭建和安裝工作始於2019年12月。儘管在2020年初新冠流行期間,物流等方面出現了困難,但截至2020年2月,它的整機的六分之一已經開始運行,那時「富嶽」的性能已經是日本第一。因此,研究人員緊急起動了因應新冠的專案。
松岡介紹說,「富嶽」之所以能夠在尚未正式完工的情況下因應全球危機,是因爲他們事先進行了多方面的科研和應用程式研發,「以前的超級計算機通常是在機器完工後才開始運用應用程式,真正投入運行通常要等到1〜2年後。然而,‘富嶽’是日本超級計算機歷史上首次在廣泛的科學領域内同時準備了機器和應用程式。」
由於事先準備的應用中有可用於因應新冠的内容,因此能夠迅速開展各種研究。這一舉措不僅在日本國内,在國際上也受到關注,在表彰使用超級計算機進行傑出科學技術研究的戈登·貝爾獎中,基於「富嶽」的電腦病毒飛沫傳播研究於2021年榮獲了新冠研究特別獎。
戈登貝爾新冠研究特別獎的頒獎典禮(左二爲坪倉,左三爲松岡。照片由理化學研究所計算科學研究中心提供)
計算能力達到每秒50京次以上,同時具備通用的性
2021年3月開始全面投入使用的「富嶽」,能夠進行每秒50京次(1京等於1億個億)以上的計算。這相當於2000萬部智慧型手機的性能。它的性能強大到可以在僅1秒鐘内完成一個需要所有日本人連續不停計算100年以上才能完成的計算任務。並且,由於注重通用的性,它還可以運行與智慧型手機相同的程式。這種性能和通用的性的兼顧便是「富嶽」的新特點。
提到電腦,可能很多人想到的都是放在桌子上的桌機或者筆記型電腦。而「富嶽」卻佔用了整棟建築。「富嶽」安裝在電腦棟,是一個有着地下1層和地上3層的建築,其主系統位於3層的電腦室。
進入電腦室,便可以看到一個個寬度約85cm,厚度約140cm,高度約220cm的方形機箱,整齊排列在一個大約有半個足球場那麼大的房間中。這些便是「富嶽」的主體機箱,電腦室内總共有432個這樣的機箱,排列成12行36列,而且每個機箱之間的間距都基本相同。
電腦室内整齊地排列着一個個機箱
每個機箱内疊放了192塊主機板,每塊主機板上有2個CPU(中央處理單元)晶片,因此每個機箱内有384個CPU晶片。此外,每個CPU晶片内整合了48個獨立的CPU。單個CPU就可以作爲一臺電腦工作,但「富嶽將它們整合到一個晶片上,並透過超高速網路連接,讓所有CPU作爲一臺超級計算機運行。
以原來40倍的速度運行,電力消耗僅爲原來的2倍
全球超級計算機性能排名每半尾牙更新一次。從2020年上半年到2021年上半年,還處於試運行階段的「富嶽」便在「TOP500」、「HPCG」、「HPL-AI」和「Graph500」四項排名中獲得了第一。即使在2023年上半年,它仍然保持着全球最高水平的性能,在「HPCG」和 「Graph500」中仍位居第一,在「TOP500」中排名第二,在「HPL-AI」更名後的「HPL-MxP」中排名第三。
由於性能高,「富嶽」每小時要消耗大約20MW的電力,相當於一個四口之家四年的用電量。然而在實際運行中,計算速度最高可達到「京」的100倍以上「富嶽」的電力消耗僅比「京」高出2到3成,因此可以說「富嶽」也擁有世界最高水平的節能性能。
當「富嶽」進行高速計算時,每個CPU都會產生大量的熱量。雖然電腦室内的空調可以將室溫保持在20攝氏度左右,但這並不足以使CPU冷卻。因此,「富嶽」採用了水冷卻方式,將水冷卻管鋪設到整個計算機系統中,然後透過貼在每個CPU上的熱放射器,流過約爲15攝氏度的冷水來進行冷卻。
熱源機械棟的1層,排列着一排排巨大的冷凍機
空調設備、製造並運送CPU用冷卻水的設備以及電壓轉換器等都安裝在電腦棟的樓下以及隔壁的熱源機械棟,爲「富嶽」的穩定運行提供支援。熱源機械棟中還配置了氣渦輪發動機發電設備,用於爲「富嶽」提供部分電力。計算科學研究中心設施運轉技術部門的松下聰介紹說:「即使由於災害等終極因數發生停電,這些設備也能供電,因此檔案系統中保存的‘富嶽’的計算結果等也不會丟失。」
將建築物與地面隔開的免震結構
此外,爲了防止包括700噸重的「富嶽」在内的重型設備在大地面震動時受損,電腦棟配備了與高層建築相同的建築物與地面分離的免震結構。即使是阪神淡路大地面震動那樣規模的大地面震動,也能保存「富嶽」的安全。
爲了因應地面震動,設置富嶽喻體的地板層留有足夠的空間
松下在介紹地下的免震結構。左側是U型鋼製阻尼器,右側是鉛製阻尼器。這些結構用於吸收地面震動時的晃動,以確保即使發生大規模地面震動,也不會影響「富嶽」的功能。
下一代將是AI「科學家」成爲人類的合作夥伴
「富嶽」此刻也在進行着計算,並不斷產生新的成果。由於準備了許多應用程式,因此已建立了即便不是超級計算機專家也可以輕鬆使用「富嶽」的計算資源的機制。此外,「富嶽」的下一代超級計算機也已在考慮之中。 松岡主任說:「今後,爲了推進科學研究,將使用超級計算機的先進AI技術廣泛應用於科學領域是非常重要的。」
像最近的ChatGPT一樣,大型超算同時也使得模仿人類智慧的AI的形成成爲可能。這種高度智慧的AI可能會像傳統的類比一樣,有潛力對科學技術的隊形變換做出重大貢獻,相關研究工作也開始取得進展。例如,可以從人類無法處理的大規模觀測資料中有新的發現,還可以對那些即使對於超算來說也運算量繁重的類比透過基於AI的近似替代,以實施高速化,等等。
松岡認爲,爲了推動科學向前隊形變換,在科學研究中,將這種使用超算的AI與類比緊密結合是非常必要的。並表示:「富嶽之後的下一代超算可能會培養出‘AI科學家’,他們可以作爲人類的夥伴,幫助人類做出新的發現。」
研究中心的松岡在德國漢堡舉行的HPC(高性能計算)國際會議「ISC2023」展覽場地内搭建的巨大模式前講解「富嶽」
聽起來如同動漫或電影裏的情節,但很有可能10年後,人們就會在日常生活中普遍使用AI,科學技術將充分利用這些最前緣的技術。「富嶽」之後,超級計算機將如何演化,我們將繼續操作關注。
日文:JST Science Portal 編輯部
中文:JST客觀日本編輯部
【相關鏈結】
「富嶽」について(理化學研究所)
「富嶽」を用いたCOVID-19の飛沫・エアロゾル拡散モデルシミュレーションが、2021年ゴードン・ベル賞COVID-19研究特別賞受賞(理化學研究所)
「富嶽」の見學について(理化學研究所)
動畫で見る、スパコン「富嶽」による飛沫のシミュレーション(動畫:MiraikanChannel)