爲了能在AI的全球剝削競爭日益激烈的情況下保持和強化優勢地位,NEC已開始着手構建AI研究用超級計算機。計劃在2023年3月運行580PFLOPS以上的系統。FLOPS是表示電腦處理性能的單位,表示每秒可以執行的浮點運算次數。P(Peta)表示1000萬億,580PFLOPS代表每秒可以執行580×1000萬億(58京)次浮點運算。這是目前日本國内企業中規模最大的AI研究用超級計算機。
AI超級計算機機器間效果圖(供圖:NEC)
NEC的數百名AI研究人員已開始使用這款AI研究用超級計算機的部分系統(100PFLOPS),該公司今後將追加構建480PFLPOS的系統,創造專門用於AI的國内最強研發環境,以快速開發更高級的先進AI。另外,將來的目標是透過與客戶和合作夥伴的共創,實施能產生先進社會價值的AI卓越研究中心。
作爲AI核心技術的深度學習正在迅速隊形變換,其應用領域也在不斷擴大。另外,開發深度學習所需的運算量也在不斷擴大,爲推進全社會的數化轉型(DX),需要能迅速開發出各種先進AI的大規模計算資源。
NEC將爲已開始構建的AI研究用超級計算機投入數十億日元的開發費用。該系統由116臺每個節點配備8個高端GPU「NVIDIA A100 80GB Tensor 核心GPU」的最新GPU伺服器(美超微電腦公司生產)和配備16PB兆EXAScaler高性能並行檔案系統(DataDirect Networks公司生產)的存儲裝置構成。
該系統的理論處理性能已超過580PFLOPS,只需幾分鐘即可學習數千萬張影像。另外,網路採用高速乙太網路交換機「NVIDIA Spectrum SN3700」。以200GbE連接所有伺服器,透過用RoCE(RDMA over Converged Ethernet)v2進行超高速、低延遲通訊,實施了高速分佈式學習。
該公司透過以開源容器管理技術Kubernetes爲核心的獨特系統構建技術,將這些尖端硬體和軟體緊密結合,由此將實施高性能且高度便利的系統。
NEC的目標是開發可以即時、靈活地因應前景不透明、未來難以預測的VUCA時代社會課題的先進AI,以促進社會的數化轉型、提高人類活動的知識和身體創造性及生產力、實施永續發展的地球環境。爲此,將利用此次的AI研究用超級計算機,實施將客戶、合作夥伴和該公司的AI研究人員聚集起來,共同創造先進社會價值的AI卓越研究中心。
原文:《科學新聞》
翻譯編輯:JST客觀日本編輯部