世界超算TOP 500排名出爐:中國依然遙遙領(lǐng)先 但算力不及第二名

發(fā)布時(shí)間:2021-06-30 08:20:38  |  來源:IT之家  

6 月 30 日消息 一年一度的高性能計(jì)算大會(huì) ISC 如期而至,世界 TOP 500 超級(jí)計(jì)算機(jī)排名昨日正式公布。

對(duì)比去年的榜單,今年 TOP 10 的榜單中,來自美國新能源部勞倫斯伯克利國家實(shí)驗(yàn)室的 Perlmutter 系統(tǒng)新晉入圍。中國超級(jí)計(jì)算機(jī)的數(shù)量雖然下降至 186 臺(tái)(去年 212),但對(duì)比位居第二的美國的 123 臺(tái),依然遙遙領(lǐng)先。不過美國超算算力更強(qiáng),美國超算的綜合性能為 856.8 Pflop/s,而中國超算為 445.3 Pflop/s。

以下是 Top10 中的系統(tǒng)摘要(引用自 Top500):

日本的 Fugaku 仍然是第一的超算系統(tǒng)。它擁有 7,630,848 個(gè)內(nèi)核,使其能夠達(dá)到 442 Pflop/s 的 HPL 基準(zhǔn)測(cè)試分?jǐn)?shù)。這使它領(lǐng)先第二名 3 倍。

Summit 是美國田納西州橡樹嶺國家實(shí)驗(yàn)室 (ORNL) 的 IBM 構(gòu)建的系統(tǒng),仍然是美國最快的系統(tǒng),在 HPL 基準(zhǔn)測(cè)試中的性能為 148.8 Pflop/s,全球排名第二。用于對(duì) TOP500 榜單進(jìn)行排名。Summit 有 4,356 個(gè)節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)包含兩個(gè) Power9 CPU,每個(gè) CPU 有 22 個(gè)內(nèi)核,六個(gè) NVIDIA Tesla V100 GPU,每個(gè)都有 80 個(gè)流式多處理器 (SM)。這些節(jié)點(diǎn)通過 Mellanox 雙軌 EDR InfiniBand 網(wǎng)絡(luò)鏈接在一起。

美國加利福尼亞州勞倫斯利弗莫爾國家實(shí)驗(yàn)室的 Sierra 系統(tǒng)排名第 3。其架構(gòu)與 #2 的 Summit 系統(tǒng)非常相似。它由 4,320 個(gè)節(jié)點(diǎn)構(gòu)建,具有兩個(gè) Power9 CPU 和四個(gè) NVIDIA Tesla V100 GPU。Sierra 達(dá)到了 94.6 Pflop/s。

由中國國家并行計(jì)算機(jī)工程與技術(shù)研究中心(NRCPC)開發(fā)并設(shè)立在江蘇無錫國家超級(jí)計(jì)算中心的神威太湖之光以 93 Pflop/s 排名第四.

排名第 5 的 Perlmutter 是 TOP10 中的新晉成員。它基于 HPE Cray“Shasta”平臺(tái),以及一個(gè)具有基于 AMD EPYC 的節(jié)點(diǎn)和 1536 個(gè) NVIDIA A100 加速節(jié)點(diǎn)的異構(gòu)系統(tǒng)。Perlmutter 達(dá)到了 64.6 Pflop/s。

Selene 現(xiàn)在排名第 6,是 NVIDIA 內(nèi)部安裝的 NVIDIA DGX A100 SuperPOD。該系統(tǒng)基于 AMD EPYC 處理器,采用 NVIDIA A100 加速,Mellanox HDR InfiniBand 作為網(wǎng)絡(luò),實(shí)現(xiàn)了 63.4 Pflop/s。

由中國國防科技大學(xué)(NUDT)開發(fā)并部署在中國廣州國家超級(jí)計(jì)算機(jī)中心的系統(tǒng)天河 2A(Milky Way-2A)現(xiàn)在以 61.4 Pflop /s 被列為世界第 7 系統(tǒng)。

名為“JUWELS Booster Module”系統(tǒng)是 No. 8。由 Atos 構(gòu)建的 BullSequana 系統(tǒng)安裝在德國的 Forschungszentrum Juelich (FZJ)。該系統(tǒng)使用帶有 NVIDIA A100 的 AMD EPYC 處理器進(jìn)行加速,并使用 Mellanox HDR InfiniBand 作為類似于 Selene 系統(tǒng)的網(wǎng)絡(luò)。這是歐洲最強(qiáng)大的系統(tǒng),算力達(dá) 44.1 Pflop/s。

排在第 9 位的 HPC5 是戴爾構(gòu)建、意大利 Eni SpA 安裝的 PowerEdge 系統(tǒng),由于使用 NVIDIA Tesla V100 作為加速器和 Mellanox HDR InfiniBand 作為網(wǎng)絡(luò),實(shí)現(xiàn)了 35.5 Pflop/s 的性能。

Frontera 是一款戴爾 C6420 系統(tǒng),安裝在得克薩斯大學(xué)的得克薩斯高級(jí)計(jì)算中心,目前排名第 10。它使用 448,448 個(gè)英特爾至強(qiáng)內(nèi)核實(shí)現(xiàn)了 23.5 Pflop/s。

值得注意的是,此次榜單中大多數(shù)系統(tǒng)采用了 AMD 和英偉達(dá)的方案。另外,名單上更新的兩個(gè)新系統(tǒng)“超級(jí)云”,能夠同時(shí)滿足 AI、高性能計(jì)算(HPC)和云端需求,這意味著,高性能計(jì)算正在同 AI 加速融合。

此外,英偉達(dá)也在本次 ISC 大會(huì)上發(fā)布了全新的 HGX A100 系統(tǒng),且已經(jīng)在英國愛丁堡大學(xué)托管的 DiRAC 超級(jí)計(jì)算機(jī)中落地。

據(jù)介紹,英偉達(dá) HGX A100 加入了三項(xiàng)關(guān)鍵技術(shù):NVIDIA A100 80GB PCIe GPU、NVIDIA NDR 400G InfiniBand 網(wǎng)絡(luò)和 NVIDIA Magnum IO GPUDirect Storage 軟件。

其中,A100 80GB PCle GPU 采用 NVIDIA Ampere 架構(gòu),與 A100 40GB 相比其內(nèi)存帶寬帶到 2TB/S,提升 25% 。更高的內(nèi)存容量和內(nèi)存帶寬,能夠?qū)⒏嗟臄?shù)據(jù)和更大的神經(jīng)網(wǎng)絡(luò)保存在內(nèi)存中,從而最大限度地減少節(jié)點(diǎn)通信和能耗,研究人員也能獲得更高的吞吐率和更快的結(jié)果。

目前,英偉達(dá)最新 HGX 高性能計(jì)算平臺(tái)已落地英國愛丁堡大學(xué),為其托管的新型 DiRAC 超級(jí)計(jì)算機(jī) Tursa 提供動(dòng)力支持。

關(guān)鍵詞: 中國 超級(jí)計(jì)算機(jī)

 

滾動(dòng)

關(guān)于我們 - 聯(lián)系我們 - 版權(quán)聲明 - 招聘信息 - 友鏈交換

2014-2020  電腦商網(wǎng) 版權(quán)所有. All Rights Reserved.

備案號(hào):京ICP備2022022245號(hào)-1 未經(jīng)過本站允許,請(qǐng)勿將本站內(nèi)容傳播或復(fù)制.

聯(lián)系我們:435 226 40@qq.com