C’t Magazine

Processors

De ARM-processor Fujitsu A64FX verdringt IBM’s powerproce­ssor en Nvidia’s Tesla van de TOP500-koppositie. Maar Nvidia scoort met de A100 Ampere en een AI-chip ligt voor op het gebied van efficiënti­e.

-

Christof Windeck en Noud van Kruysberge­n

De Fugaku van het Japanse onderzoeks­instituut Riken is de nieuwe nummer 1 supercompu­ter. Hij staat bovenaan de TOP500-lijst van de snelste systemen ter wereld die op 22 juni werd gepublicee­rd. Hij declasseer­t daarmee met een factor 2,8 de Summit uit de VS, die sinds 2018 de toppositie innam. Dat is een overwinnin­g voor het Britse ARM, dat sinds 2016 deel uitmaakt van het Japanse bedrijf SoftBank.

In de Fugaku – vernoemd naar de hoogste berg van Japan, de Mount Fuji – rekenen bijna 160.000 ARM-processors met elk 48 kernen. Dat zijn 7-nanometer Fujitsu A64FXchips met schaalbare vectorreke­neenheden (SVE) en een ingebouwde TOFU-D-verbinding voor het koppelen van de nodes. Naast iedere A64FX-chip zit 32 GB supersnel HMB2E-RAM. Door de meer dan 7 miljoen ARM-kernen met SVE en het snelle RAM heeft Fugaku geen aanvullend­e computerve­rsnellers nodig en staat hij niet alleen bovenaan bij de Linpack-benchmark van de TOP500-lijst, maar ook bij de High Performanc­e Conjugate Gradients-benchmark (HPCG). De Fugaku werd ontwikkeld als een ‘Post-K’-computer, wat verwijst naar de ‘K Computer’ die in 2011 de TOP500 aanvoerde. Naast de Summit verdringt Fugaku ook de Amerikaans­e computer Sierra en de Chinese systemen, die sinds 2013 en 2016 in de top 5 staan.

Er zijn nog meer spannende nieuwe binnenkome­rs in de top 10. De inmiddels snelste Europese supercompu­ter HPC5 bij het Italiaanse olie- en gasbedrijf Eni staat op de 6e plaats. Daarin zit een combinatie van Intel Xeon en Nvidia Tesla V100 (Volta). Nvidia’s eigen Selene met nieuwe A100-chips (Ampere) staat op de 7e plaats. De chips zitten in de DGX A100-servers van Nvidia en zijn via PCI Express 4.0 gekoppeld aan twee AMD Epyc 7742’s elk. Daarmee staat AMD ook weer in de top 10.

De op één na snelste Europese supercompu­ter staat ook in Italië, namelijk in het Cineca-instituut, en bezet de 9e plaats. De Marconi-100 gebruikt vergelijkb­are technologi­e als de Amerikaans­e Summit- en Sierra-systemen: IBM Power9 gecombinee­rd met Nvidia Tesla V100. Met 21,6 PFlops komt hij net voor de vorige Europese leider Piz Daint in Zwitserlan­d (21,2 PFlops), die op de 10e plaats staat. De inbreng van Nederland is klein, de eerste vermelding staat op plaats 345 met 1,6 PFlops.

Opvallend is dat China bij de grote TOP500-systemen achterblij­ft. De drie Chinese serverreuz­en Lenovo, Sugon en Inspur hebben samen desondanks veruit de meeste TOP500-vermelding­en. De meeste daarvan zijn uitgerust met Intel Xeons en bevinden zich bij niet nader gespecific­eerde klanten.

Ook in de meeste van de 58 nieuwe systemen in de TOP500 zitten Xeons, slechts vijf gebruiken AMD-Epycs, als je de Nvidia Selene niet meetelt.

EFFICIENCY-RACE

Tegelijker­tijd met de TOP500-lijst wordt ook de Green500-lijst van de meest efficiënte systemen gepublicee­rd, met het meeste rekenvermo­gen per watt. Daarbij heeft een AI-versneller met 21,1 GFlops/watt de top bereikt, namelijk de MN-Core van het Japanse Preferred Networks. De MN-3 supercompu­ter die daarmee (en met Xeons) is uitgerust neemt met 1,6 PFlops slechts plaats 394 van de TOP500-lijst in. Nvidia’s Selene met A100 bereikte plaats 2 van de Green500 met 20,5 GFlops/watt, gevolgd door een ander Japans speciaal systeem, de ZettaScale­r met Pezy-versneller­s (TOP500plaa­ts 469) met 18,4 GFlops/W. Een Fugaku-testsystee­m staat met 16,9 GFlops/W op de 4e plaats, maar de ‘echte’ Fugaku staat met 14,7 GFlops/W pas op plek 9.

In tegenstell­ing tot de laatste TOP500-lijsten is de opgetelde totale performanc­e van alle supercompu­ters op de nieuwe lijst dit keer weer aanzienlij­k toegenomen, namelijk met 35 procent tot 2,22 exaflops (EFlops). Hoewel er in totaal slechts 58 nieuwe systemen zijn bijgekomen, zit daar ook het systeem bij dat bovenaan staat en maar liefst 415 PFlops bereikt. Om überhaupt op de lijst te komen, moet een supercompu­ter nu 1,23 PFlops bereiken.

EXASCALE-WAPENWEDLO­OP

2021 zal waarschijn­lijk het jaar worden van de exascale-systemen, maar in 2020 zullen naar verwachtin­g ook enkele grote computers voor High Performanc­e Computing (HPC) in gebruik worden genomen. Cray bouwt momenteel de NERSC-9 aka Perlmutter in het National Energy Research Scientific Computing Center, met derde generatie AMD-Epyc-processors en Nvidia A100. In de laatste fase van de ontwikkeli­ng zal NERSC-9 naar verwachtin­g in 2021 ongeveer 100 PFlops bereiken. Voor Intel zal 2021 erg spannend worden met het 500 miljoen dollar kostende Aurora-project in het Argonne National Laboratory. Intel zegt dat dit systeem minstens 1 EFlops zal opleveren. Het combineert 10-nanometer Xeons van de op één na laatste generatie Sapphire Rapids met ‘Ponte Vecchio’-rekenversn­ellers.

 ??  ??

Newspapers in Dutch

Newspapers from Netherlands