c't 26/2020
S. 40
Aktuell
Supercomputer

Deutsche Welle

Jülicher Supercomputer in der Top 10 der weltschnellsten Rechner

Deutschland setzt sich an die Spitze der europäischen Länder auf der Top500-Liste der Supercomputer. Der Anteil von Systemen mit AMD- und ARM-Prozessoren wächst leicht.

Von Andreas Stiller und Christof Windeck

Mitte November erschien die 56. Version der Top500-Liste der schnellsten Supercomputer im Benchmark Linpack. Auf dieser Liste stehen die drei neuen deutschen Hochleistungsrechner Juwels Booster, HAWK und Emmy. Zusammen liefern sie dermaßen viel Rechenleistung, dass sich nun am Standort Deutschland mit insgesamt 134 Billiarden doppeltgenauer Gleitkomma-Rechenoperationen pro Sekunde (PetaFlops, kurz PFlops) mehr Rechenleistung als in jedem anderen europäischen Land auf der Top­500-Liste versammelt. Damit liegt Deutschland auf Rang 4 hinter den Spitzenreitern USA (669 PFlops), Japan (594 PFlops) und China (564 PFlops). Das Top-1-System Fugaku liefert dabei mit 442 PFlops fast Dreiviertel der gesamten japanischen Top500-Leistung.

Das zusätzliche Booster-­Modul des ­„Juwels“ am ­Forschungszentrum Jülich ist der siebtschnellste Supercomputer der Welt und der schnellste in Europa.
Bild: FZ Jülich

Stärkster deutscher und auch europä­ischer Superrechner auf Top500-Platz 7 ist das neue Modul Booster des Juwels-Systems am Forschungszentrum Jülich. Der HAWK des Höchstleistungsrechenzentrums Stuttgart (HLRS) schaffte es auf Platz 15, ganz knapp hinter den SuperMUC-NG am Leibniz-Rechenzentrum in Garching. Dritter deutscher Supercomputer-Neuling ist Emmy vom HLR Nord (HLRN) in Göttingen. Er kommt mit 5,9 PFlops auf Platz 47, sein HLRN-Gegenstück Lise aus Berlin mit 5,4 PFlops auf Platz 55.

In den beiden letztgenannten High-­Performance-Computing-(HPC-)Systemen rechnet ein sonst selten anzutreffender Intel-Prozessor mit 48 Kernen, der Xeon Platinum 9242. Den Stuttgarter Falken (HAWK) bringt hingegen der AMD Epyc 7742 „Rome“ zum Fliegen. Die enorme Booster-Rechenleistung entstammt wiederum vor allem dem noch recht jungen Nvidia-Rechenbeschleuniger A100. Diese „Ampere“-Module verwendet auch Nvidia selbst in der hauseigenen „Selene“ (Platz 5).

ARM- und Vektorrechner

Im Vergleich zur vorigen Top500-Liste ist ein weiterer Supercomputer mit ARM-Prozessoren hinzugekommen, nämlich der japanische Toki-Sora auf Platz 19 mit dem Fujitsu A64FX, der auch im weltschnellsten Computer Fugaku steckt. Der A64FX hat sogenannte SVE-Rechenwerke, die man mit AVX-512 in Intels Xeons vergleichen kann. Diese SVE-Einheiten beflügeln auch den 72-kernigen Rhea-Chip, den die European Processor Initiative (EPI) mit EU-Fördermitteln entwickelt.

56. Top500-Liste der Supercomputer: Top 10
Rang Name Land Rmax
1 Fugaku Japan 442 PFlops
2 Summit USA 149 PFlops
3 Sierra USA 95 PFlops
4 Sunway TaihuLight China 93 PFlops
5 Selene USA 63 PFlops
6 Tianhe-2A China 61 PFlops
7 Juwels Booster Deutschland 44 PFlops
8 HPC5 Italien 35 PFlops
9 Frontera USA 24 PFlops
10 Dammam-7 Saudi-Arabien 22 PFlops

Zwei neue Supercomputer, einer davon beim Deutschen Wetterdienst (DWD, Platz 141), schöpfen ihre Rechenleistung aus NEC-Aurora-SX-Vektorprozessoren, die auf eine Datentransferrate von satten 1,35 TByte/s kommen. Der Linpack-Benchmark kann ihre Vorteile nicht optimal nutzen, anders als die Meteorologen des DWD.

In zwölf der 42 neuen HPC-Systeme auf der 56. Top500-Liste stecken AMD-Epyc-­Prozessoren, meistens 64-Kerner ohne zusätzliche Rechenbeschleuniger. Weiterhin dominieren aber Intel und Nvidia die Top500-Liste: In 91,8 Prozent der Maschinen stecken Xeons und in 140 der 147 Systeme mit Rechenbeschleunigern stammen letztere von Nvidia. Bei der Anzahl der Supercomputer liegt China mit 212 Stück weit vor den USA mit 113 Stück, es folgen Japan (34) und Deutschland (18).

Ausblick

2021 wollen sowohl AMD als auch Intel erste Supercomputer mit jeweils eigenen Prozessoren und Rechenbeschleunigern bestücken, die über superschnelle und kohärente Schnittstellen verkoppelt sind. Das soll den unterschiedlichen Rechenkernen ermöglichen, gemeinsam auf Daten zuzugreifen, ohne diese zuvor erst in jeweils eigene RAM-Bereiche kopieren zu müssen (Zero Copy). AMD setzt dazu auf Infinity Fabric, Zen-3-Epycs (Milan) und Instinct-MI-Beschleuniger; der 1,5-­EFlops-Frontier soll 2021 kommen. Intel arbeitet für Aurora an Sapphire-Rapids-Xeons mit PCI Express 5, Compute Express Link (CXL) und Xe-HPC-Beschleunigern namens Ponte Vecchio. Nvidia nutzt das Konzept bereits bei der NVLink-3-Kommunikation zwischen A100-Modulen. (ciw@ct.de)

Kommentieren