c't 14/2017
S. 22
News
Top500-Supercomputer

Spitzenkämpfe

Top500-Liste der Supercomputer: Schweiz auf Platz 3

Der aufgerüstete Piz Daint in Lugano bringt die Schweiz im internationalen Vergleich der Superrechner weit nach vorne. Die USA fallen etwas zurück und in einigen Top500-Systemen debütiert Intels Xeon-SP.

Wenn man die installierte Supercomputer-Rechenleistung mit dem Bruttoinlandsprodukt (BIP) gewichtet, dann heißt die weltweit führende Nation nicht China, nicht USA und schon gar nicht Deutschland: Mit großem Vorsprung steht dann die Schweiz an der Spitze. Das ist vor allem ein Verdienst des seit dem kräftig aufgerüsteten Piz Daint. Das Cray-XC50-System ist mit 19,6 PFlops nun die Nummer 3 in der neuen Top500-Liste. Relativ zum BIP wäre das dreieinhalb Mal mehr als beim neuen und alten Spitzenreiter, dem chinesischen Sunway TaihuLight mit 93 PFlops. Er ist mit 40.960 64-Bit-RISC-Chips vom Typ Sunway beziehungsweise ShenWei SW26010 bestückt.

Außer dem großen Sprung des Piz Daint um fünf Plätze hat sich bei den Top 10 der Top500-Liste seit November 2016 nichts getan. Platz 2 hält der schon recht betagte Tianhe-2 mit 33,8 PFlops. Auf Platz 4 mit 17,6 PFlops folgt der noch ältere Titan am Oak Ridge National Lab. Deutschlands Schnellster ist weiterhin die Cray XC40 „Hazel Hen“ am HLRS in Stuttgart mit 5,6 PFlops auf Platz 17.

Zum zweiten Mal in der 24-jährigen Geschichte der Top500-Liste haben die USA kein System in den Top 3. Sie haben mit 169 Systemen (zuvor 171) aber wieder die meisten Top500-Systeme vor China (160, zuvor 171), Japan (38/27), Deutschland (28/31), Frankreich (18/20) und Großbritannien (17/13). Auch in der aggregierten Rechenleistung ihrer Top500-Systeme führen die USA mit 255 PFlops vor China (235 PFlops), Westeuropa (161), Japan (62), Deutschland (37) und Großbritannien (30 PFlops). Die Leistung aller Top500-Rechner stieg gegenüber der letzten Liste um 32 Prozent.

Bei den Herstellern liegt HPE mit 144 (zuvor 140) Systemen stückzahlmäßig klar vorn, vor Lenovo (88/92) und Cray (57/56). Allerdings dominiert Cray bei den großen Systemen und liegt so in der Performance mit 21 Prozent der Gesamtleistung vor HPE (16,5 Prozent). Dank des Tabellenführers TaihuLight folgt dann das chinesische National Research Center of Parallel Computer Engineering.

Tabelle
Tabelle: Top 10 der 49. Top500-Liste (Juni 2017)

HPCG und Green500

Linpack ist nicht alles: Die Top500 führt jetzt auch Ergebnisse des HPCG-Benchmarks auf. Dabei steht Fujitsus K-Computer klar an der Spitze vor Tianhe-2, Piz Daint und Oakforest-PACS mit Xeon Phi. Erst danach folgt der Top500-Spitzenreiter TaihuLight. Laut CSCS liegt Piz Daint bei realen Anwendungen wie COSMO noch weiter vorne.

Neu in die Top500-Liste aufgenommen ist auch die Energieeffizienz gemäß Green500. Für 370 der 500 Systeme hat man inzwischen Daten. 13 Systeme mit Nvidia Tesla P100 führen die Liste an, die ersten vier Plätze gehen nach Japan: An der Spitze steht der Tsubame 3, ein modifiziertes SGI-ICE-System (jetzt HPE) am GSIC-Center in Tokio mit 14,1 GFlops/Watt. Von den Großsystemen innerhalb der Top 50 dominiert Piz Daint auf Platz 6 mit 10,4 GFlops/Watt.

Zum Kasten: Die europäische Spitze: Piz Daint

Neulinge

108 Systeme sind neu in die Liste eingezogen, bis auf zwei mit IBM Power8 alle mit Intel Xeon. Darunter sind bereits drei Skylake-SP, den Intel noch gar nicht offiziell vorgestellt hat. Außer Intels eigenem Testrechner Endeavor I mit Xeon Gold 6148 sind das Mare Nostrum am Barcelona SC mit Xeon Platinum 8160, aufgebaut von Lenovo, und auf Platz 65 eine HPE Apollo XL230k namens Quriosity von BASF in Deutschland. Theoretisch bringt Skylake-SP dank AVX512 mit FMA eine Verdopplung der Rechenleistung pro Kern und Taktzyklus im Vergleich zu Broadwell-EP. Doch mit 62 bis 66 Prozent gemessener Linpack-Leistung im Vergleich zum theoretischen Spitzenwert Rpeak kann sich Skylake-SP nicht so gut ins Szene setzen, wie erwartet – trotz Omni-Path-Interconnect. Die ebenfalls mit Omni Path verknüpften Broadwell-Systeme liegen zwischen 82 und 94 Prozent. Daraus kann man errechnen, dass Xeon Gold etwa 50 GFlops pro Kern liefert, mit gleichem Grundtakt laufende Broadwell-Systeme kommen auf 32 GFlops/Core.

Der neue AMD Epyc ist noch nicht mit dabei; er ist mit seinen nur 128-bittigen AVX-Recheneinheiten beim Linpack-Ranking auch ziemlich außen vor.

(as@ct.de)