c't 9/2016
S. 22
Prozessorgeflüster
Shannon, Pascal, OpenPower

Prozessorgeflüster

Von Codes, Clowns & CPUs

Was wird nicht alles mit den Namen von Leibniz, Shannon und Pascal verbunden: Zahlensysteme, Kommunikationstheoreme, Dreiecke, Codes und Clowns … und neue GPUs. Da bleibt OpenPower lieber bei Feuersteinen und bei Orang-Utans.

Leibniz Universität, Leibniz Bibliothek, Leibnizschule, Leibnizkekse – doch ausgerechnet beim Rechenzentrum waren die Hannoveraner zu langsam: Den Namen dafür haben ihnen Münchner vor der Nase weggeschnappt.

Im höheren Alter entwickelte Claude Shannon geradezu eine Art Bastelwahn, hier sein Rubik-Würfel-Roboter aus dem Jahre 1981. Bild: Jan Braun, Heinz Nixdorf MuseumsForum

Dieses Jahr ist nun etwas Besonderes, denn es ist das Jahr zum 300. Todestag des wohl bedeutendsten hannoverschen Mitbürgers (okay, geboren und aufgewachsen in Leipzig). Es ist zwar schon im vollen Gange, doch die Hannoveraner brauchen manchmal etwas länger. Jedenfalls wird nun nach langem Umbau mit insgesamt 15 Monaten Verspätung die Gottfried Wilhelm Leibniz Bibliothek Zug um Zug wiedereröffnet.

In der GWL-Bibliothek lagern nicht nur Bücher und Briefe – Leibnizens Schriftverkehr mit 15 000 Briefen gehört zum Weltdokumentenerbe –, dort sind auch interessante Ausstellungsstücke zu bewundern. Dazu gehört das Original der berühmten Leibnizschen Rechenmaschine, die „machina arithmeticae“. Die arbeitet mit ihrer Staffelwalze zwar noch im Zehnersystem, doch Leibniz hatte auch bereits Konzepte für das von ihm entdeckte duale Zahlensystem, die „machina arithmeticae dyadicae“.

Es vergingen zwei Generationen und 1777 wurde im Kurfürstentum Hannover ein anderer berühmter Zahlenkünstler geboren: Carl Friedrich Gauß. Na gut, er ist Braunschweiger, verbrachte aber den größten Teil seines Lebens in Göttingen. Vom zu umtriebigen Leibni(t)z hielt er nicht allzu viel, sondern verehrte Newton. Die binäre Idee setzte er aber zusammen mit Wilhelm Weber noch vor Samuel Morse als Telegrafencode mit Links-Rechts-Ausschlag ein.

Dann verging wieder viel Zeit bis just an Gauß’ Geburtstag, dem 30. April, ein weiterer Großmeister im Umgang mit Nullen und Einsen zur Welt kam, der Amerikaner Claude Elwood Shannon. Sein Geburtstag jährt sich nun zum 100. Mal, allerdings ohne ihn, denn er ist 2001 verstorben.

Shannon stammte aus Medford in Massachusetts und hat von beiden „Hannoveranern“ viel in seine Arbeit einfließen lassen, das duale Zahlensystem hier, das gaußsche Rauschen da. Der langjährige MIT-Professor gilt als Vater der klassischen Informationstheorie. Er war es, der das duale Zahlensystem und die Boolesche Algebra als Erster in elektrische Hardware goss. Von ihm stammt der Begriff „ein Bit“ (also nicht aus Bitburg). Seine Theoreme bilden die Grundlagen der Kommunikation und der modernen Kryptografie; unter anderem hat er die wichtige Entropie in die Informationstheorie eingeführt. In späteren Jahren verfiel er dann geradezu einem Bastelwahn, baute jonglierende Clowns und auch einen Rubik-Würfel-Roboter.

Von den heute agierenden Akrobaten, die noch mit klassischen Nullen und Einsen jonglieren, gibt es auch interessante Neuigkeiten zu berichten. Da ist vor allem der von Nvidia auf der GTC 2016 vorgestellte Monsterchip GP100 mit Pascal-Architektur zu nennen (S. 30), der mit seinen 3584 Streaming-Kernen die 10-TFlops-Marke bei einfacher Genauigkeit knackt. Das klingt viel, aber die damit bestückte Tesla-P100-Karte ist gar nicht so weit weg von einer Tesla K80, die mit ihren zwei GK210-GPUs (Kepler) bei Boost-Taktung immerhin 8,74 GFlops erreicht. Die Unterschiede werden aber bei den für HPC wichtigen doppeltgenauen Berechnungen deutlich größer, denn bei der Pascal-Architektur ist das Verhältnis 1:2, bei Kepler zuvor war es 1:3.

Turbo Pascal

Außerdem, so hatte mir ein Nvidia-Manager schon vorher verraten, soll auch die Effizienz etwa beim wichtigen Linpack-Benchmark gegenüber Kepler nochmals deutlich steigen, von einst 61 Prozent (Fermi) über 76 Prozent (Kepler) auf nun vielleicht 90 Prozent oder gar darüber hinaus. Werte zum Linpack gibts noch nicht, aber die Betreiber des schnellsten Supercomputers in Europa im schweizerischen National Supercomputing Center CSCS wissen offenbar mehr. Sie haben gleich 4500 P100-Karten zur Aufrüstung des Piz Daint geordert, der damit auf 24 PFlops Spitzenleistung kommen dürfte. 40 Millionen Schweizer Franken hat die ETH für die Aufrüstung zur Verfügung gestellt. In dieser Summe sind allerdings auch zahlreiche neue Xeon-Prozessoren enthalten.

Das OpenPower-System „Firestone“ auf der CeBIT. Von hinten grüßt blau leuchtend IBMs z13. Bild: Holger Münch/IBM Museumsforum

Den Einzelpreis einer Tesla P100 hat Nvidia noch nicht bekannt gegeben. Ihn kann man sich aber halbwegs aus dem auf der GTC ebenfalls vorgestellten, für Deep-Learning optimierten System DGX-1 herausrechnen. Das kostet, bestückt mit acht P100-Karten, zwei Xeon E5-2987v3, vier Samsung 1,92-TByte-SSDs und vier InfiniBand-EDR-Ports, 129 000 US-Dollar. Zieht man übern Daumen etwa 29 000 Dollar für Barebone und Komponenten ab, so verbleiben rund 12 500 US-Dollar für die Tesla P100. Das ist ganz ordentlich, immerhin etwa das Dreifache des Straßenpreises einer Tesla K80.

Dr. Zaius: Minister of Science

In Symbiose mit Nvidias GPU Technology Conference fand in San José wie im Vorjahr auch der OpenPower Summit statt. Dort verkündeten einige Teilnehmer die Zusammenarbeit mit dem von Facebook initiierten Open Compute Project (OCP), für deren Rack-Format der OpenPower-Server „Barreleye“ von Rackspace ausgelegt ist. Google schließt sich nun trotz Facebook ebenfalls dem OCP-Gedanken an und will dabei mit Rackspace zusammenarbeiten. Dabei soll es um Systeme namens Zaius gehen, mit Power9-Prozessoren mit 24 Kernen, NVlink2 und PCIe 4.0.

Von Tyan gibt es jetzt insgesamt sechs OpenPower-Barebones, zum Teil sind das die gleichen Systeme, die auch IBM etwa unter S812LC anbietet.

Ähnlich sieht das bei dem von Wistron gefertigten Server mit Codenamen Firestone aus, den mehrere Hersteller unter verschiedenen Namen anbieten: IBM als S822LC, E4 als OP205 … Das 2-HE-System hatte IBM schon als Prototypen auf dem letzten Summit vorgestellt, nun ist es endlich lieferbar und wurde auch auf der CeBIT vorgeführt: mit zwei Power8-Prozessoren (maximal 10 freigeschaltete Kerne), acht Speicherkanälen, zwei Nvidia-K80-GPUs und Mellanox 10-GBe-Dualport.

Die in der China Power Technology Alliance (CPTA) zusammengeschlossenen Firmen halten sich außerhalb Chinas mit ihren Produkten zurück. Immerhin gibt es hier einen Customized Power8-Chip: Sozhou Powercore hat die amerikanische Krypto-Engine rausgeschmissen und in den CP1 eine eigene eingebaut. Einige der CPTA-Teilnehmer beliefern auch direkt die Great Firewall, die jetzt vielleicht nicht nur mit Intel-, sondern auch mit OpenPower-Hilfe dafür sorgt, dass die Chinesen möglichst nichts von den Panama-Papers erfahren. (as@ct.de)