c't 13/2016
S. 20
Prozessorgeflüster
Broadwell-EX

Prozessorgeflüster

Von Stapelläufen und Äppelwoi

Fluten allerorten, auch bei den Prozessoren, zur Computex und kurz danach. Nur wenige davon sind aber schon wirklich da. Derweil geht der Kahlschlag bei Intel weiter.

Beide Frontfrauen hielten auf der Computex stolz ihre neuesten Prozessoren hoch, hier Intels Chefin der Datacenter-Abteilung Diane Bryant, wie immer im bunten Pariser Schick, da AMD-Chefin Lisa Su, wie immer im schlichten grauen Business-Kostüm mit Blume im Revers. Aber Su konnte dafür mit diversen für die Konsumentenmesse gut geeigneten Produkten aufwarten, wenn sie denn mal kommen: Fiji, Bristol Ridge, Stoney Ridge sowie Summit Ridge, ein 8-Kern-Prototyp des Zen-Prozessors (S. 16). Zwar war auch Intels neuer Core i7 mit 10 Kernen gut für die Show passend (S. 116) , weniger aber der Xeon E3-1500 v5. Dieser Xeon zum Auflöten ist mit seiner Onboard-Grafik vor allem für Web-Server mit Media-Encoding gedacht (S. 26).

Es gibt, so hörte man im HPC-Umfeld, auch Pläne, einige Skylake-EP-Versionen mit GPU und EDRAM auszustatten. Der vorgesehene 3647-polige P6-Sockel hat dafür offenbar noch genügend Leitungen über, zumindest für den Media-Encoder. Ein sinnvoller Einsatz muss aber keinesfalls nur auf Encoding beschränkt sein. Auch im HPC-Umfeld schaut man inzwischen auf Intels HD-Grafik. Die könnte man mit ihren bis zu 72 Execution Units und 128 MByte EDRAM mitunter ganz gut zum Mitarbeiten an HPC- oder Deep-Learning-Jobs gebrauchen. Da warten immerhin über 1 Teraflops pro Chip zusätzlich – und die kann man bequem mit den neuen OpenMP-4.5-Möglichkeiten per Offloading abrufen.

Den gigantischen P6-Sockel konnte man auf der Computex bereits bewundern, wenn auch noch nicht als Basis für den Skylake-EP, sondern für den Xeon Phi Knights Landing, ein weiterer Chip, der Bryants Abteilung untersteht, der aber vielleicht gar keine HD-Grafik-Konkurrenz haben möchte.

Die KNL-Systeme waren in Taipeh aber noch verschlossen. Den richtigen Rahmen für den Stapellauf bietet erst das große HPC-Event ISC’16 Ende Juni in Frankfurt. Dort wird HPC-Chef Raj Razra wohl endlich nach mehreren Verschiebungen das berühmte schwarze Tuch lüften, jedenfalls falls er bis dahin noch im Amt ist. Bei Intel herrscht nämlich heftiges Stühlerücken. Firmenchef Krzanich hatte vor wenigen Monaten angekündigt, eine große Bereinigung durchzuführen, in deren Verlauf weltweit 12 000 Mitarbeiter die Firma „freiwillig oder unfreiwillig“ verlassen sollen.

Kein Frankfurt-Besuch ohne Äppelwoi – vor drei Wochen auf der HPC Developer Conference wusste man von James Reinders Retirement noch nichts (hier links auf dem Bild, daneben Christoph Bross, HPC-erfahrener Student der Uni Erlangen-Nürnberg, und Nina Babnik von Intel).

Und so hat nun Intels HPC-Software-Evangelist James Reinders zur großen Überraschung aller angekündigt, hinfort nicht mehr dabei zu sein – und das, wo doch sein mitverfasstes neues Buch über KNL-Programmierung just zur ISC herauskommt. Reinders ist ein Stammgast dieser Veranstaltung. Nach 10 001 Tagen bei Intel (27,32 Jahre) hat er nun das Angebot des „Early Retirement Program“ angenommen. Vor wenigen Tagen noch hatten wir auf der HPC-Entwicklerkonferenz in Frankfurt Äppelwoi getrunken und uns wieder für die kommende ISC in Frankfurt verabredet – so schnell geht das.

Broadwell-EX

Ebenfalls unpassend für die Computex wäre ein weiteres Prunkstück aus Diane Bryants Schatztruhe gewesen: der Broadwell-EX. Der große Server-Chip kam unmittelbar nach Abschluss der Messe heraus: für vier und acht Sockel mit bis zu 24 physischen Kernen im neuen Flaggschiff Xeon E7-8890 v4. Die wertvollen Prozessoren hatte Intel kurze Zeit zuvor zum Einbau in unser Brickland-Testsystem eingeschickt – da war ich aber gerade mit noch spannenderen Gravitationswellen (S. 22) beschäftigt. Der Test mit den üblichen praxisnäheren Benchmarks und mit der genaueren Prozessorbeschreibung ist somit erst für die nächste Ausgabe vorgesehen.

Intel selbst scheint auch nicht ganz fertig geworden zu sein. Am Launch-Tag, dem 6. Juni, fehlte jedenfalls noch die angekündigte Website über die 27 neuen Rekorde und von der offiziellen Preisliste war auch nichts zu sehen. Aber man weiß auch so, dass ein einziger Chip aus der Flaggschiff-Serie nahezu 7200 US-Dollar kostet (bei Abnahme von 1000 Stück) – da zittern einem beim Einbau schon ein bisschen die Hände.

Der Takt der Broadwells liegt wie bei den EP-Versionen auch leicht bis deutlich unter dem des Vorgängers Haswell: Beim Xeon E7-8890 v4 mit 2,2 GHz und mit 24 Kernen im Vergleich zum Xeon E7-8890 v3 mit schnelleren 2,5 GHz Grundtakt, aber mit nur 18 Kernen. Die kürzeren Latenzen und Durchlaufzeiten des Broadwell fordern eben ihren Takttribut, dafür ist er deutlich effizienter als der Haswell. Intels Partner HPE, Dell, Lenovo und Cisco wetteifern unter anderem beim wichtigen SAP-SD-Benchmark um die Rekordmarke. Die Nase vorn hatte diesmal Dell PowerEdge R930 unter RHEL 7.2 mit 41 450 Usern (0,99 s, 226 300 SAPS), gut 33 Prozent schneller als der Haswell.

Hier noch ein paar Performancewerte, die Intel vorab gemessen hat: SPECint_rate_base2006 (est.) kommt auf den neuen Rekordwert für 4-Sockel-Systeme von 3410 Punkten (+28 Prozent), SPECfp_rate_base2006 (est) liegt bei 2290 Punkten (+19 Prozent). Der Linpack knackt die 3-TFlops-Marke und der Speicher-Benchmark Stream erzielt 261 GByte/s.

Gegenüber IBMs Power8 in 8-Sockel-Maschinen brilliert Intels Neuling mit höherer Performance und niedrigerem Energieverbrauch und vor allem mit einem laut Intel zehnmal besseren Preis/Leistungsverhältnis, jedenfalls wenn man die edlen IBM-Listenpreise im Verhältnis zur SPECint-Performance anguckt.

IBM ist offenbar tatsächlich für den Markt zu teuer, laut IDC brach ihr Serverumsatz im ersten Quartal gegenüber dem Vorjahresquartal um 33 Prozent ein. Insgesamt verliert der Servermarkt etwas an Dynamik, sackte im Jahresvergleich um 3,6 Prozent ab. Nur HPE schwimmt mit einem Plus von 3,5 Prozent gegen den Strom. Ihre ARM-basierten Moonshot-Systeme werden es kaum sein, der ARM-Server-Markt, so IDC ohne Nennung genauer Zahlen, verliert weiter an Boden, dürfte beim Marktanteil weit unten im einstelligen Prozentbereich liegen.

Rücksicht

Diskreter Nachbau eines 6502-Prozessors: Seid Ihr verrückt? – Wahrscheinlich!

Immer mal wieder poppen auch urige Rückblicke auf vergangene Zeiten hoch, so etwa das Projekt, einen 6502-Prozessor komplett diskret nachzubauen (im FPGA gibts so was schon lange). Nachdem sich die Initiatoren mit der Dis-Integration des Timers 555 und des OPs 741 warmgelaufen hatten, starteten sie ihr Monster-Projekt mit nahezu 6502 diskreten Bauteilen (darunter 4300 Transistoren) auf Monster6502.com. Ein Prototyp läuft schon unter BASIC; Löt-Enthusiasten müssen aber noch ein bisschen warten, zu kaufen gibts die Platine noch nicht.

Mit Vakuum-Röhren, so die Initiatoren, planen sie indes aktuell nichts – ganz im Unterschied zu Forschern der Nanofabrication Group an der Caltech in Pasadena. Okay, deren Röhren sind etwas kleiner, winzige Vakuum-Röhren, nur ein Millionstel so groß wie die klassischen Vorbilder. Sie können mit wenig Energieverbrauch im Terahertz-Bereich arbeiten. Es dürfte zwar noch ein weiter Weg sein, aber vielleicht können solche Mikroröhren irgendwann die Frage „Was kommt nach CMOS?“ beantworten. Ob sie in der NF-Endstufe aber auch so einen unvergleichlich schönen Sound machen wie die echten klassischen Kollegen, etwa die EL34, muss dennoch bezweifelt werden. (as@ct.de)