c't 13/2017
S. 28
Prozessorgeflüster
Epyc, Threadripper, Skylake X/SP

Prozessorgeflüster

Von neuer Hoffnung, dunkler Bedrohung und dem Erwachen der Macht

Es ist wie um die Jahrtausendwende, schon wieder tobt der Zweikampf zwischen Intel und AMD. Doch wer ist bei diesem Krieg der Sterne Jedi, wer Sith und wer Skyluke?

Auf der Computex in Taipeh überboten sich jedenfalls die beiden Kontrahenten mit ihren Höchstleistungsprozessoren für Desktop-PCs (siehe S. 16). Und die Serverprozessoren Skylake SP und Epyc (Codename Naples) schärfen schon die Klingen ihrer Lichtschwerter. Epyc soll am ersten Tag des ISC’17, dem 20. Juni, in Ein- und Zweisockelsystemen in die Arena steigen.

Am 20. Juni soll er erscheinen, AMDs neuer Serverchip Epyc, aber noch gibt es keine offiziellen Informationen über Versionen, Takt, Preise …

AMD-Chefin Lisa Su hat bislang noch sehr wenig über ihn verraten, kein Wort etwa zu den Versionen, zum Takt oder zum Preis. Man will es dem Rivalen eben nicht zu leicht machen.

Derzeit kursieren zahlreiche Naples-Testmuster im B1-Step bei 1,9 GHz Takt. Die finale Version im B2-Step wird dann einige 100 MHz mehr haben. Um unterhalb von 180 Watt TDP zu bleiben, müsste der 32-Kerner bei etwa 2,1 oder 2,2 GHz landen. Natürlich gibt es dann auch kleinere Versionen, die man per BIOS durch Abschalten von ein, zwei oder drei der vier Dies im Gehäuse simulieren kann. Ziel muss es für AMD sein, insbesondere auch die HPC-Gemeinde mit niedrigem Preis pro Performance zu überzeugen. Man hört im Vorfeld, dass AMD da den Spielraum nach unten noch stärker ausnutzen könnte und sich nicht so sehr an Intels superteuren Flaggschiffen orientieren sollte. Wann der Konkurrent die neue Xeon-Generation Skylake-SP offiziell herausbringt, ist noch unklar, der wird aber nicht mehr lange auf sich warten lassen.

Bei den neuen High-End-Desktop-Prozessoren ist Intel auf der Computex sogar vorgeprescht, zumindest mit den kleineren Versionen. AMDs Threadripper wurde für „Summer“ angekündigt. Der Prozessor hat nicht nur einen kampfbetonten Namen, er glänzt auch mit bis zu 16 Kernen, 32 Threads und 64 PCIe-Lanes in einem Sockel mit mehr als 4000 Anschlüssen. Intel kontert mit der Core-X-Series-Familie (Basin Falls) für den Sockel LGA2066 und bietet sogar bis zu 18 Kerne, 36 Threads und 44 PCIe-Lanes. Von den Prozessoren kennt man schon die offizielle Namen und Preise, etwa Core i9 7980EX für den 18-Kerner zum OEM-Schnäppchenpreis von 2000 US-Dollar.

AMD hält sich indes auch beim Threadripper mit Angaben zu Takt und Preis noch vornehm zurück. Inoffiziell findet man im Web etwa das 16-kernige Flaggschiff unter „Threadripper 1998X“ – ja, ja 1998, das war das Erscheinungsjahr der damals sehr erfolgreichen AMD K6-2/3. Die liefen in jenem Jahr maximal mit 400 MHz bei23 Watt – der 1998X hingegen soll mit immerhin 3,5 GHz (Turbo 3,9 GHz) und 16 Kernen bei 155 Watt laufen.

Informationen insbesondere zu den Taktfrequenzen gab auch Intel nur stückweise bekannt, nämlich nur zu den LCC-Typen (Low Core Count) mit 6, 8 oder 10 Kernen. Die Versionen mit 12 bis 18 Kernen bleiben vorerst noch im Dunkeln, sie sollen auch erst im August folgen.

AVX512 oder was?

Zudem bleibt unklar, wie das denn nun genau mit der AVX512-Erweiterung bei welchem Prozessor aussieht. Im Intel-Archiv ark.intel.com stehen zwar die drei LCC-Versionen mit AVX-512 drin, aber im bereits erschienenen Datenbuch Vol.1 findet man zu AVX512 kein einziges Wort, weder unter Features noch im Kapitel 3.6 zu „Intel Advanced Vector Extension“. Auch die Fact Sheets geben keine Aufklärung, lediglich beim 18-Kerner „Core I9 Extreme Edition Processor“ 7980EX heißt es „New! Support for Intel AVX512“. So wundert es nicht, dass man im Internet zahlreiche Spekulationen dazu findet, etwa dass hier AVX512, falls überhaupt vorhanden, mit den 256-bittigen AVX-Einheiten nur „emuliert“ wird. Merkwürdig niedrig liegen auch die ersten aufgetauchten Ergebnisse von Sandras Mandelbrot-Benchmark für getarnte Core-X-Prozessoren mit 6 und 10 Kernen. Da sind die Skylake-SP-Xeon-Systeme pro Kern und GHz weit voraus.

Interessant sind in diesem Zusammenhang die veröffentlichten Die-Plots vom 18-Kerner Core i9-7980XE und das auf dem Manufacturing Day veröffentliche Bild eines Server-Chips mit 28 Kernen, vermutlich des Xeon Platinum 8180M. Man sieht insgesamt 20 Kerne hier, 30 dort, doch jeweils zwei davon sehen völlig anders aus. Was mag das sein? L3-Cache? – Eher nicht, der müsste als Segment von 1,375 MByte Größe auf jedem Core vorhanden sein. L3-Directory? Snoop-Filter? – Oder sind hier gar externe AVX512-Einheiten unterbracht? Aber so weit weg von den Register-Files, Schedulern und dem L1-Cache – erscheint das wenig sinnvoll. Hier ist mal wieder Chiparchitekt Hans de Vries gefordert, das aus den veröffentlichten Pixeln herauszulesen.

Intels neues Flaggschiff Core i9 7980EX mit 18 Kernen und zwei mysteriösen Einheiten (zweiter „Kern“ oben und unten von links). Beim großen Xeon-Bruder 8180M siehts genauso aus, nur hat der 10 weitere Kerne in der Mitte.

Man hört zudem, dass es auch bei den Xeon-Chips Skylake SP unterschiedliche Ausführungen geben wird, solche mit nur einer – schnell angebundenen – AVX512-Einheit und, offenbar verziert mit einem angehängten M wie beim Platinum 8180M, mit einer zweiten AVX512-Einheit, die allerdings eine etwas höhere Latenz aufweist. Für Letztere muss man dann nochmal kräftig in die Tasche greifen. Wenn der britische Online-Händler Ballicom recht hat, liegt der 8180M bei einer Preisempfehlung von umgerechnet etwa 30.000 US-Dollar …

AVX512 bringt übrigens mehr als nur eine Verdoppelung der Breite der Recheneinheiten. Es bietet auch doppelt so viele Register und zwar nicht nur für 512-Bit-Register (ZMM), sondern auch für AVX (YMM) und SSE (XMM) – falls denn wie beim Skylake SP auch das Merkmal AVX512VL gesetzt ist. Der Xeon Phi Knights Landing kennt das nicht. Außerdem gibt es noch sieben recht praktische Maskenregister. Aber solange die Software die zusätzlichen Register nicht effizient ausnutzt, dürfte der normale AVX-Betrieb zumeist effizienter sein, da für AVX512 der Takt nochmals weiter gesenkt wird. Der lässt sich bei der Core X-Series allerdings übertakten (Stichwort: AVX-512 ratio offset).

Bugs und RFID

Ein Bug beim Ryzen machte unter dem Namen VME-Bug die Runde. VME steht für Virtual-8086 Mode Extensions und betrifft „Uralt-Betriebssysteme“ wie Windows XP und Windows Server 2003, wenn diese noch urältere 16-Bit-Programme im Real Mode ausführen. Die Oldtimer laufen mit den neuen Prozessoren ohnehin nicht vernünftig, wer aber partout nicht das Betriebssystem updaten will: mit dem Firmware-Update Agesa 1.0.0.6 wird auch dieses Problem beseitigt. Weitaus problematischer dürfte da schon der Bug SKZ7 der neuen Core-X-Familie sein, der dazu führt, dass eine gemischte Nutzung von 8-Bit und 64-Bit-Registern in kurzen Schleifen zu „unpredicable system behavior“ führen kann. Aber auch hier soll das BIOS Abhilfe schaffen können – hoffentlich tut es das auch.

Für viel Rauschen im Netz hat OC-Legende Roman Hartung (Der8auer) gesorgt, als er den auf der Platine eines Core i9 aufgebrachten Chip als RFID-Chip identifizierte. Dieser Chip trägt vermutlich Konfigurationsdaten, etwa die zugeordnete Typennummer (sSpec) und kann kontaktfrei aus ein paar Zentimetern Abstand ausgelesen werden. Auch zur Fälschungssicherheit könnte er beitragen. Aluhut-Träger machen sich nun Sorgen – doch das müssten wohl allenfalls diejenigen, die unter NDA erhaltene Testexemplare auf Ebay, Alibaba oder Taobao feilbieten. (as@ct.de)