c't 14/2017
S. 20
Prozessorgeflüster
AMD und ARM vs. Intel

Prozessorgeflüster

Von Konkurrenzkampf, Patentkämpfen, Bugs und viel Geld

AMD treibt Intel vor sich her, bei denen es hier und dort hakt. Intel beharkt sich derweil auch mit Qualcomm und Microsoft. Das Wettrüsten um Exascale-Superrechner beschleunigt sich und es regnet Fördergelder – auch für Chips, die Datenhaufen nach Stecknadeln durchsuchen.

Ein Prozessor-Sommerloch ist nicht in Sicht: Gerade startet AMDs Server-Chip Epyc (Naples) gegen Intels Xeon-SP auf der Supercomputer-Konferenz ISC High Performance 2017. Die HPC-Szene will harte Zahlen sehen: Benchmark-Schlachten stehen an – und die neue Top500-Liste ist schon da, sogar mit einigen Xeon-SP-Systemen (siehe S. 22).

MEMS-Sensoren wie diesen Beschleunigungssensor will Bosch bald auch in Dresden herstellen. Zum Größenvergleich ist ein Haar abgebildet. Bild: Bosch

Beim Xeon-SP mustert Intel den mit Sandy Bridge eingeführten Ringbus zur internen Kern-Verknüpfung aus: Wie beim Xeon Phi x200 koppelt künftig ein sogenanntes Mesh alle Prozessorkerne untereinander sowie mit den Speicher-Controllern, den PCIe-, UPI- und Omni-Path-Lanes. Ob das hilft, AMD Epyc fernzuhalten, werden wir bald sehen. Mancher Server-Hersteller will wohl erst 2018 mit den 7-nm-Epycs mit Zen 2 (Codename Rome) loslegen. Dafür zeigt sich AMD-Zulieferer Globalfoundries gerüstet, im zweiten Halbjahr 2018 soll die 7-nm-Produktion im Werk New York wie am Schnürchen laufen – zunächst ohne EUV-Lithografie, also noch mit Laserlicht. IBM, auch nach Verkauf der eigenen Fabs treibende Kraft bei der Chip-Entwicklungsallianz mit Globalfoundries und Samsung, zeigte auch schon 5-nm-Transistoren mit „Nanosheets“ und Gate All Allround (GAA-FETs). Und Samsung hat 4-nm-Pläne verkündet.

Das nächste Rennen heißt AMD Ryzen Threadripper vs. Intel Core X. Laut Intel ist der neue Zehnkerner Core i9-7900X im Cinebench R15 um 20 Prozent schneller als sein Vorgänger Core i7-6950X – und 40 Prozent billiger. Den Neuling soll man noch vor der nächsten c’t bekommen können. Wir hoffentlich auch: Intel schaffte es nicht, Testmuster rechtzeitig in die Redaktion zu schicken. Nur Übertakter bekamen schon vorher Zugriff, weil Intel mit Gigahertz-Rekorden protzen will.

Den 18-Kerner Core i9-7980X will Intel ohnehin erst im Oktober ausliefern, da ist AMD mit Ryzen Threadripper vielleicht schneller. AMD spielt seine Trümpfe geschickt aus und auch Bugs scheinen die Euphorie der Käufer nicht zu trüben: Da waren der FMA-Bug, dann der VME-Bug und mehrere Schwierigkeiten mit DRAM, die BIOS-Updates mit AGESA 1.0.0.6 lösen sollen. Nun melden Linux-Nutzer, die häufig Code kompilieren, „Segmentation faults“: Angeblich ebenfalls ein Ryzen-Bug, für den Matt Dillon – nicht der Schauspieler, sondern ein Entwickler von DragonFly BSD – schon Ende März einen Patch entwickelt hat. Vor dem Epyc-Start muss AMD jedenfalls die letzten Zen-Bugs ausgebügelt haben, denn Server-Käufer haben in Bezug auf Rechenfehler keinen Humor.

Den üblichen „Revision Guide“ mit den bisher bekannten CPU-Fehlern vermisst man auch drei Monate nach dem Ryzen-Start noch. Einige Datenblätter zum Core X liefert Intel zwar jetzt schon, ist aber sonst nicht immer besser: Zu Apollo-Lake-Chips wie dem Celeron N3450 sucht man sieben Monate nach ihrer Einführung noch vergeblich nach Datenblättern. Und auch Pannen gab es bei Intel zur Genüge: den Defekt im Atom C2000 für NAS und Router, den Bug in der Firmware der Management Engine, Verspätungen bei Xeon Phi, 3D XPoint und beim Atom x7-E3900.

Qualcomm-Querelen

Nicht nur AMD, auch Qualcomm will Intels lukrative Marktanteile anknabbern: Zum Weihnachtsgeschäft sollen „Always Connected PCs“ mit Windows 10 und Snapdragon 835 kommen. Microsoft wagt sozusagen einen zweiten Versuch mit Windows RT, also Windows auf ARM-SoCs. Damit es diesmal klappt, haben die schlanken Notebooks und Tablets nicht bloß LTE-Modems und 64-Bit-Windows an Bord, sondern auch eine Emulation für Win32-Software. Damit führen sie 32-Bit-Programme mit x86-Code aus. Das ruft Intels gefürchtete Rechtsabteilung auf den Plan. Chefjustitiar Steven Rodgers erwähnte in einem Blog-Beitrag zunächst mehr als 1600 Patente auf Intels x86 Instruction Set Architecture (x86-ISA), um dann wie nebenbei zu drohen: „Intel setzt seine x86-Patentrechte wachsam durch.“

Auch bei Servern will Qualcomm in Intel-Wäldern wildern, nämlich mit dem kommenden Centriq 2400 mit ARM64-Innenleben. Auch Caviums zweite ARM-Generation ThunderX2 läuft nun in HPEs „The Machine“ – wenn auch nur im Prototyp. Den seit Jahren ständig bevorstehende ARM-Server-Durchmarsch könnte das ein wenig in Fahrt bringen: Gartner und IDC sehen den ARM-Server-Marktanteil bislang nahe der Nachweisgrenze. Branchenkenner Charlie Demerjian wirft ihnen Asien-Blindheit vor: In China seien ARM-Server erfolgreich. Qualcomm hat dort ein Jointventure für ARM-Server-SoCs gegründet, AMD will SoCs mit dem Partner TAHIT entwickeln.

Es steckt aber nicht bloß Nationalstolz dahinter, dass China den kommenden Supercomputer Tianhe-3 mit heimischen Chips bestücken will – wie den bisherigen Top500-Primus TaihuLight mit ShenWei/Sunway SW26010. Vielmehr gibt es handfeste Argumente für die Fertigung in China: Das vermeidet Hintertürchen für Spionage oder Sabotage aus den USA. Intels Kryptosignatur für Microcode-Updates in der CPU und die Management Engine (Intel ME) in Chipsätzen sind aus chinesischer Sicht Teufelszeug. Das gilt ganz besonders für Server der „Great Firewall“, die die chinesische Bevölkerung vom Besuch unbotmäßiger Webseiten im kapitalistischen Ausland abhält.

Geld für Chips

Der erwähnte chinesische Top500-Spitzenreiter kratzt knapp an der 0,1-Exaflops-Marke, doch Tianhe-3 soll vor 2020 in Exascale-Regionen vordringen. Das chinesische Chip-Wettrüsten kontern die Forschungsagentur DARPA des US-Verteidungsministeriums sowie das Department of Energy (DoE) mit Subventionen. Das DoE pumpt weitere 258 Millionen US-Dollar in Forschungsverträge mit AMD, Cray, HPE, IBM, Intel und Nvidia, um bei Exaflops-Supercomputern aufzuholen. Auch die EU will mit einigen Milliarden auf einen der ersten drei Top500-Plätze kommen; der Brexit wirbelt hier frühere Planungen durcheinander.

HIVE-Prozessoren sollen dünnbesetzte Matrizen effizienter durchforsten. Bild: DARPA

Die DARPA schickt außerdem – ausgerechnet! – Intel und Qualcomm in ein Wettrennen um die Entwicklung eines neuartigen Prozessors: Hierarchical Identify Verify Exploit (HIVE) soll Algorithmen der Graphentheorie 1000-fach effizienter erledigen als bisherige CPUs mit von-Neumann-Architektur, als GPUs oder auch als Googles Tensor Processing Unit (TPU). Bei Streaming Graph Analytics rechnen die Chips mit dünnbesetzten Matrizen (Sparse Matrices), um Zusammenhänge in riesigen Datenmassen zu erkennen.

Auch die EU sieht europäische Mikroelektronik insgesamt als „Important Project of Common European Interest“ (IPCEI), das es nach Kräften zu fördern gilt. Das deutsche Rahmenprogramm „Mikroelektronik aus Deutschland – Innovationstreiber für die Digitalisierung“ stellt dafür 1 Milliarde Euro bereit. Einen Teil davon steckt Bosch in eine neue Chip-Fab für MEMS-Sensoren in Dresden. Weitere Millionen fließen ins Projekt Productive4.0 (ja, ohne Leerzeichen) unter Leitung von Infineon und in die virtuelle „Forschungsfabrik Mikroelektronik Deutschland“ mit über 2000 Wissenschaftlern.

Chips für Geld

Unterdessen erlebt das Schürfen von Kryptogeld mit Grafikkarten eine Renaissance: Das klappt zwar nicht mehr mit Bitcoins – dabei sind ASIC-Miner nicht mehr zu schlagen –, aber mit Ethereum. Rasch schwankende Kurse machen das „Mining“ jedoch zu einem sehr riskanten Spiel. Anonyme Zahlungsmittel freuen auch Dunkelmänner: Bar bezahlte Hardware verwandelt Schwarzgeld in virtuelle Münzen, die problemlos über Staatengrenzen fließen und keine Steuern fürchten. Manche AMD-Radeon-Karten sind ausverkauft, weil sie Millionen Hashes pro Sekunde schaffen. Dabei wird viel Strom zu Hitze, was den Kollegen beim Mining-Test im sommerlich-heißen c’t-Büro den Schweiß nicht bloß auf die Stirnen trieb. (ciw@ct.de)