c't 1/2017
S. 26
Prozessorgeflüster

Prozessorgeflüster

Von Instruktionen und Takten

Selbst der zuweilen recht griesgrämige Linus Torvalds klatschte verhalten Beifall und würde sich freuen, „wenn AMD endlich mal wieder einen guten Kern hätte“. Laut AMD-Chefin Lisa Su bringt der neue Ryzen jedenfalls „everything and more“, vor allem jede Menge IPC.

Garniert mit 4K-Baller-Spielen und Blender-Benchmarks führte der erste Vertreter der Zen-Architektur im Webcast „New Horyzen“ unter lautem Jubel der geladenen Gäste in Austin/Texas seine Fähigkeiten erstmals öffentlich vor (S. 28). Auf der CES Anfang Januar, das ist sicher, wird man dann noch viel mehr erleben dürfen. Damit bekommt Intel wieder ernstzunehmende Konkurrenz, nicht nur bei den Produkten, sondern auch bei hübschen neuen Marketing-Begriffen.

Statt mit langweiliger Sprungvorhersage hat man es bei AMD nun ganz im Trend mit „Neural Net Prediction“ zu tun. So neu ist das indes nicht. Schon der alte Bulldozer hatte einen „Perceptron Predictor“, der ähnlich wie ein neuronales Netz dazulernte und der, anders als frühere Verfahren, auch sehr lange Sprungmuster verfolgen konnte. Der Steamroller, legte für seine Vorhersagen vermutlich über 10.000 Einträge im zweistufigen Branch Target Buffer (BTB) ab – so nimmt man jedenfalls an, denn genaue Unterlagen gibt es dazu nicht. Seine mittlere Trefferquote soll damit insgesamt über 20 Prozent besser gewesen sein als beim Piledriver zuvor.

Instruktionen pro Takt (IPC)

Zen, so hatte AMD-Fellow Mike Clark schon auf der Hot Chips im Sommer verraten, soll gleich beide möglichen Sprungziele samt Zusatzinformationen (Tags) im BTB ablegen. Gut ein Viertel des gegenüber dem letzten Bulldozer „Excavator“ um 40 Prozent verbesserten IPC-Wertes (Instructions per Clock, IPC), gab Clarks Chefin Lisa Su an, sei allein auf die verbesserte Sprungvorhersage zurückzuführen. Und vielleicht, so deutete sie an, sind es sogar mehr als die versprochenen 40 Prozent – bei gleicher Energieaufnahme. Und der Basistakt soll immerhin 3,4 GHz oder mehr betragen.

40-Prozent-Schritte

Das klingt gut, doch auch Intel macht solche Fortschritte bei IPC, mitunter ohne sie an die große Glocke zu hängen, jedenfalls beim Atom. Über die Innereien des neuen Goldmont-Chips hatte Intel beim Apollo-Lake-Stapellauf jedenfalls kaum was bekannt gegeben. Inzwischen findet man zumindest ein paar Details im Software Optimization Manual vom November. Demnach hat Intel nicht nur die Out-of-Order-Fähigkeiten der Atom-Architektur deutlich verbessert, sondern ihm auch eine komplette dritte Integer-Pipeline spendiert, mit drei Decodern, drei Integer-ALUs und dreifach parallelem Beendigen der Befehle (Retirement). Dabei wurde natürlich auch wieder die Sprungvorhersageeinheit verbessert. Das war auch nötig, denn die Basis-Pipeline beträgt nunmehr 12 statt zuvor 10 Stufen. Das bedeutet längere „Strafzeiten“ bei falscher Vorhersage. Im Schnitt, so hat Intel ermittelt, soll die Anzahl der ausgeführten Befehle im Vergleich zum Silvermont wie bei Zen pro Takt um 40 Prozent steigen.

Aber auch bei der Core-Linie sieht Intel zu, dass nicht immer nur mehr Kerne eingebaut werden und der Turbo-Takt noch flexibler wird, sondern dass auch der IPC-Wert von Generation zu Generation zulegt: vom Westmere bis zum Skylake insgesamt etwa um ein Drittel. Die Werte, die Intel „nach internen Messungen“ angibt, stimmen auch halbwegs mit unseren SPECint-Messungen und mit denen der Community (zumeist mit Cinebench R15) überein. Lediglich der Skylake kommt bei Intel etwas zu gut weg. Ein Haswell-Prozessor erreicht im Single-Thread-Betrieb, gemessen mit Intels Open-Source-Tool PCM, typische Werte von 1,5 IPC, bestenfalls vielleicht mal 2.

Crusoe und Shasta

Welche IPC-Werte theoretisch denkbar sind, hatte mal die Firma Soft Machines mit ihrer VISC-Technik ausgelotet, ein Konzept, bei dem mehrere Kerne an einem Thread arbeiten. IPC-Werte von bis zu 10, im Schnitt von 4 bis 6 wären damit drin, so frohlockte Firmenchef Mohammed Abdallah. Ihn und seinen Chefarchitekten Mandeed Singh konnte ich im August zwischen Intel-Developer- und Hot-Chips-Konferenz in ihren Headquarters besuchen.

Ex-CEO von Soft Machines, Mohammed Abdallah, vor den – gut gekühlten – Simulator-Plattformen von Mentor Graphics.

An nahezu gleicher Stelle in Santa Clara im legendären Freedom Circle logierte einst auch die Prozessorfirma Transmeta, die mit ihrem Crusoe-Prozessor damals sehr viel Aufsehen erregte. Vor nunmehr fast 17 Jahren hatte ich sie – passenderweise ebenfalls an einem Freitag – noch vor dem glanzvollen IPO „heimgesucht“ und bin fast einen ganzen Tag CEO Dave Ditzel, dem eingangs erwähnten Linus Torvalds und vielen anderen illustren Mitarbeitern auf die Nerven gefallen. Wir hatten damals auch intensiv über IPC gesprochen. Die Werte weiß ich nicht mehr, sie müssen recht ordentlich gewesen sein, zumal der Prozessor zur Laufzeit dazulernen und Hotspots optimieren konnte. Nur mit dem Takt kam der Crusoe einfach nicht hoch.

Das wollte Soft Machines besser machen, ihr von TSMC gefertigter Shasta-Prozessor soll immerhin mit 2 GHz Takt laufen. Singh und Abdallah zeigten mir auch sehr gute IPC-Ergebnisse eines SPEC2006-Laufes weit jenseits der 2, und zwar sowohl die mit der Testhardware gemessenen als auch die vom Simulator.

Nein, ich habs nicht eingefädelt – aber keine zwei Wochen später hing bei Soft Machines ein Schild von der kleinen Firma von gegenüber: „an Intel Company“. Für einen läppischen Kaufpreis von 250 Millionen US-Dollar ist das Start-up nun Bestandteil der großen Corporation. Gut 220 Millionen hatten die Investoren, darunter vor allem AMD und Samsung, in Soft Machines investiert – das hat sich zwar nicht wirklich gelohnt, aber immerhin gibts jetzt ein bisschen Geld direkt vom Konkurrenten Intel. Andere „Zuschüsse“ von Intel für AMD sind eher unwahrscheinlich. An dem Gerücht, Intel wolle AMD Radeon in Lizenz nehmen, ist vermutlich nichts dran. Eher schon daran, dass Microsoft mal wieder AMD aufkaufen wolle, ausgerechnet jetzt, nachdem der Aktienkurs auf über 10 Dollar gestiegen ist.

Intel hat derweil nicht nur Soft Machines stiekum eingekauft, sondern hat in diesem Jahr gleich zehn weitere Firmen akquiriert. Neben dem dicken Brocken Altera kam im Sommer der Machine-Learning-Spezialist Nervana für immerhin 400 Millionen Dollar hinzu. Zu etwa dem gleichen Kaufpreis folgte im September mit Movidius eine weitere Prozessorfirma, die ebenfalls im Trend-Bereich Machine Learning, Robotics, VR und Wearables tätig ist. Im November wurde man im deutschen Rhein-Neckar-Kreis fündig und erwarb die Drohnenfirma MAVinci GmbH. Dann schaute sich Intel noch mal im Silicon Valley um und kaufte die VR-Firma Voke.

Was Intel mit all den eingekauften Prozessor-Patenten machen will, bleibt unklar. Vermutlich werden diese wie Gold als Anlage in den Tresor gepackt, ebenso wie die von Transmeta, Elbrus und anderen. Ex-Transmeta-Chef Ditzel hatte als Intel-Mitarbeiter ja mal ein vielversprechendes Design mitentwickelt, das dann aber doch nur in der Schublade landete. Aber wer weiß, vielleicht wird die ja irgendwann wieder geöffnet. (as@ct.de)