c't 25/2023
S. 38
Aktuell
Prozessoren

Bit-Rauschen

Der bisher schnellste RISC-V-Prozessor rechnet eher langsam

Die offene RISC-V-Technik hat viele Vorteile, schwächelt bisher aber bei der Rechenleistung. Samsung und Qualcomm stellen Chips fürs Smartphone Galaxy S24 vor. Nvidia verspricht noch stärkere KI-GPUs.

Von Christof Windeck

Die RISC-V-Technik ist erfolgreich, laut RISC-V Foundation wurden schon mehr als 10 Milliarden Chips damit produziert. Meistens geht es dabei jedoch um simple 32-Bit-Kerne (RV32) für (eingebettete) Mikrocontroller, bei denen es auf Rechenleistung nicht so ankommt. RV64GC-Kerne für Linux findet man hingegen noch nicht häufig und die meisten rechnen lahm. Das zeigte sich schon beim ersten bezahlbaren Raspi-Konkurrenten mit RISC-V, dem StarFive VisionFive 2, dessen Vierkerner JH7110 mit den vor fünf Jahren vorgestellten SiFive-U74-Kernen nicht die Wurst vom Brot zieht.

Schottische Supercomputer-Experten nahmen nun den chinesischen 120-Watt-Chip Sophgo Sophon SG2042 mit 64 RISC-V-Kernen vom Typ XuanTie C920 unter ihre Benchmark-Lupe. Sie vermaßen Berechnungen mit den fürs High-Performance Computing (HPC) wichtigen Gleitkommazahlen mit einfacher und doppelter Genauigkeit (FP32/FP64). Dabei schlägt der SG2042 zwar den erwähnten JH7110 um Längen, doch Intels sieben Jahre alter Xeon E5-2695 v4 (Broadwell) mit nur 18 x86-Kernen ist vier- bis zwölfmal so schnell. Dabei haben die 64 C920-Kerne sogar 128-Bit-Vektorrechenwerke, takten mit 2 GHz und haben ähnlich große L2- und L3-Caches wie der alte Xeon, der nominell ebenfalls 120 Watt schluckt.

Die 64 RISC-V-Kerne der chinesischen CPU Sophon SG20242 verarbeiten FP64-Gleitkommazahlen viel langsamer als die 18 x86-Kerne eines sieben Jahre alten Intel Xeon., Bild: Milk-V
Die 64 RISC-V-Kerne der chinesischen CPU Sophon SG20242 verarbeiten FP64-Gleitkommazahlen viel langsamer als die 18 x86-Kerne eines sieben Jahre alten Intel Xeon.
Bild: Milk-V

Nun werden zwar immer wieder schnellere RISC-V-Kerne angekündigt, kürzlich etwa der SiFive P870. Doch es dauert Jahre, bis sie endlich in Systems-on-Chip (SoCs) aus der Serienfertigung auf dem Markt erscheinen. Das ist ein Hase-und-Igel-Rennen mit den etablierten ARM- und x86-Prozessoren. So hatte SiFive 2021 beispielsweise den P550 angekündigt als damals schnellsten RISC-V-Kern, der es mit einem ARM Cortex-A75 aufnehmen sollte. Doch P550-SoCs sind noch nirgends zu finden, während der Raspberry Pi 5 mit flinken Cortex-A76-Kernen vergleichsweise günstig ins Rennen geht.

Samsung-ARMe

Samsung entwickelt schon seit vielen Jahren ARM-SoCs für Smartphones, nämlich die Exynos-Serie. Immer wieder bleibt diesen in den hauseigenen Galaxy-Smartphones aber nur der Katzentisch, die Spitzengeräte bekommen Qualcomm-Snapdragons. Letztere sind oft noch einen Tick schneller und vor allem aber effizienter, müssen sich also bei längerer Belastung nicht so schnell drosseln, um nicht zu überhitzen. In diesem jahrelangen Wettrennen zwischen den Samsung-internen Entwicklern und Qualcomm übernehmen bald Exynos 2400 und Snapdragon 8 Gen 4 die Staffelstäbe, beide haben je einen „Prime Core“ vom ARM-Typ Cortex-X4. Vorab entwischte Ergebnisse des Geekbench 6.2.0 zeigen den Drachen wieder leicht in Führung. Möglicherweise liegt es daran, dass der Snapdragon wie Apples A17 Pro der TSMC-Fertigungstechnik N3 entstammt, während Samsung den Exynos 2400 mit „4LPP“ fertigt. Das überrascht, weil Samsungs hauseigene 3-Nanometer-Technik mit Gate-All-Around-Transistoren angeblich schon seit Mitte 2022 in Serie läuft. Bloß kennt man bis heute keinen Chip, der sie nutzt – wir bleiben gespannt.

Samsungs Chipsparte musste auch fürs dritte Quartal 2023 Verluste melden, aber die fielen kleiner aus als befürchtet. Man erwartet, 2024 wieder Gewinn zu machen. Die Preise für NAND-Flash zogen schon wieder an, auch weil die Produktion gekürzt wurde, um das Angebot zu verknappen. Auch bei DDR5-Arbeitsspeicher sollen Nachfrage und Preise anziehen.

Nvidias KI-Roadmap

Fast jeder Hersteller, der eigene KI-Beschleuniger entwickelt, vergleicht sie mit denen von Nvidia, aktuell also vor allem mit Hopper (H100). AMD-Chefin Lisa Su meint lustigerweise trotzdem, es hätte sich noch kein klarer Marktführer bei KI-Beschleunigern etabliert. Und immer wieder preisen Firmen mutig Chips an, die schneller, effizienter oder billiger sein sollen als eine H100. So mancher angebliche Nvidia-Killer hat aber das eine oder andere Problemchen – einige sind nicht wirklich fertig, anderen fehlt noch Software. Jetzt machte Platzhirsch Nvidia eine Ansage in Form einer Roadmap bis 2026: 2024 kommt nicht bloß ein H200, also vermutlich eine neue Hopper-Variante, sondern auch ein B100 – das B steht für Blackwell. 2025 will Nvidia wieder einen Neuling bringen, genannt „X100“ – das „X“ ist vermutlich ein Platzhalter. Am ARM-Prozessor Grace scheinen keine wesentlichen Änderungen geplant, die Kombiprozessoren für 2024 und 2025 heißen GH200, GB200 und GX200. Die Varianten fürs KI-Training mit supergroßem RAM bekommen den Zusatz NVL, die erste Version GH200NVL kommt 2024 mit 144 GByte HBM3E-RAM. AMD will beim Instinct MI300X mit 192 GByte HBM3 allerdings noch mehr bieten. (ciw@ct.de)

Kommentieren