CPU-Technik RISC-V hinkt bei Rechenleistung hinterher

Schottische Supercomputer-Experten vermessen den bisher stärksten RISC-V-Prozessor Sophon SG2042 mit 64 CPU-Kernen: Da bleibt Luft nach oben.

In Pocket speichern vorlesen Druckansicht 148 Kommentare lesen
Micro-ATX-Mainboard Milk-V Pioneer mit 64-Kern-RISC-V-CPU Sohpgo Sophon SG2042

Micro-ATX-Mainboard Milk-V Pioneer mit 64-Kern-RISC-V-CPU Sohpgo Sophon SG2042

(Bild: Milk-V)

Lesezeit: 4 Min.
Inhaltsverzeichnis

Die quelloffene CPU-Befehlssatzarchitektur RISC-V hat schon viele Systems-on-Chip (SoCs) erobert und entwickelt sich rasant weiter. Mehrere Projekte zielen auf den Einsatz von RISC-V-Chips im High-Performance Computing (HPC). Doch dazu muss RISC-V noch deutlich zulegen, schreibt eine Forschergruppe der Uni Edinburgh und vom chinesischen PerfXLab.

Die Supercomputer-Experten untersuchten den chinesischen Prozessor Sophgo Sophon SG2042 mit 64 CPU-Kernen vom Typ XuanTie C920. Er ist zur Zeit der stärkste in Serie produzierte RISC-V-Prozessor. Die Forscher verwendeten für ihre Experimente den Rechner Milk-V Pioneer, in dem der SG2042 auf einem Micro-ATX-Mainboard sitzt, das inklusive CPU rund 1200 US-Dollar kostet.

Mit zahlreichen Benchmarks maßen die Forscher die Singlethreading- und Multithreading-Rechenleistung des SG2042 vor allem bei der Verarbeitung von Gleitkommazahlen (Floating Point, FP) mit einfacher und doppelter Genauigkeit (FP32/FP64). Mit solchen Gleitkommazahlen rechnen viele HPC-Algorithmen und die FP64-Performance ist die Basis des Benchmarks Linpack, der die Rangordnung in der Top500-Liste der weltweit schnellsten Supercomputer bestimmt.

Ein C920-Kern kann solche Werte in seinen 128-Bit-Vektoreinheiten nach Spezifikation RVV v0.7.1 verarbeiten. Der XuanTie C920 ist ein Out-of-Order-Kern mit 2 GHz Taktfrequenz; im SG2042 teilen sich jeweils vier C920-Kerne 1 MByte L2-Cache und alle 64 Kerne zusammen nutzen 64 MByte L3-Cache. Der Speicher-Controller steuert vier Kanäle für DDR4-3200-RAM an.

Erwartungsgemäß rechnet jeder einzelne Kerne des SG2024 deutlich schneller als einer des StarFive JH7110 des Einplatinencomputers VisionFive 2 – aber der enorme Vorsprung überrascht: Der XuanTie C920 liefert bei 33 Prozent höherem Takt die vier- bis zwölffache Rechenleistung eines StarFive U74.

Im Vergleich zu x86-Prozessoren schneidet der Sophon SG2042 hingegen schlecht ab: Selbst der vor sieben Jahren vorgestellte 18-Kerner Intel Xeon E5-2695 v4 (Broadwell), ebenfalls mit 120 Watt TDP, vier DDR4-Speicherkanälen und sogar nur 45 MByte L3-Cache, rechnet vier- bis sechsmal so schnell wie der RISC-V-Konkurrent mit der 3,6-fachen Anzahl an Kernen.

Selbst der sieben Jahre alte Intel Xeon E5-2965v4 mit nur 18 Kernen rechnet mehrfach schneller als die 64 RISC-V-Kerne des Sophon SG2042.

(Bild: EPCC at the University of Edinburgh/PerfXLab)

Im Fazit ihres Papers mit dem Titel „Is RISC-V ready for HPC prime-time“ schreiben die Supercomputer-Experten einige Wünsche für die RISC-V-Entwicklung auf. Sie sehen Schwachpunkte bei der Anzahl der Speicher-Controller pro NUMA-Knoten und hoffen vor allem auf die RISC-V-Vektorspezifikation RVV v1.0, weil erst damit Compiler wie GCC und Clang optimierte Resultate liefern dürften.

Mehrere RISC-V-Entwicklungsfirmen haben zwar schon deutlich stärkere RV64GC-Kerne angekündigt, doch es dauert jeweils mehrere Jahre, bis die Serienfertigung damit ausgestatteter SoCs endlich läuft. So hatte SiFive etwa den erwähnten U74 des hierzulande erst seit Anfang 2023 erhältlichen StarFive JH7110 bereits 2018 angekündigt; mittlerweile ist der U74 sogar schon von der öffentlichen SiFive-Website verschwunden.

Bei der Vorstellung des SiFive P550 vor zwei Jahren zog SiFive Vergleiche zum ARM Cortex-A75; während aber unseres Wissens noch kein SoC mit P550 auf dem Markt ist, haben Smartphones mit Cortex-A76-SoCs wie dem Snapdragon 855 schon einige Jahre auf dem Buckel und in diesen Tagen erscheint der Raspberry Pi 5 mit vier Cortex-A76-Kernen mit 2,4 GHz im Broadcom BCM2712.

Zu den derzeit schnellsten avisierten RISC-V-Kernen gehört der vor knapp einem Jahr angekündigte SiFive P670, nun folgt der noch stärkere SiFive Performance P870. Ventana Microsystems wiederum tüftelt an CPU-Chiplets aus der 5-Nanometer-Fertigung namens Veyron V1 für Prozessoren mit bis zu 192 Kernen, die mit bis zu 3,6 GHz takten sollen.

Nach Firmenangaben lieferbar sind mittlerweile KI-Inferencing-Rechenbeschleuniger als PCIe-4.0-Karten der Firma Esperanto Technologies des einstigen Transmeta-Gründers Dave Ditzel. Der Esperanto ET-SOC-1 hat über 1000 RISC-V-Kerne, in einen Rackserver mit zwei Intel-Xeon-Prozessoren lassen sich bis zu 16 Karten mit zusammen über 16000 RISC-V-Kernen einbauen.

(ciw)