Für Supercomputer: Rechenbeschleuniger mit eingebauten CPU-Kernen

In vielen (KI-)Supercomputern leisten Rechenbeschleuniger den Löwenanteil der Arbeit. Separate CPUs fallen daher in solchen Systemen immer häufiger weg.

Artikel verschenken
In Pocket speichern vorlesen Druckansicht 2 Kommentare lesen

Der AMD Instinct MI300A hat nicht nur mehrere Hundert schnelle Recheneinheiten, sondern auch 24 x86-Kerne vom Typ Zen 4. Man sieht sie links unten im bläulichen Teil des Chips.

(Bild: Lawrence Livermore National Laboratory/ISC)

Lesezeit: 7 Min.
Inhaltsverzeichnis

Zurzeit kommen die ersten Server-APUs auf den Markt. Diese Kombiprozessoren vereinen im gleichen Gehäuse Rechenbeschleuniger sowie Allzweckprozessoren mit ARM- oder x86-Befehlssatz. Den Anfang machen AMDs Instinct MI300A und Nvidias GH200 "Grace Hopper". Intel wird wohl folgen und plante das ursprünglich 2025 für "Falcon Shores", nun vielleicht erst später. Solche Server-APUs versprechen für leistungsstarke Supercomputer erhebliche Vorteile bei Kosten, Energieeffizienz und Platzbedarf.

Die Abkürzung "APU" für Accelerated Processing Units prägte AMD vor rund zwölf Jahren und sprach seinerzeit gerne und viel auch von der Heterogeneous System Architecture (HSA). Gemeint war, dass die bei Mobilprozessoren schon lange üblichen integrierten Grafikprozessoren nicht mehr als bloße 3D-Beschleuniger und Videodecoder dienen, sondern auch Allzweckrechenleistung beisteuern. Dann rechnen sowohl die x86- als auch die GPU-Einheiten gemeinsam, bilden also ein heterogenes System.

Mehr zu: Prozessor- & GPU-Architektur

Das klappt tatsächlich; über Programmierschnittstellen wie OpenCL und CUDA lässt sich praktisch jede aktuelle GPU – ob in der CPU integriert oder nicht – zum Rechnen einspannen. Doch größere Vorteile ergeben sich erst, wenn es um eine wirklich starke GPU geht, etwa um einen KI-Rechenbeschleuniger mit mehreren Teraflops (TFlops) Leistung. Die gibt es bisher für PCs und Notebooks nicht – mit einer prominenten Ausnahme: Apples M-Prozessoren. Denn während x86-APUs schlichtweg zu schwache GPU-Teile haben, gönnt Apple der GPU sehr viel Siliziumfläche und bindet extrem schnellen (LPDDR5X-)Speicher an.