ISC23: Details zum Intel-Supercomputer Aurora, Falcon Shores endgültig erst 2025

Aurora hat wieder einmal die Top500-Veröffentlichung verpasst. Intel zeigt dafür aber Prozessor und Beschleuniger und beteuert baldige Verfügbarkeit im Markt.

In Pocket speichern vorlesen Druckansicht 3 Kommentare lesen
Verschiedene Innereien von Hochleistungscomputern

Intel zeigt Aurora-Zutaten: Data Center CPU Max und GPU Max auf Boards von Supermicro.

Lesezeit: 4 Min.
Inhaltsverzeichnis

Den Termin für die Juni-2023-Liste der Top 500 der schnellsten Supercomputer weltweit hat Intels Exascale-Vorzeigeprojekt Aurora auch gerissen. Die Intel Xeon Datacenter CPU Max und die Datacenter GPU Max gibt es aber wirklich – zumindest scheint sich Intel mit Macht gegen böse Zungen wehren zu wollen und anderslautende Gerüchte gar nicht erst entstehen lassen.

Beide Komponenten zeigte der Hersteller in jeweils getrennten Demos am Stand der Ausstellungsfläche auf der International Supercomputer Conference 23 in Hamburg in ausgewählten Tests, in denen sie natürlich glänzen konnten. Dazu gabs genauere Spezifikationen zum Supercomputer Aurora selbst.

Der ehemals Ponte Vecchio genannte Beschleuniger, der die Hauptlast der Aurora-Berechnungen trägt, soll ab Juni erhältlich sein, und zwar von Dell und Lenovo in x4 OAMs, also Boards mit vier Beschleunigerfassungen. Supermicro und Inspur bringen ab Juli die 8-Sockel-Version. Das bestätigte der zur Präsentation von Intels Corporate Vice President und General Manager der Super Compute Group Jeff McVeigh auf die Bühne eingeladene Ray Pang, seines Zeichens Head of Technology & Business Enablement bei Supermicro. Er zeigte einen flexibel bestückbaren Rackserver mit Einschüben für bis zu zwölf PCIe-Karten.

Intels Verfügbarkeitsroadmap für den Rest des Jahres 2023.

(Bild: Intel)

Ab August wird es laut Plan die Intel Data Center GPU Max 1100 als PCIe-5.0-Steckkarte geben. Sie verbrät 300 Watt, hat 56 Xe-Cores und 48 GByte HBM-Stapelspeicher. Die größeren Verwandten 1450 und 1550 mit bis zu 128 Xe-Cores, 128 GByte Speicher und 600 Watt Verlustleistung sollen zumindest dieses Jahr nur via Intel Developer Cloud angeboten werden.

Bisher war nur lose von mehr als 2 Exaflops die Rede, wenn es um die Aurora-Spezifikation ging. Nun gab Intel weitere Details bekannt. So sollen bereits über 10.000 Blades [Update: In einer früheren Fassung des Artikels haben wir versehentlich von 60.000 Blades gesprochen] geliefert und installiert sein, von denen Aurora ingesamt 10.624 bekommt. Bei zwei Prozessoren und sechs Beschleunigern sind das 21.248 CPUs und 63.744 GPUs.

Das System wird 10,9 Petabyte DDR5-Speicher mit 5,95 PByte/s haben und zusätzlich 1,36 PByte HBM-Stapelspeicher (30,5 PByte/s) in den Xeon Max CPUs sowie 8,16 PByte HBM-Speicher in den GPUs (208,9 PByte/s). Für Massenspeicher hat Aurora 1024 Storage-Knoten, deren 230 Pbyte eine Transferrate von zusammen 31 TByte/s.

Spezifikationen des Supercomputers Aurora, Stand Mai 2023.

(Bild: Intel)

Jeff McVeigh bestätigte, dass Intels vormaliges Prestigeprojekt codenamens Falcon Shores nun endgültig ein "2025 Product" sei. "Falcon Shores ist eine neue Architektur, die x86-Kerne und eine Xe-GPU in einer Prozessorfassung zusammenführt. Diese Architektur ist für das Jahr 2024 geplant und soll mehr als das Fünffache an Leistung pro Watt, das Fünffache an Rechendichte und das Fünffache an Speicherkapazität sowie Bandbreite bieten" schrieb Intel damals in seiner Pressemitteilung.

Der Grund für die Verschiebung liege, so McVeigh, in der enormen Auswirkung, die sogenannte Generative KI gehabt habe. Dieser "ChatGPT-Moment" habe Intel erneut überdenken lassen, ob nun wirklich der richtige Zeitpunkt gekommen sei, die verschiedenen noch fehlenden Typen von Rechenwerken, speziell solche für KI, zu integrieren. Damit würde sich Intel in Hardware festlegen, während die Workloads, also die zu erwartenden Aufgaben, gerade einem rapiden Wandel unterworfen seien.

Ein anderer Grund, so McVeigh, sei, dass Intel auch noch einiges an Potenzial in Ponte Vecchio sehe. Die gezeigten Leistungsdaten bezogen sich allerdings meist auf die Data Center GPU Max 1550 mit ihren 600 Watt TDP, die zum Beispiel eine von Nvidias aktuellen PCIe-Karten H100 mit 350 Watt in einer Reihe von Benchmarks um Faktor 1,2 (QMCPack) bis 2,1 (Autodock) schlägt. Ob man sich da mit einem Nachfolger noch zwei Jahre Zeit lassen sollte?

(csp)