Neuer Prozessor für den Mainframe: IBMs Chefarchitekt erklärt das Telum-Design

Seite 3: Telums KI-Funktionen und ihr Praxiseinsatz

Inhaltsverzeichnis

Welche Einsatzfelder sehen Sie für die KI-Inferenzbeschleunigung auf dem Mainframe?

Da gibt es eine lange Liste von Beispielen. Insgesamt fallen die aber in ein paar Kategorien:

  1. Wenn die KI sehr Latenz-sensitiv ist, also zum Beispiel, wenn man Kreditkartenbetrug noch während der Transaktion erkennen möchte, kann man schlecht die relevanten Daten zuerst über ein Netzwerk verschicken und dann auf die Antwort von einem anderen Computersystem warten.
  2. Viele Anwendungen auf der Z arbeiten mit sensitiven und persönlichen Daten. Oft macht es wegen der Datensicherheit Sinn, die Daten per KI direkt auf dem Mainframe zu analysieren, anstatt sie auf andere Systeme zu übertragen. Wir arbeiten da zum Beispiel mit Krankenversicherungen zusammen, die natürlich sehr sensitive Daten verarbeiten.
  3. Man kann KI benutzen, um das System selber effizienter und sicherer zu machen. Und das macht dann am meisten Sinn, wenn das System selbst KI anwenden kann.

Stichwort Fraud-Detection beziehungsweise -Prevention: Was kann KI hier auf dem Mainframe leisten?

Das ist ein sehr gutes Beispiel: Falls die Latenz für KI-Inferenz so niedrig ist, dass man die Inferenz direkt in die Transaktion einbauen kann, dann wird zum Beispiel Kreditkartenbetrug während der Transaktion erkennbar und man kann die betrügerische Transaktion verhindern, anstatt den Betrug nur im Nachhinein zu erkennen. Kein Anruf mehr „Haben sie vor 5 Minuten ihre Kreditkarte im Ausland benutzt“ – der KI-Algorithmus kann den Betrug in Echtzeit erkennen und stoppen.

KI ist doch für Chip-Designer ein völlig fremdes Feld. Wie ist es Ihnen gelungen, KI in die Firmware zu implementieren?

Unser Research-Team in Yorktown arbeitet schon seit einigen Jahren an extrem leistungsstarken und zugleich energieeffizienten KI-Beschleunigern. Durch eine sehr enge Zusammenarbeit zwischen dem Z-Entwicklungsteam und diesem Research-Team konnten wir diese Beschleuniger auf dem Telum-Chip implementieren.

Die eigentliche Kunst der Integration liegt dabei darin, wie die Z-Prozessoren auf diesen KI-Beschleuniger zugreifen können. Der Beschleuniger ist direkt an die Cache-Infrastruktur angeschlossen, und die Z-Prozessoren können rechenintensive KI-Arbeit direkt an den Beschleuniger schicken. So ist die gesamte Rechenleistung von mehr als 6 Teraflops pro Beschleuniger dynamisch für jeden Prozessor verfügbar. Durch dieses Design können wir die KI-Latenz minimieren, was natürlich extrem wichtig ist für „real-time in-transaction AI“ wie in dem Kreditkarten-Beispiel.

Welche Restriktionen gibt es beim Design innovativer Features? Immerhin gilt es ja, die legendäre Kompatibilität des Mainframe zu wahren, die es möglich macht, dass auch Jahrzehnte alte Software problemlos auf modernster Hardware laufen kann.

Kompatibilität ist tatsächlich ein extrem wichtiger Faktor. Unsere Kunden entwickeln ja ihre Anwendungen und verlassen sich darauf, dass diese Investitionen jahrzehntelang sicher sind. Für neue Features heißt das natürlich, dass sie mit großer Voraussicht entworfen werden müssen, damit sie in ein paar Jahren nicht zu großen Hindernissen werden. Oder dass sie gar nicht erweitert werden können für neue Herausforderungen.

Uns kommt dabei natürlich zugute, dass wir über den kompletten Hardware/Software-Stack optimieren können. IBM stellt ja auch die Hypervisor-, Betriebssystem- und viele Middleware-Produkte her. Somit haben wir entsprechende Entwicklungs-Experten, mit denen wir Hardware-Entwickler direkt zusammenarbeiten.

Die Telum-Entwicklung ist ja weitestgehend abgeschlossen – und Sie arbeiten mit Sicherheit schon am Nachfolger. Können Sie uns einige Einblicke in die Pläne gewähren? In welchen Bereichen sind die Verbesserungen der nächsten Prozessorgenerationen zu erwarten und wie sieht das Timing aus?

Prozessor-Projekte brauchen schon einige Jahre. Deshalb arbeiten wir immer an zwei bis drei Projekten gleichzeitig. Ich kann im Moment noch wenig über Inhalt und Timing sagen. Ich kann aber sagen, dass wir weitere Verbesserungen bei Security, KI-Beschleunigung und High-Availability anstreben – und dass wir natürlich auch bei der Optimierung von Performance und Skalierbarkeit nie aufhören.

Herr Dr. Jacobi, vielen Dank für das Interview! IBMs Business-Sicht auf den Mainframe widmete sich die erste Folge der Mainframe-Interviews, weitere Einblicke gibt es zur Anwendungsmodernisierung und zur Qual der Wahl bei der Ablösung der Technik. (fo)