Allwissend dank ChatGPT

Studierende haben ein OpenAI-Sprachmodell mit einer AR-Brille kombiniert. Die Sprach-KI wird so zum Sozial-Coach.

In Pocket speichern vorlesen Druckansicht 9 Kommentare lesen

(Bild: Bryan Hau-Ping Chiang (Twitter))

Lesezeit: 2 Min.

Studierende der Stanford University haben mit einem cleveren Hack gezeigt, wie große Sprachmodelle User beim nächsten Vorstellungsgespräch oder auch bei romantischen Dates unterstützten könnten. Das "RizzGPT" genannte Projekt von Bryan Hau-Ping Chiang besteht aus einem Smartphone und dem AR-Display Monocle von Brillant Labs und etwas Code, der die Hardware mit Sprachmodellen von OpenAI verbindet.

Das Display leitet Audio-Signale seines eingebauten Mikrofons an das Smartphone weiter, das die Signale zur Verarbeitung an das Sprachmodell Whisper von OpenAI übergibt. Die Transkription von Whisper dient – vermutlich mit sinngemäßen Ergänzungen – wiederum als Input für eines der großen Sprachmodelle wie ChatGPT. Dessen Output wird dem User dann über das AR-Display, das einfach auf eine Brille aufgesteckt werden kann, in das Sichtfeld eingeblendet. Wenn das auf der Projekt-Seite und auf Twitter verlinkte Video kein Fake ist, scheint der Hack durchaus zu funktionieren – auch wenn der Test-User seinen Text noch etwas stockend vorliest.

Chiang und seine Mitstreiter hätten damit einen Technik-Traum realisiert, der rund 30 Jahre alt ist: Bereits Mitte der 1990er Jahre experimentierte eine Gruppe junger Forschender am MIT Media Lab mit am Körper tragbaren Computern, die ihnen "kontextabhängig“ Zugriff auf Informationen liefern sollten. Mit ihrer exotischen Hardware erkundete die selbsternannte "Cyborg-Gruppe" nicht nur eine Klasse völlig neuer Anwendungen, sie wurde selbst auch zum Forschungsobjekt der Soziologin Sherry Turkle, die versuchte, das neue Lebensgefühl dieser ständig vernetzten Generation zu verstehen.

Zwei Anwendungen, die bei den Pionieren schnell im Mittelpunkt standen, waren das Protokollieren von Gesprächen und Begegnungen – eine persönliche Gedächtnis-Erweiterung – und das Einblenden zusätzlicher Informationen zu Personen, die einem gerade gegenüberstehen. Einer der Pioniere der Gruppe, Thad Starner, mittlerweile am Georgia Institute of Technology, gab nach eigenen Angaben einen entscheidenden Anstoß für die Entwicklung von Google Glass.

Ironischerweise scheiterte die AR-Brille von Google jedoch genau an der Vision der Wearable-Pioniere. Denn eine Technologie, die Gesichter erkennt, und die zugehörigen Informationen einblendet, erschien Menschen wie Starner zwar als nützliche Hilfe im Alltag, für Datenschützer ist solch ein System allerdings ein schlichter Alptraum.

(wst)