KI-Update kompakt: Voice Engine, Amazon Olympus, Supercomputer Stargate, Pixel 8

Das "KI-Update" liefert werktäglich eine Zusammenfassung der wichtigsten KI-Entwicklungen.

In Pocket speichern vorlesen Druckansicht 2 Kommentare lesen

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externer Podcast (Podigee GmbH) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Lesezeit: 7 Min.
Inhaltsverzeichnis

OpenAI hat mit "Voice Engine" ein KI-Modell vorgestellt, das natürliche Stimmen auf Basis kurzer Audioaufnahmen erzeugen kann. Das Tool benötigt lediglich eine 15-sekündige Aufnahme der zu kopierenden Sprecherstimme und kann durch Texteingabe Inhalte in dieser Stimme generieren. Damit sollen beispielsweise Youtuber und Unternehmen mehr Menschen fließend in ihrer eigenen Stimme erreichen.

Voice Engine kommt bereits in verschiedenen Projekten zum Einsatz, darunter eine Lesehilfe für Kinder, die Übersetzungen von Inhalten und die Unterstützung von Menschen mit Sprachverlust. OpenAI arbeitet hierfür mit Partnern wie Dimagi Inc. und Livox zusammen.

Um Missbrauch vorzubeugen, setzt OpenAI Sicherheitsmaßnahmen wie Wasserzeichen zur Rückverfolgung und proaktive Nutzungsüberwachung ein. Eine breite Einführung der Technologie sollte laut OpenAI von Aufklärung über Fähigkeiten und Grenzen der KI begleitet werden.

Derzeit entscheide sich das Unternehmen laut eigenen Angaben "für eine Vorschau, aber keine umfassende Veröffentlichung dieser Technologie". Basierend auf den Ergebnissen der Tests im kleinen Maßstab werde OpenAI zufolge künftig eine "fundiertere Entscheidung" darüber getroffen, "ob und wie wir diese Technologie im großen Maßstab einsetzen".

Aber: Andere Unternehmen bieten genau solche Software an. Ein neuer Anbieter etwa heißt Voice Craft. Auch sie braucht nur drei Sekunden Ausgangsmaterial. Das Modell ist sogar als Open-Source verfügbar.

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externer Podcast (Podigee GmbH) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Amazon setzt auf eine doppelte Strategie im Wettrennen um Sprachmodelle und generative KI. Der Konzern investierte bis zu vier Milliarden Dollar in das Start-up Anthropic, welches hinter dem OpenAI-Konkurrenten Claude steht. Parallel treibt Amazons interne KI-Abteilung die Entwicklung eines eigenen Großmodells namens "Olympus" voran, berichtet The Verge.

Olympus soll schon Mitte des Jahres die Leistung von Anthropics neuestem Claude-Modell übertreffen und in nahezu alle Amazon-Bereiche integriert werden. Das Projekt gilt als Lieblingsprojekt von CEO Andy Jassy.

Mit der Doppelstrategie will Amazon im Cloud-Wettbewerb mit Microsoft Schritt halten, das durch die OpenAI-Partnerschaft massiv Kunden gewinnt. Die Investition in Anthropic ist der größte Beteiligungsdeal in der Firmengeschichte.

Einem Bericht zufolge schmieden Microsoft und OpenAI ehrgeizige Pläne für den Bau eines gigantischen Supercomputers. Das "Stargate" genannte Projekt soll die KI-Entwicklung von OpenAI in den kommenden Jahren massiv beschleunigen und könnte Insidern zufolge bis zu 100 Milliarden US-Dollar verschlingen.

Der in den USA geplante Supercomputer würde aus Millionen spezialisierter Server-Prozessoren bestehen und bis zu fünf Gigawatt Leistung benötigen. Die Finanzierung dieser gewaltigen Investition, eine der größten in der Geschichte der Informatik, soll hauptsächlich durch Microsoft erfolgen.

Bereits für 2026 ist ein kleinerer Supercomputer mit dem Codenamen "Phase 4" geplant, der mit Kosten von bis zu 10 Milliarden Dollar veranschlagt wird. OpenAI erhofft sich durch die massiv gesteigerte Rechenleistung, seine KI-Modelle so weit zu verbessern, dass sie als "Superintelligenz" bezeichnet werden könnten und synthetisches Trainingsmaterial für ihre eigene Weiterentwicklung erstellen. Ob das noch größere "Stargate"-Projekt tatsächlich umgesetzt wird, hängt vom Erfolg dieser Bemühungen ab.

Midjourney-Gründer David Holz gab einen Ausblick auf die nächsten Neuerungen des KI-Bildgenerators. In wenigen Wochen können Nutzer die Modelle individualisieren und so eigene Bildstile kreieren. Die Personalisierung füllt die nicht spezifizierten Details in den Prompts gemäß den Benutzerpräferenzen aus, die durch Bildbewertungen ermittelt werden.

Version 7 soll noch vor dem Sommer erscheinen und Bildqualität, Prompt-Verständnis sowie Ästhetik verbessern. Die Personalisierung wird hier die Standardeinstellung sein. Für Version 6 seien eventuell Updates für Körper, Hände und Geschwindigkeit geplant.

Holz kündigte zudem an, noch dieses Jahr ein Videomodell zu veröffentlichen. Ein 3D-Modell könnte sogar noch früher erscheinen. Neue Community-Funktionen sind ebenfalls geplant, um die Prompt-Genauigkeit von Midjourney zu optimieren. Nutzer sollen dafür eigene Beschriftungen erstellen und die bessere von zwei Optionen auswählen.

Eine Studie von Forschern der British University Vietnam und der James Cook University Singapur deckt gravierende Defizite von KI-Texterkennungswerkzeugen auf. Die Untersuchung an 805 Textproben ergab eine durchschnittliche Erkennungsgenauigkeit von nur 39,5 %, die bei manipulierten KI-Texten sogar auf 17,4 % sank. Werkzeuge mit höherer Treffsicherheit neigten zu falsch-positiven Bewertungen menschlicher Texte.

Aufgrund der mangelnden Zuverlässigkeit und Fehleranfälligkeit raten die Forscher vom Einsatz dieser Tools zur Prüfung akademischer Integrität ab. Es bestehe die Gefahr ungerechtfertigter Anschuldigungen.

Stattdessen empfiehlt das Forscherteam, den Diskurs über wissenschaftliche Redlichkeit zu fördern, alternative Bewertungsmethoden zu entwickeln und KI-Werkzeuge positiv zur Lernunterstützung zu nutzen.

Entgegen vorheriger Aussagen wird Googles KI-Modell Gemini Nano doch auf dem Pixel 8 Smartphone verfügbar sein. Die Entscheidung sorgte zunächst für Verwirrung, da die Hardware-Unterschiede zwischen Pixel 8 und Pixel 8 Pro als unerheblich für die Ausführung des Modells galten. Als einzigen relevanten Unterschied identifizierten Experten den geringeren Arbeitsspeicher des Pixel 8 mit 8 GByte gegenüber 12 GByte beim Pro-Modell. Google begründet die anfängliche Entscheidung mit der Notwendigkeit, die Nutzererfahrung auf Geräten mit unterschiedlichen Speicherspezifikationen zu testen und zu validieren.

Gemini Nano ist das schlankeste Modell der Gemini-Reihe, die Google im Februar als Nachfolger von Bard vorstellte. Derzeit ermöglicht es in einer Developer-Preview, aufgezeichnete Gespräche zusammenzufassen und Smart Replys in Chat-Apps zu verbessern. Weitere Funktionen dürften folgen. Pixel-8-Nutzer sollen im Juni mit einem Feature-Drop Zugang zu Nano erhalten.

Ein neues EU-Projekt namens "DeployAI" hat das Ziel, den Zugang zu KI für kleinere Unternehmen, Behörden und Wissenschaft in Europa zu erleichtern. Das Konsortium aus 28 Partnern aus 13 Ländern, darunter Forschungsinstitute, Verbände sowie Telekommunikations- und Cloudunternehmen, will innerhalb der nächsten vier Jahre eine umfassende, herstellerunabhängige KI-Plattform aufbauen. Diese soll auf Vertrauen, Ethik und Transparenz beruhen und einen fairen Zugang zu europäischer KI-Spitzentechnik bieten, unabhängig von US-Unternehmen.

Die Plattform soll Matchmaking-Dienste und ein interaktives Tool zur Vernetzung der europäischen KI-Gemeinschaft anbieten. Sie richtet sich an kleine und mittelständige Unternehmen (KMU), öffentliche Einrichtungen sowie KI-Experten aus Industrie und öffentlichem Sektor. DeployAI wird von der EU-Kommission mit 28 Millionen Euro gefördert und soll eine wichtige Rolle bei der Umsetzung des europäischen KI-Innovationspakets spielen. Die Projektkoordination liegt beim deutschen Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme.

Podcast: KI-Update

Wie intelligent ist Künstliche Intelligenz eigentlich? Welche Folgen hat generative KI für unsere Arbeit, unsere Freizeit und die Gesellschaft? Im "KI-Update" von Heise bringen wir Euch gemeinsam mit The Decoder werktäglich Updates zu den wichtigsten KI-Entwicklungen. Freitags beleuchten wir mit Experten die unterschiedlichen Aspekte der KI-Revolution.

(igr)