KI-Update kompakt: Google Gemini, Microsoft Copilot, AI-Act, KI lernt im Schlaf

Das "KI-Update" liefert werktäglich eine Zusammenfassung der wichtigsten KI-Entwicklungen.

In Pocket speichern vorlesen Druckansicht

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externer Podcast (Podigee GmbH) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Lesezeit: 7 Min.
Inhaltsverzeichnis

Google hat seinen Chatbot Bard in Gemini umbenannt und sowohl im Web als auch als neue App in den App-Stores von Google und Apple veröffentlicht. Die Webversion des Chatbots unterstützt 40 Sprachen, einschließlich Deutsch. Die Apps sind vorerst nur auf Englisch und in den USA verfügbar. Google bezeichnet Gemini als ihre "leistungsfähigste Familie von KI-Modellen".

Gemini Advanced ersetzt Bard Advanced und bietet Zugang zu Gemini Ultra 1.0, das nur mit einem "Google One AI Premium"-Abo verfügbar ist. Das Abo bietet auch erweiterten Speicherplatz und weitere Vorteile. Gemini Advanced soll besonders leistungsfähig bei hochkomplexen Aufgaben wie Programmieren, logischem Denken und kreativen Projekten sein. In Blindtests bevorzugten externe Tester Gemini Advanced gegenüber anderen Chatbots, sagt Google.

Gemini soll zudem in Google-Diensten wie Workspace und Google Cloud integriert werden und dort beim Verfassen von Texten, Tabellen und mehr helfen. Es ersetzt Googles bisherige KI-Hilfe Duet AI und soll auch beim Coden und Schutz vor Cyberangriffen eingesetzt werden.

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externer Podcast (Podigee GmbH) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Microsoft hat seine Copilot-Plattform aktualisiert und präsentiert ein schlankeres Design, das Nutzern das Chatten erleichtert. Die neue Benutzeroberfläche kommt jetzt auch mit einem Karussell mit Prompt-Ideen. Zudem wurden die Bildgenerierungsfunktionen verbessert, sodass Nutzer Bilder erstellen und direkt bearbeiten können, beispielsweise indem sie Objekte hervorheben, Hintergründe verwischen oder Effekte anwenden. Alle Funktionen sind weiterhin kostenlos, während Copilot Pro-Abonnenten zusätzlich Bildformate in der Chat-Umgebung anpassen können. Microsoft will zudem in Kürze einen "Designer GPT" in Copilot integrieren, der weitere Bildgestaltungsmöglichkeiten bieten wird.

Seit dem Start der Plattform vor rund einem Jahr wurden fünf Milliarden Chats geführt und fünf Milliarden Bilder generiert, so Microsoft. Die Plattform habe dem Microsoft-Browser Edge und der Suchmaschine Bing "nachhaltiges Wachstum" beschert – allerdings dominiert Google weiterhin den Suchmaschinenmarkt. Dazu passend: Microsoft setzt in einem neuen Werbespot auf Copilot für Produktivität und Kreativität statt auf die Suche.

Podcast: KI-Update

Wie intelligent ist Künstliche Intelligenz eigentlich? Welche Folgen hat generative KI für unsere Arbeit, unsere Freizeit und die Gesellschaft? Im "KI-Update" von Heise bringen wir Euch gemeinsam mit The Decoder werktäglich Updates zu den wichtigsten KI-Entwicklungen. Freitags beleuchten wir mit Experten die unterschiedlichen Aspekte der KI-Revolution.

Die EU hat eine neue Richtlinie verabschiedet, um Frauen vor digitaler Gewalt zu schützen. Die Richtlinie legt EU-weite Mindeststandards zur Bekämpfung von Gewalt gegen Frauen fest und verpflichtet Mitgliedstaaten unter anderem, Hotlines und Krisenzentren für Opfer einzurichten.

Die Richtlinie adressiert insbesondere die nicht einvernehmliche Verbreitung von KI-generierten Deepfakes und anderen Formen der bildbasierten sexualisierten Gewalt. Ein Beispiel für das Potenzial dieses Problems ist der Fall von Weltstar Taylor Swift, deren sexualisierte Deepfakes kürzlich im Internet massenhaft verbreitet wurden. Die gemeinnützige Organisation HateAid begrüßt diesen Meilenstein in der Rechtssprechung. Josephine Ballon, Geschäftsführerin von HateAid, erklärt: "Geschlechtsspezifische digitale Gewalt ist ein Massenphänomen und Teil eines antifeministischen Backlash. Durch frauenfeindliche digitale Gewalt sollen Frauen erniedrigt, eingeschüchtert und aus dem öffentlichen Diskurs verdrängt werden." Gemäß den neuen Vorschriften werden die gängigsten Formen von Cybergewalt strafbar sein, so etwa die nicht einvernehmliche Weitergabe von intimen Bildern (einschließlich Deep Fakes), Cyberstalking, Cybermobbing, frauenfeindliche Hetze und „Cyberflashing“.

Die Richtlinie enthält auch Maßnahmen zur Stärkung der digitalen Kompetenz, damit Nutzerinnen und Nutzer Cybergewalt erkennen, bekämpfen und verhindern können.

Eine Studie des Massachusetts Institute of Technology (MIT) hat ergeben, dass Ärztinnen und Ärzte Schwierigkeiten haben, Hautkrankheiten bei Menschen mit dunkler Hautfarbe anhand von Bildern zu diagnostizieren. Die Dermatologen konnten nur 34 Prozent der Bilder von dunkelhäutigen Menschen korrekt klassifizieren, während sie bei 38 Prozent der Bilder von hellhäutigen Personen erfolgreich waren. Künstliche Intelligenz konnte die Genauigkeit von Diagnosen verbessern: Dermatologen erreichten bis zu 60 Prozent Genauigkeit und Allgemeinmediziner bis zu 47 Prozent. Dennoch bestand bei Allgemeinmedizinern eine Lücke in der Genauigkeit zwischen Patienten mit dunkler und heller Hautfarbe.

Ein möglicher Grund für die unterschiedliche diagnostische Genauigkeit bei verschiedenen Hauttönen ist die Dominanz heller Hauttöne in dermatologischen Lehrbüchern und Schulungsmaterialien. Ärzte könnten daher weniger Erfahrung bei der Behandlung dunkelhäutiger Patienten haben und somit schlechtere Ergebnisse bei bestimmten Personengruppen erzielen. Die MIT-Forscher hoffen, dass ihre Ergebnisse zu mehr Schulungen und Inhalten über Patienten mit dunkler Haut in Lehrbüchern führen werden.

Der AI Act der Europäischen Union wurde kürzlich unterzeichnet und die Mitgliedstaaten beginnen nun mit der Umsetzung. Maximilian Funke-Kaiser, Digitalpolitischer Sprecher der FDP-Bundestagsfraktion, sieht in der Schaffung von Rechts- und Planungssicherheit einen positiven Aspekt des Regelwerks. Er betont jedoch, dass der Act für eine sich ständig weiterentwickelnde Technologie wie Künstliche Intelligenz regelmäßig evaluiert und angepasst werden müsse. Die Auswirkungen des AI Acts auf die Innovationskraft in Europa bleiben abzuwarten, so Funke-Kaiser.

Eine der größten Herausforderungen bestehe nun darin, das nationale Umsetzungsgesetz in Deutschland zu erarbeiten. Offene Fragen, insbesondere im Bereich der biometrischen Gesichtserkennung, müssten auf nationaler Ebene geklärt werden. Funke-Kaiser betont auch die Bedeutung einer einheitlichen Auslegung des AI Acts, um unnötige Bürokratie zu vermeiden, und möchte die Möglichkeiten als nationaler Gesetzgeber nutzen, um biometrische Gesichtserkennung in Deutschland weitestgehend auszuschließen.

Forscher der Universität von Catania in Italien haben eine Trainingsmethode entwickelt, die Schlaf- und Wachphasen imitiert. Die Methode namens "Wake-Sleep Consolidated Learning" (WSCL) basiert auf der Complementary Learning Systems Theorie (CLS) und zielt darauf ab, die Plastizität neuronaler Netze zu verbessern. WSCL wurde in einem Bilderkennungsmodell getestet, das während der Wachphase mit Trainingsdaten gefüttert wurde. Anschließend durchlief das Modell „Schlafphasen“, die menschlichen Non-REM- und REM-Schlafphasen ähneln.

Die Forscher fanden heraus, dass die Erkennungsrate des mit WSCL trainierten Algorithmus zwischen zwei und zwölf Prozent höher lag als bei vergleichbaren Modellen. Zudem zeigte das Modell einen höheren "Vorwärtstransfer", was bedeutet, dass es mehr altes Wissen anwandte, um neue Aufgaben zu lernen. Die Studie ist noch nicht von unabhängigen Experten geprüft.

Apple und die University of California haben ein KI-Modell namens MGIE entwickelt, das Bilder durch Textprompt bearbeiten kann. MGIE, kurz für Multimodal Large Language Models Guided Image Editing, nutzt multimodale große Sprachmodelle (MLLMs) für präzise Bildmanipulationen. Es kann sowohl globale als auch lokale Manipulationen durchführen, einschließlich gängiger Aktionen wie Beschneiden, Skalieren oder Drehen sowie fortgeschrittener Manipulationen wie Hintergrund- und Objektänderungen und das Zusammenfügen mehrerer Bilder.

Das Open-Source-Projekt MGIE ist auf GitHub verfügbar und gibt möglicherweise einen Einblick, welche neuen Funktionen Apple in zukünftigen MacOS- und iOS-Versionen integrieren könnte. Derzeit ist MGIE allerdings eher als Grundlagenforschung einzustufen.

(igr)