Microsoft, GitHub und OpenAI verklagt: KI-Programmierhilfe Copilot kopiert Code

Eine Sammelklage verlangt von Microsoft, GitHub und OpenAI 9 Milliarden Dollar Schadenersatz. Das KI-Tool Copilot sammle Open-Source-Code – ohne Lizenzangaben.

In Pocket speichern vorlesen Druckansicht 87 Kommentare lesen

(Bild: Imilian/Shutterstock.com)

Lesezeit: 3 Min.

Der Programmierer und Rechtsanwalt Matthew Butterick verklagt Microsoft, die Software-Entwicklungsplattform GitHub und das KI-Unternehmen OpenAI auf Schadenersatz. Sein Vorwurf: Die KI-gestützte Programmierhilfe GitHub Copilot verwende öffentlich verfügbare Code-Ausschnitte für ihre Ausgabe, liefere dabei aber keinerlei Hinweise mehr auf die Quelle. Das verletze die Bedingungen mehrerer Open-Source-Lizenzmodelle sowie die Rechte der jeweiligen Programmierer an ihrem Code. Daher hat er Sammelklage im Namen aller Betroffenen eingereicht.

Die kostenpflichtige, KI-gestützte Programmierhilfe Copilot ist seit Juni 2022 bei GitHub im Einsatz (eine Testphase mit einer technischen Vorschauversion begann bereits im Juni 2021). Sie nutzt das KI-System Codex von OpenAI, das aus natürlicher Sprache Vorschläge für Code-Abschnitte oder passende Funktionen ermittelt. Für das Anlernen greift das KI-System auf zahlreiche öffentliche Code-Repositorys bei GitHub zurück; dabei werden weder die Urheber des jeweiligen Codes um Zustimmung gebeten, noch übernimmt Copilot erforderliche Hinweise auf die Quelle, wie sie eine Lizenz (etwa MIT, Apache oder GPL) vorschreibt.

Dieses Verhalten hatte gleich zu Beginn der Testphase im vergangenen Jahr Kritik auf sich gezogen: Copilot verletze die Urheberrechte der Programmierer, hieß es. Beispiele auf Twitter untermauerten damals diese Kritik, so fand etwa ein Programmierer seinen Code in Copilot inklusive Variablennamen und Kommentaren wieder, als er einen passenden Kommentar in Code verwandeln ließ.

In der nun eingereichten Klage wird neben GitHub und OpenAI auch der GitHub-Mutterfirma Microsoft vorgeworfen, von der Arbeit anderer zu profitieren, indem die Bedingungen der Open-Source-Lizenzen sowie weitere Rechte missachtet würden. Copilot/Codex behandelten Open-Source-lizenzierten Quellcode so, als stünde er unter Bedingungen der Public Domain. Das schreibt die Kanzlei Joseph Saveri, die die Klage für Butterick beim Bundesbezirksgericht für Nord-Kalifornien eingereicht hat (Aktenzeichen 4:22-cv-06283). Die Kanzlei sucht außerdem Kontakt zu weiteren Betroffenen per Formular auf einer gesonderten Webseite. Die Schadenersatzsumme in der Klage beträgt 9 Milliarden US-Dollar. Beantragt ist ein Geschworenenverfahren.

Zu seinem Vorgehen hat Butterick auch eine eigene Webseite erstellt. Dort führt er aus, dass seiner Ansicht nach Copilot und Codex auch gegen GitHubs Richtlinien sowie gegen den Digital Millennium Copyright Act (DMCA) verstoßen. In der Klage heißt es dazu: Bei jeder Ausgabe eines Stücks Code durch Copilot, bei der die laut Lizenz erforderlichen Informationen fehlen, verstößt die Software drei Mal gegen Abschnitt 1202 DMCA – fehlende Namensnennung, fehlender Verweis aufs Urheberrecht sowie fehlender Lizenztext. Wenn jeder Nutzer von Copilot in den maximal 15 Monaten, die die Software in Betrieb ist, auch nur einmal eine Ausgabe erhält, die gegen Abschnitt 1202 verstößt, dann – so rechnet die Klage durch – könne man 3.600.000 DMCA-Verstöße durch GitHub und OpenAI annehmen. Setze man den gesetzlichen Mindest-Schadenersatz von 2500 US-Dollar pro Einzelfall an, komme man auf die genannten 9 Milliarden Dollar. Außerdem sind in der Klageschrift noch zahlreiche andere Rechtsverstöße angeführt, darunter unlauterer Wettbewerb sowie Verstoß gegen das kalifornische Verbraucherschutzgesetz, weil personenbezogene Daten verwendet wurden.

(tiw)