Urheberrechtsverletzung durch KI-Training: OpenAI gewinnt Rechtsstreit gegen Medienunternehmen vor U.S.-Gericht

November 12, 2024 Dr. Kim Manuel Künstner

Ein US-Gericht in New York hat eine Klage gegen OpenAI abgewiesen, die von zwei Medienunternehmen wegen angeblicher Urheberrechtsverletzungen eingereicht wurde. Der Fall wirft interessante Fragen zum Umgang mit Urheberrechten beim Training von KI-Modellen auf.

Die Parteien.

Als Kläger traten Raw Story Media, Inc. und AlterNet Media, Inc. auf, zwei Online-Nachrichtenorganisationen, die zusammen über 400.000 Nachrichtenartikel und Meinungsbeiträge veröffentlicht haben. Auf der Beklagtenseite standen OpenAI, Inc. und mehrere verbundene Unternehmen, die für den KI-Chatbot ChatGPT verantwortlich sind.

Argumente der Parteien.

Die Kläger argumentierten, dass OpenAI tausende ihrer urheberrechtlich geschützten Artikel ohne Erlaubnis zum Training von ChatGPT verwendet habe und mindestens in den Trainingssets WebText, WebText2 und Common Crawl enthalten sei. Dabei seien Informationen zu Autor, Titel und Urheberrecht (sogenannte Copyright Management Information, CMI) entfernt worden, was eine Verletzung des Digital Millennium Copyright Act (DMCA) darstelle. Sie befürchteten zudem, dass ChatGPT in Zukunft plagiierte Inhalte aus ihren Artikeln ausgeben könnte. Daher forderten sie Schadensersatz sowie eine einstweilige Verfügung zur Entfernung ihrer Werke aus den Trainingsdaten.

OpenAI hingegen argumentierte, dass den Klägern die notwendige Klagebefugnis fehle, da kein konkreter Schaden nachgewiesen wurde. Die bloße Entfernung von CMI ohne Verbreitung stelle keine ausreichende Rechtsverletzung dar. Zudem sei das Risiko zukünftiger Urheberrechtsverletzungen durch ChatGPT nicht substanziell genug.

Entscheidung des Gerichts.

Das Gericht gab OpenAI Recht und wies die Klage vollständig ab. Es begründete seine Entscheidung damit, dass den Klägern die Klagebefugnis für Schadensersatzansprüche fehle, da sie keinen konkreten Schaden durch die Entfernung der CMI nachgewiesen hätten. Die bloße Verletzung des DMCA reiche nicht aus, es müsse ein greifbarer Schaden vorliegen.

Auch für Unterlassungsansprüche sahen die Richter keine Klagebefugnis, da die Kläger nicht plausibel dargelegt hätten, dass ein substanzielles Risiko bestehe, dass ChatGPT in Zukunft ihre Artikel plagiieren würde. Angesichts der riesigen Datenmenge, auf der ChatGPT trainiert wurde, sei die Wahrscheinlichkeit dafür gering.

Das Gericht stellte zudem fest, dass es den Klägern eigentlich um eine Kompensation für die Nutzung ihrer Artikel zum Training von ChatGPT gehe. Dies sei aber nicht der vom DMCA geschützte Rechtsbereich. Obwohl das Gericht den Klägern die Möglichkeit offenließ, eine überarbeitete Klageschrift einzureichen, zeigte es sich skeptisch, ob die grundlegenden Mängel behoben werden könnten.

Praktische Folgen des Urteils in den USA.

Das Urteil erschwert es Medienunternehmen und anderen Rechteinhabern, KI-Firmen wegen der Nutzung ihrer Inhalte zum Training von Sprachmodellen zu verklagen. Sie müssen nun einen konkreten Schaden nachweisen, was in vielen Fällen schwierig sein dürfte. Statt auf Klagen zu setzen, dürften viele Inhalteanbieter nun verstärkt versuchen, Lizenzvereinbarungen mit KI-Unternehmen auszuhandeln. OpenAI hat bereits solche Deals mit einigen großen Medienunternehmen abgeschlossen.

Das Urteil könnte auch den Gesetzgeber auf den Plan rufen, um klarere Regeln für die Nutzung urheberrechtlich geschützter Werke zum KI-Training zu schaffen. Die bestehenden Gesetze wurden nicht für solche Szenarien konzipiert. KI-Unternehmen dürften sich durch das Urteil in ihrer Praxis bestärkt fühlen, große Mengen online verfügbarer Daten zum Training ihrer Modelle zu nutzen. Dies könnte die KI-Entwicklung weiter beschleunigen.

Auch wenn die rechtliche Lage nun klarer scheint, bleiben ethische Fragen zur fairen Nutzung und Vergütung von Inhalten für KI-Training bestehen. Diese dürften die Branche weiter beschäftigen. Insgesamt stärkt das Urteil die Position von KI-Unternehmen wie OpenAI. Es zeigt aber auch, dass das bestehende Urheberrecht möglicherweise nicht ausreicht, um die komplexen Fragen rund um KI und geistiges Eigentum zu regeln. Die Debatte darüber dürfte in den kommenden Jahren weitergehen.

Übertragbarkeit auf Rechtslage in Deutschland.

Ein ähnlicher Fall in Deutschland würde wahrscheinlich anders beurteilt werden. Insbesondere die Frage, ob das Training von KI-Modellen mit urheberrechtlich geschützten Werken ohne Zustimmung der Rechteinhaber zulässig ist, ist in Deutschland noch nicht abschließend geklärt.

Nach einem aktuellen Urteil des Landgericht Hamburg ist die Verwendung urheberrechtlich geschützter Bilder für wissenschaftliche Forschung nach § 60d UrhG erlaubt. Allerdings bezog sich dieses Urteil auf die Erstellung einer Datenbank für Forschungszwecke, nicht auf ein kommerzielles KI-Produkt wie ChatGPT.

Ein vielbeachtetes Gutachten im Auftrag der Initiative Urheberrecht will festgestellt haben, dass es im Rahmen des Trainings generativer KI-Modelle zu zahlreichen verschiedenen Handlungen der Vervielfältigung urheberrechtlich geschützter Werke im Sinne des § 16 Abs. 1 UrhG kommt und die Ausnahme für Text und Data Mining nach § 44b Abs. 2 UrhG nicht für das Training generativer KI-Modelle gelten solle.

Unabhängig vom Ausgang weiterer künftiger Verfahren in Deutschland, werden sich auch hier die gleichen Fragen zu einem fairen Ausgleich zwischen Urheberrechten und dem Training kommerzieller KI-Modelle stellen.

Mehr über unsere KI-Beratung erfahren Sie hier: www.schulte-lawyers.com/kuenstliche-intelligenz

See this content in the original post

See this gallery in the original post