„I reject them all“ – US-Gericht verneint “Fair Use” und bejaht eine Urheberrechtsverletzung bei dem KI-Training mit urheberrechtlich geschützten Daten
Der District Court of Delaware hat am 11. Februar 2025 (Reuters vs Ross) entschieden, dass die Nutzung von urheberrechtlich geschützten Inhalten zum Training einer (in diesem Fall: nicht-generativen) KI jedenfalls dann nicht auf die im US-Recht entwickelte „Fair Use“-Doktrin gestützt werden kann, wenn das KI-Training kommerziellen Zwecken dient und sich die Nutzung der so trainierten KI-Anwendung (negativ) auf den Wert oder den potenziellen Markt des urheberrechtlich geschützten Werks, mit dem die KI trainiert wurde, auswirkt.
Die Auswirkungen dieser Entscheidung können für Hersteller und Anbieter von KI-Anwendungen erheblich sein.
Ausgangssituation: Was bedeutet „Fair Use“ und wieso ist dies für das KI-Training mit geschützten Inhalten relevant?
Eines der derzeit am heißesten diskutierten Themen im Bereich der Entwicklung von KI-Anwendungen ist die Frage, inwieweit beim KI-Training mit urheberrechtlich geschützten Inhalten die Erlaubnis des Urhebers (durch eine Lizenz) erforderlich ist, oder ob das Gesetz hierfür eine Erlaubnis bereitstellt.
In Deutschland dreht sich die Diskussion hauptsächlich um die Frage, ob und inwieweit die Einschränkung des Urheberrechts durch die sogenannte „Text- und Data Mining (TDM)“-Schranke der §§ 44b, 60d UrhG ein lizenzfreies KI-Training zulassen. Insbesondere für die generative KI (also eine KI-Anwendung, die neue Inhalte wie Text, Bilder, Musik, Audio und Videos erstellt) wie die Large Language Models (sog. LLMs) von OpenAI, Google, Meta etc. (z.B. ChatGPT, Gemini, Llama) führen die Inhaber urheberrechtlich und urheberrechtsähnlich geschützter Inhalte ins Feld, dass die TDM-Schranke nach Sinn und Zweck keine Anwendung auf das Zusammenstellen von Trainings-Datensätzen und das Training der KI-Modelle findet. Neue Nahrung hat die Diskussion durch die Klage der GEMA, die ein eigenes – kostenpflichtiges – Lizenzmodell für das KI-Training mit von ihr verwerteter Werke etablieren möchte, gegen OpenAI am Landgericht München im November 2024 erhalten, am 21. Januar 2025 hat sie eine weitere Klage gegen die Suno Inc., eine amerikanische Anbieterin von KI-generierten Audioinhalten, erhoben (Hintergründe zu den KI-Klagen). Die Klage gegen OpenAI wurde von einer beachtlichen Litigation-PR und diversen nahezu zeitgleich erschienenen Artikeln in den rechtswissenschaftlichen Fachzeitschriften begleitet.
Die Rechtsfragen, die sich in Deutschland stellen, werden auch in den anderen Mitgliedsstaaten relevant sein, da die TDM-Schranke durch die Richtlinie (EU) 2019/790 in deutsches Recht umgesetzt worden ist und entsprechend auch in die urheberrechtlichen Regelungen der übrigen Mitgliedsstaaten eingeflossen ist.
In den USA sind eine Vielzahl von Klagen von Rechteinhabern gegen Anbieter von KI-Anwendungen anhängig. Anders als im europäischen Rechtsraum existiert in den USA keine kodifizierte TDM-Schranke, die Anbieter der KI-Anwendungen berufen sich daher auf die sogenannte „Fair Use“-Doktrin, die das lizenzfreie Trainieren von KI mit urheberrechtlich und urheberrechtsähnlich geschützten Inhalten ermöglichen soll.
Rein wirtschaftlich betrachtet geht es um (mindestens) zwei Aspekte von wesentlicher Bedeutung, nämlich die Fragen, ob (1) die Rechteinhaber einen gesonderten monetären Anteil an dem „KI-Kuchen“ erhalten und inwieweit (2) die Rechteinhaber verhindern können, dass KI-Anbieter durch das Training ihrer Modelle mit rechtlich geschützten Inhalten Produkte erstellen können, die mit denen der Rechteinhaber (und -verwerter) zumindest potenziell in Konkurrenz treten.
Um es auf den Punkt zu bringen: Es geht um eine ganze Menge Geld und die Frage, wer welchen Anteil am „Kuchen“ erhält. Und mehr noch: Dieser Kuchen macht nicht vor Landesgrenzen halt. Das Internet kennt solche Grenzen nicht. Entsprechend kennt auch Software, die sich die rechtlich geschützten Inhalte im Internet besorgt, keine Grenzen. Es ist also zu erwarten, dass sich die zuvor skizzierten Rechtsfragen und die damit zusammenhängenden wirtschaftlichen Zusammenhänge nie nur nach dem Recht eines einzigen Landes richten werden.
Im Hinblick auf teils erhebliche Schadensersatzsummen, die durch US-Gerichte häufig zugesprochen werden und den Umstand, dass KI-Anwendungen regelmäßig auch mit Inhalten aus den USA trainiert und in den USA angeboten werden, richtet sich der Blick europäischer Unternehmen daher insbesondere auf die Entwicklungen in den USA.
Ganz kurz: Was hat der District Court of Delaware entschieden?
Am 11. Februar 2025 hat der District Court of Delaware durch den Richter Bibas in dem Verfahren Thomson Reuters Enterprise Centre GmbH / West Publishing Corp. gegen die Ross Intelligence Inc. (kurz: Reuters vs Ross) ein „Partial Summary Judgement“ erlassen und in dem konkreten Fall entschieden, dass sich Ross für das Training der eigenen KI-Anwendung nicht auf „Fair Use“ berufen kann. In einem Partial Summary Judgement werden bestimmte Rechtsfragen entschieden, die Klärung weiterer Fragen aber dem Hauptverfahren (hier: Jury Trial) überlassen. In diesem muss im Wesentlichen über den Umfang der festgestellten Urheberrechtsverletzungen entschieden werden, da Teile der betroffenen Werke möglicherweise bereits Teil der „Public Domain“ und damit gemeinfrei geworden sind.
Worum geht es in dem Verfahren?
Das Unternehmen Ross Intelligence entwickelte eine KI-gestützte juristische Suchmaschine und benötigte dafür eine Datenbank mit juristischen Fragen und Antworten. Nachdem Thomson Reuters, der Betreiber von Westlaw, die Lizenzierung seiner Inhalte verweigerte, arbeitete Ross mit LegalEase zusammen. LegalEase erstellte sogenannte „Bulk Memos“, in denen juristische Fragen und Antworten auf Basis von „Westlaw-Headnotes“ zusammengestellt wurden. Diese wurden von LegalEase an Ross verkauft, um die KI zu trainieren.
Wie begründet der District Court of Delaware seine Entscheidung?
Das Gericht befasst sich unter Abschnitt II. A. ab Seite 6 zunächst mit der Frage, ob die Westlaw-Headnotes und das „Key Number System“ von Westlaw urheberrechtlichen Schutz genießen und bejaht dies mit der Begründung, dass die Messlatte sehr gering („extremely low“) ist und ein äußerst geringes Maß an Kreativität („some minimal degree of creativity …. some creative spark“) ausreichend sei. Dies entspricht im Wesentlichen der sogenannten „kleinen Münze“ im deutschen Urheberrecht.
Sodann prüft das Gericht, ob Reuters den Nachweis erbracht hat, dass Ross diese urheberrechtlich geschützten Werke kopiert bzw. Kopien davon genutzt hat. Auch dies bejaht das Gericht, und zwar im Wesentlichen mit der Begründung, dass LegalEase unbestritten Zugriff auf die Westlaw Headnotes hatte und die von LegalEase erstellten „Bulk Memos“ im Wesentlichen ähnlich („substantially similar“) wären. In der Praxis berufen sich mutmaßliche Rechtsverletzer häufig darauf, dass Rechteinhaber nicht den Nachweis der Vervielfältigung urheberrechtlich geschützter Werke erbracht hätten. Einer solchen Verteidigung schiebt das Gericht in seiner Entscheidung jedoch den Riegel vor und legt auf Seite 11 der Entscheidung wörtlich den folgenden Maßstab an:
„Actual copying means that “the defendant did, in fact, use the copyrighted work in creating his own.” Tanksley v. Daniels, 902 F.3d 165, 173 (3d Cir. 2018). One can prove this directly, with evidence that the defendant copied the work, or indirectly, by showing that the defendant had access to it and produced something similar (“probative similarity”).“
Es ist zu beachten, dass es hier nicht um die Frage geht, ob das Ergebnis einer generativen KI eine erhebliche Ähnlichkeit mit einem urheberrechtlich geschützten Werk hat, sondern um die ganz konkrete Frage, ob die von LegalEase für das KI-Training erstellten Bulk Memos eine Kopie der Westlaw Headnotes darstellen. Eine direkte Übertragung dieser Anforderungen auf die Frage, ob das Training mit urheberrechtlich geschützten Werken nachgewiesen ist, wenn die generative KI auf entsprechende Prompts hin ähnliche oder identische Ergebnisse generiert, erscheint zweifelhaft, da in dem konkreten Fall nicht im Raum steht, dass die Bulk Memos selbst Ergebnis einer generativen KI sind.
Ab Abschnitt II. B. (ab Seite 14) befasst sich das Gericht mit den Verteidigungsgründen und beginnt mit den beiden Sätzen „None of Ross’s possible defenses holds water. I reject them all.“, die für die KI-Industrie (jedenfalls in den USA) wie Hammerschläge klingen müssen. Das Gericht stellt fest, dass sich Ross nicht auf fehlendes Verschulden („innocent infringement“) berufen kann, da die Westlaw Headnotes einen Urheberrechtsvermerk enthalten. Darüber hinaus verneint es eine missbräuchliche Rechtsausübung von Reuters und die Verteidigung, dass die Westlaw Headnotes gar nicht urheberrechtsfähig wären.
Das Herzstück der rechtlichen Ausführungen beginnt dann in Abschnitt III. der Entscheidung, nämlich der Frage, ob sich Ross bei dem KI-Training auf „Fair Use“ berufen kann. Im Ergebnis wird auch dies verneint. Das Gericht führt aus, das es (mindestens) vier (4) Faktoren zur Bestimmung von „Fair Use“ zu berücksichtigen hat, wobei der erste und vierte Faktor die höchste Gewichtung haben:
- Was sind Art und Zweck der Nutzung, u.a., handelt es sich um eine kommerzielle oder nicht-kommerzielle Nutzung?
- Welche Natur hat das urheberrechtlich geschützte Werk?
- Wie viel von dem Werk wurde verwendet und wie groß ist sein Anteil im Verhältnis zum Gesamtumfang des urheberrechtlich geschützten Werks?
- Wie wirkt sich Ross‘ Nutzung auf den Wert oder den potenziellen Markt des urheberrechtlich geschützten Werks aus?
Zu 1.: Das Gericht äußert sich sehr umfangreich zu der Art und Weise der Nutzung, wobei die kommerzielle Nutzung unstreitig ist. Das Gericht betont sodann, dass es sich nicht um eine „transformierende“ („transformative“) Nutzung handelt, sondern um eine Nutzung zum Zwecke des Aufbaus einer rechtlichen Suchmaschine, die mit dem von Reuters betriebenen Westlaw konkurrieren sollte. Interessant ist die Erwähnung, dass Ross gerade keine generative KI nutze und damit keine neue Form der Nutzung erfolge. Anders als in entschiedenen Fällen zur Nutzung von urheberrechtlich geschützten Werken (insbesondere Computerprogrammen) sei die Nutzung daher nicht transformierend, was entscheidend gegen eine Anwendung von „Fair Use“ spräche. Zwar trifft das Gericht keine ausdrückliche Aussage, der zweifache Hinweis darauf, dass es sich bei der von Ross entwickelten Anwendung gerade nicht um generative KI handelt, deutet jedoch zumindest an, dass es diesen Faktor bei generativer KI gegebenenfalls zugunsten desjenigen, der das KI-Modell trainiert, entscheiden könnte.
Zu 2. und 3.: Hierzu führt das Gericht relativ knapp aus, dass diese Faktoren dem Grunde nach für „Fair Use“ sprechen, in der Rechtsprechung aber eine untergeordnete Rolle spielen würden.
Zu 4.: Das Gericht führt zunächst aus, dass die Auswirkungen der Nutzung auf den Wert oder den potenziellen Markt des urheberrechtlich geschützten Werks den wichtigsten Faktor zur Bewertung von „Fair Use“ darstellen („is undoubtedly the single most important element of fair use“) und kommt dann zu dem Ergebnis, dass die Bewertung gegen „Fair Use“ spricht. Neben dem bestehenden Markt (juristische Rechercheplattformen) berücksichtigt das Gericht auch potenzielle Märkte, insbesondere den Markt für KI-Trainingsdaten. Zunächst hielt der Richter es für möglich, dass Ross durch seine Nutzung von Westlaw-Daten eine neuartige, transformative Plattform schaffe, die kein direkter Ersatz für Westlaw sei. Zudem gab es Zweifel, ob Reuters selbst plante, seine Daten für KI-Training zu lizenzieren. In der vorliegenden Entscheidung verwarf das Gericht diese Bedenken. Selbst bei wohlwollender Betrachtung wollte Ross mit Westlaw direkt konkurrieren, und das allein reiche aus, um eine Marktbeeinträchtigung festzustellen. Es sei unerheblich, ob Reuters bereits KI-Trainingsdaten vermarkte – die Möglichkeit, dies zu tun, sei rechtlich schutzwürdig. Auch das öffentliche Interesse an freiem Zugang zum Recht ändere daran nichts. Gerichtsurteile sind gemeinfrei, aber die von Reuters erstellten Westlaw Headnotes und das Key Number System sind urheberrechtlich geschützt. Ross hätte die von Reuters erstellten Werke eigenständig herstellen können, um ein Konkurrenzprodukt zu entwickeln, hat jedoch auf die bestehenden Werke von Reuters zurückgegriffen.
Im Endeffekt verneint das Gericht die Anwendung der „Fair Use“-Doktrin und bejaht eine unmittelbare Urheberrechtsverletzung durch Ross.
Wie ist der Verfahrensstand?
Die Entscheidung selbst ist noch kein Urteil in der Hauptsache, nimmt jedoch einige der wesentlichen Rechtsfragen vorweg. Bemerkenswert ist dabei, dass das Gericht mit der jetzigen Entscheidung ein bereits 2023 getroffenes „Summary Judgement“ verwirft und dies in geradezu poetischer Form einleitet („A smart man knows when he is right; a wise man knows when he is wrong. Wisdom does not always find me, so I try to embrace it when it does––even if it comes late, as it did here“). Gegen die Hauptsacheentscheidung wiederum kann (von beiden Beteiligten) Rechtsmittel eingelegt werden, was – wenn es nicht zu einer außergerichtlichen Einigung kommen sollte – im Hinblick auf die Bedeutung der Entscheidung nicht unwahrscheinlich ist. Zu beachten ist: Die Ross Intelligence Inc. hat bereits 2021 aufgrund der hohen Verfahrenskosten (alte Weisheit: Lawyers must be paid) den Geschäftsbetrieb eingestellt.
Was folgt aus der Entscheidung?
- Bei der Entscheidung handelt es sich um die bislang erste Entscheidung, mit der ein Rechteinhaber erfolgreich geltend machen konnte, dass das KI-Training mit urheberrechtlich geschützten Werken nicht auf „Fair Use“ gestützt werden kann.
- Die Entscheidung betrifft ausschließlich US-Recht. Eine unmittelbare Bedeutung für die in Deutschland und Europa wesentliche Frage, ob die TDM-Schranken nach §§ 44b, 60d UrhG auf das KI-Training Anwendung finden, hat sie nicht.
- Die Entscheidung verdeutlicht aber, dass das Risiko, als Hersteller und Anbieter von KI-Anwendungen, die mit in den USA geschützten Werken trainiert wurden, erheblich ist.
Besonders empfindlich für die Entwickler und Betreiber von KI-Anwendungen dürften die Ausführungen des Gerichts sein, dass die Beeinträchtigung eines potentiellen Marktes zum Anbieten von urheberrechtlich geschützten Werken gegen die Bejahung von „Fair Use“ spräche. Dieser Aspekt muss in jedem Einzelfall individuell geprüft werden. Entwickler von generativer KI können zwar nicht aufatmen, dürften aber die Ausführungen des Gerichts dazu, dass das Training nicht-generativer KI gerade nicht zu einer transformierenden und für „Fair Use“ sprechenden Nutzung führe, aufgreifen und für ihre Zwecke nutzen.
Was ist für Hersteller, Anbieter und Nutzer von KI in Deutschland und Europa nun zu tun?
Im Ergebnis bleibt es dabei, dass für jedes Projekt zur Entwicklung und Training von KI-Anwendungen ein möglichst „wasserdichtes“ Lizenzmanagement aufgebaut wird.
Ein solches Lizenzmanagement muss daher nicht nur Lizenzen an vorbestehender Software, sondern auch die Rechte im Hinblick auf die KI-Trainingsdaten berücksichtigen.
Ab dem 2. August 2025 besteht für Anbieter von KI‑Modellen mit allgemeinem Verwendungszweck zudem gemäß Art. 53 Abs. 1 lit. c) der KI-Verordnung (Verordnung (EU) 2024/1689) die Pflicht, eine Strategie zur Einhaltung des Urheberrechts der Union und insbesondere zur Ermittlung und Einhaltung eines gemäß Artikel 4 Absatz 3 der Richtlinie (EU) 2019/790 geltend gemachten Rechtsvorbehalts auf den Weg zu bringen.
Prüfen Sie deshalb Ihre Organisation und Ihr Lizenzmanagement jetzt! Die Erfahrung zeigt, dass eine erst spät in der Entwicklung eines KI-Systems einbezogene Rechtsberatung mit deutlich mehr Aufwänden verbunden ist, als eine Begleitung und Unterstützung in der Frühphase, idealerweise bereits in der Vorplanung.
Gerne helfen wir Ihnen mit unserer Expertise.
Ihre Ansprechpartner für KI und Recht:
Gerhard Deiters
Telefon: +49 221 / 270 956 – 160, E-Mail: gerhard.deiters@bho-legal.com
Dr. Philip Lüghausen
Tel.: +49 221 / 270 956 – 210; E-Mail: philip.lueghausen@bho-legal.com
Dr. Matthias Lachenmann
Tel.: +49 221 / 270 956 – 180; E-Mail: matthias.lachenmann@bho-legal.com