Beitrag

© Parradee | Adobe Stock

Das Ende von LLM-Training, wie wir es kennen? Einflüsse der Entscheidung „GEMA gegen OpenAI“ auf die urheberrechtliche Zulässigkeit des LLM-Trainings

Die Entscheidung des Landgerichts München I wirft viele interessante Folgefragen auf. Eine ist die Relevanz der Entscheidung für das Training von großen Sprachmodellen mit Blick auf die urheberrechtliche Lage. Das grundsätzliche Ergebnis der Entscheidung – nämlich die Unterbindung der Verbreitung von Vervielfältigungen geschützter Werke ohne die Zustimmung des Urhebers – dürfte nicht zu beanstanden sein. Dennoch ist der dogmatische Weg zu diesem Ergebnis einen näheren Blick wert.

Recap: §§ 44b, 60d UrhG als Grundlage für das Training von LLMs

(Näher zur Systematik und den Voraussetzungen der Vorschriften: Reuter, in: Garling/Niemann/Roßmann, Generative KI in der Rechtsberatung, § 2 Rn 74 ff.)

Um die Hintergründe der gerichtlichen Begründung zu verstehen, bedarf es einer kurzen Wiederholung der urheberrechtlichen Grundlagen. Grundsätzlich ist jede Werknutzung von der entsprechenden Zustimmung des Urhebers abhängig. Allerdings lässt das deutsche Urheberrecht für bestimmte Konstellationen dieses Zustimmungserfordernis entfallen.

Bei einer dieser Konstellationen handelt es sich um das Text- und Data-Mining (TDM). Nach § 44b Abs. 1 UrhG handelt es sich dabei um „die automatisierte Analyse von einzelnen oder mehreren digitalen oder digitalisierten Werken, um daraus Informationen insbesondere über Muster, Trends und Korrelationen zu gewinnen“. Die Vorschriften des §§ 44b Abs. 2 und 60d Abs. 1 UrhG erlauben zu diesem Zweck die temporäre Vervielfältigung urheberrechtlich geschützter Werke.

Als technologieneutrale Vorschriften wurden diese nicht explizit für das Training von großen Sprachmodellen geschaffen. Für gewisse Zeit wurde innerhalb der Literatur (Dreier/Schulze/Dreier, Urheberrecht, § 44b UrhG Rn 5; BeckOK UrhR/Bomhard, § 44b UrhG Rn 11a f.; Wendt/Wendt, Urheberrecht, § 10 Rn 35; Käde, KIR 2024, 162, 163 ff.; Hoeren/John/Klostermeyer, MMR-Hdb, Teil 29 Rn 15 ff.; Baumann, NJW 2023, 3673; Radtke, ZGE 17 (2025), 1, 38; a.A. Dornis/Stober, Urheberrecht und Training generativer KI-Modelle – Technologische und juristische Grundlagen, S. 13; Schack, NJW 2024, 113, 114 f.; Dornis, GRUR 2024, 1676) rege diskutiert, inwieweit die Ausnahmetatbestände auf den Fall des LLM-Trainings überhaupt anwendbar sind. Erste Rechtsprechung (LG Hamburg, NJW 2024, 3383) hat sich für die grundsätzliche Anwendbarkeit der Vorschriften auf das Training von LLMs entschieden.

LG München I erklärt TDM-Vorschriften zwar für grundsätzlich anwendbar, sieht aber unzulässige Werksvervielfältigungen innerhalb des Modells

Das LG München I schließt sich inhaltlich der Ansicht des LG Hamburg an und erklärt die Vorschriften des §§ 44b und 60d UrhG im Kontext des LLM-Trainings grundsätzlich für anwendbar.

Allerdings lehnt es die urheberrechtliche Zulässigkeit des Modelltrainings mit den streitgegenständlichen Liedtexten dennoch ab. Das Gericht begründet die Entscheidung damit, dass die Liedtexte im Rahmen des Trainings durch das Modell in einer Form memorisiert worden seien, die den einzigen Schluss zulasse, dass das Modell eine Vervielfältigung der Liedtexte im Sinne des § 16 Abs. 1 UrhG beinhalte. Grund für die Annahme sei, dass das Modell bereits bei kürzeren Prompts mit einer hohen Wahrscheinlichkeit zum Output der urheberrechtlich geschützten Liedtexte neige. Solche – nicht lediglich temporären – Vervielfältigungen seien von den Vorschriften der §§ 44b und 60d UrhG ausdrücklich nicht gedeckt.

Diesen Beitrag teilen

Facebook
Twitter
WhatsApp
LinkedIn
E-Mail

Unser KI-Spezial

Erfahren Sie hier mehr über Künstliche Intelligenz – u.a. moderne Chatbots und KI-basierte…