Skip to main content
Logo von MKM LEGAL
Handy mit Logo von OpenAI liegt auf einer Tastatur

KI-Inhalte und Urheberrecht: Von Data-Mining bis zur Haftung für Output

Wirksame Vorbehalte erklären, Urheberrecht beachten und Haftung ausschließen

In diesem Artikel möchten wir Sie darüber informieren, welche rechtlichen Aspekte bei der Nutzung von KI-generierten Inhalten sowie von urheberrechtlich geschützten Werken zu beachten sind, um sowohl die gesetzlich vorgeschriebenen Vorgaben einzuhalten als auch mögliche Haftungsrisiken zu minimieren.

Die Fragestellungen, die sich aus dem Einsatz von KI ergeben, sind vielschichtig und können aus unterschiedlichen Perspektiven betrachtet werden. Dies betrifft nicht nur den mit diesem Artikel behandelten Teil des urheberrechtlichen und persönlichkeitsrechtlichen Bereichs der Werkschaffenden und der Entwickler, sondern auch den Umgang zur Haftung bei KI-generierten Fehlern wie Halluzinationen oder datenschutzrechtliche Fragestellungen. Der vorliegende Beitrag konzentriert sich auf zwei kürzlich ergangene Urteile, die die Zulässigkeit der Nutzung urheberrechtlich geschützter Inhalte für das Training von KI-Systemen betreffen, sowie auf die technischen und rechtlichen Voraussetzungen eines Nutzungsvorbehalts.

KI & Urheberrecht

In dem Spannungsfeld der Rechteinhaber von Werken und derjenigen, die ein Interesse am Sammeln von Daten mittels des Text- und Data-Minings haben, treffen Schutzinteressen auf Innovationsbestrebungen.

Auf Seiten der Entwickler generativer KI-Modelle ist die Verfügbarkeit geeigneter Trainingsdaten unbedingt erforderlich. Um leistungsfähige Large Language Models zu entwickeln, sind große Mengen qualitativ hochwertiger und vielfältiger Daten notwendig, da nur so das gewünschte Potenzial, Genauigkeit und Anpassungsfähigkeit der Modelle erzeugt werden kann.

Angesichts der rasanten technologischen Entwicklungen im Bereich der Künstlichen Intelligenz sehen sich Kreativschaffende, die ihre Werke – wie Texte, Bilder, Daten oder Musik – über Webseiten oder Apps veröffentlichen, zunehmend neuen Risiken ausgesetzt. Ihre Inhalte werden vermehrt als Trainingsmaterial für generative KI-Modelle verwendet. Mittels Verfahren, die als Text- und Data-Mining bezeichnet werden, besteht die Möglichkeit, in digitaler Form vorliegende Informationen automatisch zu analysieren. In der Regel fallen dabei urheberechtlich relevante Prozessschritte wie das Vervielfältigen an. Dabei handelt es sich jedoch um gesetzlich explizit erlaubte Nutzungen. Mit § 44b UrhG hat der Gesetzgeber eine Ausnahmeregelung für Text- und Data-Mining zu kommerziellen und Forschungszwecken eingeführt. Für Vervielfältigungen im Rahmen von Text- und Data-Mining ist zudem weder eine Quellenangabe noch eine Vergütungspflicht vorgesehen. Rechteinhaber haben häufig ein erhebliches Interesse daran, eine solche Nutzung ihrer Inhalte zu unterbinden oder zumindest einzuschränken. Dies ist mit der Erklärung des Vorbehalts gegen solche Vervielfältigungen gemäß § 44b Abs. 3 UrhG möglich. Bei online verfügbaren Werken muss der Vorbehalt jedoch in maschinenlesbarer Form erfolgen.

Maschinenlesbare Form der Vorbehaltserklärung

Im LAION-Verfahren hat sich ein Berufsfotograf gegen die Verwendung seiner Stockfotografien zur Erstellung eines KI-Trainingsdatensatzes gewandt. Der Beklagte, LAION e. V., ein gemeinnütziger Verein, hatte Datensätze und Open-Source-Modelle zum Training von KI-Anwendungen frei zur Verfügung gestellt. Die Gerichte haben sich in diesem Verfahren europaweit erstmalig zur genaueren Auslegung des maschinenlesbaren Vorbehalts und der Ausnahme für die Wissenschaft nach § 60d UrhG geäußert.

Das OLG Hamburg hat in seinem Urteil vom 10.12.2025 – 5 U 104/24 entschieden, dass bei einer Online-Bildveröffentlichung kein wirksamer Nutzungsvorbehalt erklärt wurde. Die Nutzung für das Text- und Data-Mining muss konkret genannt werden. Zudem sei der Opt-out formunwirksam gewesen, da er nicht in maschinenlesbarer Form erklärt worden sei. Denn es ist erforderlich, dass der Nutzungsvorbehalt nicht nur maschinell erfasst, sondern auch maschinell interpretiert werden kann, da man nur so bei einem automatisierten Vorgehen sichererstellen kann, dass die vom Vorbehalt erfassten Inhalten nicht ausgewertet werden.

Im Übrigen greife auch die Schranke des § 60d UrhG. Der beklagte Verein ist eine Forschungseinrichtung im Sinne des § 60d Abs. 2 UrhG und verfolgt keine kommerziellen Zwecke. Dass auch kommerzielle Anbieter den erstellten Datensatz verwenden können, sei hingegen unerheblich. Da sowohl nichtkommerzielle Forschungsinstitutionen als auch kommerzielle Unternehmen den Datensatz nutzen können, ist die Tätigkeit des Beklagten nicht auf Gewinnorientierung ausgerichtet. Gegen die Entscheidung ist Revision eingelegt worden. 

Urheberrechtsverletzung oder noch Text- und Data-Mining?

Im Anschluss an das LG Hamburg befasste sich auch das LG München I mit Urteil vom 11.11.2025 – 42 O 14139/24 mit KI-Training und den verschiedensten Aspekten dazu. Dieses Urteil wurde mit großer Spannung erwartet, da es weitreichende Auswirkungen auf den Umgang mit digitalen Inhalten und dem Training Künstlicher Intelligenz haben könnte – insbesondere im Zusammenhang mit einem der aktuell prägendsten KI-Systeme, ChatGPT. Hier machte die GEMA gegen zwei Gesellschaften von OpenAI Unterlassungs-, Auskunfts- und Schadensersatzansprüche für die Ausgabe von neun urheberrechtlich geschützten Liedtexten in den Sprachmodellen GPT geltend. Die Liedtexte wurden bei auf einfache Nutzeranfragen hin ausgegeben. Die Richter werteten, dass OpenAI sich im Fall memorisierter Werke nicht auf die Text- und Data Mining-Schranke des § 44b UrhG berufen könne. Werden wie vorliegend beim Training nicht nur Informationen aus Trainingsdaten extrahiert, sondern Werke vervielfältigt, stellt dies kein Text- und Data-Mining dar. Eine solche Auswertung ist daher kein bloßes Text- und Data-Mining.

 

Autorin: Luise Klufmöller LL.M. (Rechtsanwältin | Fachanwältin für Urheber- und Medienrecht | Fachanwältin für gewerblichen Rechtsschutz) 

Zwei Personen geben sich über den Schreibtisch hinweg die Hand

Beratung zu Urheberrecht & KI

Gern beraten wir Sie, ob und in welchem Umfang der (auch ein in natürlicher Sprache formulierter) Vorbehalt den Anforderungen des § 44b Abs. 3 S. 2 UrhG entspricht, wo ein solcher Vorbehalt auf einer Webseite am besten angebracht wird und inwiefern Betreiber von KI-Modellen für rechtsverletzenden Output nicht haftbar gemacht werden können.

Logo von MKM LEGAL
Newsletter-Anmeldung