Von Künstlicher Intelligenz, Urheberrecht und kreativem Schaffen – Ein Interview mit Florian Wagenknecht
Mit dem Aufkommen großer Sprachsysteme wie ChatGPT stellen sich nicht nur moralische und technische Fragen, sondern auch rechtliche. Durch Schlagzeilen wie „VS in ver.di fordert Abschaltung von KI“ [1], „Raubt KI mir das Recht an meinen Texten und Bildern?“ [2] oder „Schriftsteller und Drehbuchautoren verklagen OpenAI“ [3] werden Problemfelder sichtbar, die Menschen aus dem Literaturbetrieb aktuell im Umgang mit KI beschäftigen. Um einen Einblick in die rechtliche Lage im Kontext von KI, künstlerischer Produktion und Urheberrecht zu geben, fand im Rahmen des Seminars „Kreatives Schreiben und Lektorieren mit KI“ und dem Projekt „AI-Labkit“ ein Talk mit dem Juristen Florian Wagenknecht statt. Geführt hat das Interview Jenifer Becker, schriftlich aufbereitet wurde es von Juliane Schlimme.
Florian Wagenknecht ist Fachanwalt für Medien- und Urheberrecht. Seine Kanzlei zudem in den Bereichen des Datenschutzrechts, Marken- und Wettbewerbsrecht sowie Arbeitsrechts tätig. Zugleich ist er Legal Counsel bei der Deutschen Welle. Florian Wagenknecht berät u.a. bei der Einführung von KI in Unternehmen und Behörden, verhandelt hierzu mit Vertragspartnern ebenso wie mit Betriebs- und Personalräten.
Am 21. Mai 2024 wurde der EU AI Act verabschiedet (nunmehr in der Fassung vom 12.07.2024). Herr Wagenknecht, was ist der AI Act und was bedeutet er für uns?
Der AI Act ist das, worauf alle gewartet haben, die irgendetwas mit KI zu tun haben. Die Verordnung betrifft hauptsächlich Unternehmen, die AI-Modelle entwickeln, anbieten oder verwenden. Im AI Act werden KI-Technologien nach einem risikobasierten Ansatz eingeteilt, um ein verhältnismäßiges und verbindliches Regelwerk zu etablieren. Das heiß, je höher das Risiko bei der Anwendung eingeschätzt wird, desto strenger sind die Vorgaben. Systeme mit einem inakzeptablen Risiko sind zunächst verboten, so zum Beispiel manipulative Systeme, Social-Scoring-Algorithmen und Echtzeit-Überwachungssysteme oder Gesichtserkennung. Daneben ist zwischen Systemen mit hohem Risiko (sog. Hochrisiko-KI-Systeme) und Systemen mit geringem und minimalem Risiko zu differenzieren. Unter die Hochrisiko-KI-Systeme fallen Systeme u.a. in den Bereichen kritische Infrastruktur, Gesundheits- oder Bankwesen. Dort muss eine Reihe von Anforderungen erfüllt werden, um für den EU-Markt zugelassen zu werden. Bei der Verwendung von Systemen mit geringem und minimalem Risiko gelten nur in begrenztem Umfang Transparenz- und Informationspflichten.
Auch zur Hochrisiko-KI zählen Systeme zur Entscheidungsfindung. Diese könnten theoretisch im Rechtsbereich durchaus in ein bis zwei Jahren dabei helfen, Urteile zu fällen. Oder dabei, zu entscheiden, ob jemand Arbeitslosengeld bekommt. Das sind einschlägige Maßnahmen, die europaweit durch den AI Act ermöglicht werden können, allerdings nur unter bestimmten Voraussetzungen, zum Beispiel dass Datensicherheit gewährleistet ist. Es muss auch abgesichert sein, wie die Entscheidungsfindung abläuft. Hintergrund ist, dass KI auf Wahrscheinlichkeitsrechnung basiert. Jeder, der ChatGPT in einer bestimmten Version genutzt hat, kann feststellen, dass die gleiche Frage unterschiedliche Antworten erzeugt. Das wird bei Entscheidungsfindungs- und Hochrisiko-KI eingegrenzt werden (müssen), um eine möglichst aussagekräftige Entscheidung zu erwirken.
Gibt es auch Regulierungen im Bereich generative KI?
Für Nutzer oder Verbraucher von generativer KI – im Bildbereich zum Beispiel Midjourney oder im Textbereich ChatGPT – ist Artikel 50 des AI Acts interessant. Wer diese Arten von KI nutzt und in bestimmten Bereichen tätig ist, muss bestimmte Voraussetzungen erfüllen, wie zum Beispiel die dem Artikel 50 unterfallen, müssen regelmäßig in einem maschinenlesbaren Format als künstlich erzeugt oder manipuliert erkennbar gemacht sein. Die Regelungen zielen hierbei maßgeblich auf sog. „Deep Fakes“ ab.
Müssen Trainingsdaten transparent gemacht werden?
Eine Offenlegungspflicht von Trainingsdaten auf Anbieterseite hat es nicht in gewünschter Form in den AI Act geschafft. Wenn ich von KI ein Bild von einem Hund generieren lasse, muss daher nicht direkt erkennbar sein, aus welchen Ursprungstrainingsdaten dieser Hund zusammengesetzt wurde.
Es besteht jedoch immerhin die Pflicht, eine hinreichend detaillierte Zusammenfassung der für das Training des allgemeinen KI-Modells verwendeten Inhalte nach einer vom Amt für künstliche Intelligenz bereitgestellten Vorlage zu erstellen und öffentlich zugänglich zu machen. Bei dieser Einsichtspflicht und Transparenzrechten stehen wir noch ganz am Anfang. Es wird derzeit nicht vor 2025 mit einer entsprechenden Vorlage gerechnet.
Bevor wir weiter ins Thema einsteigen, würde ich gerne Urheberrecht definieren. Wovon genau sprechen wir, wenn wir über Urheberrecht sprechen?
Urheberrecht ist ein Recht für alle natürlichen Personen. Also: jede natürliche Person kann Urheber sein. Wenn wir Texte oder Bilder erstellen und diese dabei eine sogenannte Schöpfungshöhe erreichen, das heißt, dass sie von einem alltäglichen Werk abzugrenzen sind, dann liegt ein schützenswertes Werk vor („auf die Unterscheidung zwischen alltäglichen und schöpferischen Werken wird später im Gespräch Bezug genommen. — Anm. d. Red“). Das ist die Grundvoraussetzung für Urheberschaft. Es soll also nicht nur eine Leistung, sondern der Gedankenprozess, der sich in einem Text oder Bild wiederfindet, geschützt werden. In Deutschland haben wir ein sehr strenges Urheberrecht. Das heißt, wenn ein Text oder ein Bild genutzt wird, muss der Urheber oder die Urhebergruppe dafür angemessen vergütet werden.
Was ist aktuell einer der größten Streitpunkte in Bezug auf KI und Urheberrecht?
Im Feld der KI-Nutzung wird aktuell viel um Geld gestritten. Wenn KI-Systeme Texte und Bilder aus dem Internet als Trainingsdaten nutzen, werden die Urheber nicht – wie es das deutsche Recht eigentlich sonst immer vorsieht – angemessen vergütet. Das heißt, ein Unternehmen beraubt den Urheber um seine geistige Schöpfung, verwertet sie weiter und vergütet nicht angemessen. Im Zweifel wissen die Urheber selbst nichts darüber, und auch wenn Kenntnis darüber bestehen würde, dass eigene, urheberrechtlich geschützte Werke genutzt worden sind, sind die KI-Unternehmen häufig nicht in Deutschland ansässig. Diese sitzen vorwiegend in Amerika und Asien, teilweise in Russland und können dadurch nicht oder nur schwerlich belangt werden.
Wir agieren hier sehr eurozentrisch, das heißt, wir haben einen deutschen oder europäischen Blick auf die Gesetzeslagen und versuchen, diese auf ausländische Firmen zu übertragen. Wir versuchen also mehr oder weniger sie zu zwingen, unser Recht zu beachten, was mal mehr und mal weniger gut funktioniert.
KI kann kein Urheber sein kann, da Urheberrecht natürlichen Personen vorbehalten ist. Wenn ich aber einen Text mit z. B. ChatGPT generiere und dafür einen einfachen Prompt eingebe, ist das Textergebnis dann urheberrechtlich geschützt oder nicht?
Da scheiden sich bereits die Geister. Bleiben wir beispielhaft im Bildbereich. Wenn ich z. B. den simplen Prompt „Generiere einen Hund“ eingebe, wird die Arbeit von KI erledigt, nicht von mir. Als Vergleich können wir folgendes Beispiel heranziehen: Sagen wir, ich möchte ein Foto von einem Hund machen und drücke dafür lediglich den Auslöseknopf einer Kamera. Wirklich viel Arbeit habe ich nicht in das Foto gesteckt, trotzdem ist das, was mit der Kamera generiert wird, urheberrechtlich oder zumindest leistungsschutzrechtlich geschützt. Und da stellt sich jetzt die Frage: Wie viel muss ich einer KI vorgeben, wie sehr kann ich die Wahrscheinlichkeit, die den Output bestimmt, begrenzen; wie sehr kann ich Prompt Engineering betreiben, um das Ergebnis so weit zu beeinflussen, dass ich hinterher genau das herausbekomme, was ich eigentlich möchte? Dann wäre KI eher ein Hilfsmittel wie eine Kamera und nicht wie aktuell ein eigenständiges Programm, das etwas ausgibt, auf das ich eigentlich fast gar keinen Einfluss habe.
Können Prompts urheberrechtlich geschützt sein?
Aktuell können selbst Twitter-Nachrichten, die aus zwei bis drei Sätzen bestehen, urheberrechtlich geschützt sein. Grundsätzlich also ja, es muss aber immer im Einzelfall entschieden werden. Bei einem einfachen Prompt aus ein bis zwei Sätzen können wir zumeist nicht von einer Urheberrechts- oder Leistungsschutzinhaberschaft sprechen. Wenn ich aber vielleicht einen zweiseitigen Prompt vorgebe, ließe sich überlegen, wie sehr der Prompt selbst urheberrechtlich geschützt wird oder eben der Output zusätzlich als urheberschutzrechtlich gewertetes Werk hingestellt werden kann.
Was ist der Unterschied zwischen Urheberrecht und Leistungsschutz?
Bleiben wir in der Bildgenese: Ein professioneller Fotograf, der alle Entscheidungen trifft, z. B. wo das Model stehen soll, welche Belichtungszeit eingestellt wird, usw. – dieser ganze Schaffensprozess ist ein urheberrechtliches Werk, weil ich dabei eine Schöpfungshöhe darstelle. Ich habe meine Gedanken und Vorstellung im Schaffensprozess selbst umgesetzt und nichts dem Zufall überlassen. Das ist ein urheberrechtliches Werk. Ich kann aber auch alltäglich fotografieren. Zum Beispiel bin ich am Strand, die Kinder sind im Wasser und ich möchte schnell ein Foto machen. Also hole ich die Kamera oder das Smartphone, drücke den Auslöser und fertig. Das ist ein Leistungsschutzrecht. Da ist allenfalls meine Leistung, dass ich auf den Knopf gedrückt habe, geschützt. Ich habe mir dabei aber nichts großartig gedacht, als dass ich die Personen im Bild irgendwie einfangen möchte. Das ist im Textbereich ähnlich.
Kann ich eine Gute-Nacht-Geschichte, die ich mit ChatGPT generieret habe veröffentlichen, wenn ich dafür nur 3 Prompts verwendet habe? Also ein Werk, in das ich wenig Arbeit gesteckt habe?
Wir müssen folgendes differenzieren: Grundsätzlich gibt es das Urheberrecht, das Leistungsschutzrecht und das Recht der KI-Anbieter, also sind auch die AGB maßgeblich. Wenn Sie ChatGPT nutzen, insbesondere, wenn Sie es kommerziell nutzen wollen, sollten Sie die AGB lesen. Da steht zum Beispiel drin, dass KI-generierte Inhalte teilweise gelabelt werden müssen. Wenn man das nicht möchte, zahlt man Geld dafür. Es gibt Anbieter, die festlegen, dass der Output nur für nicht kommerzielle Zwecke nutzbar ist. Viele Anbieter sagen, dass alles, was generiert wird, auch in die Trainingsdaten übergeht und somit von allen genutzt werden kann. Der Nutzer hat gar keine Rechte daran, unabhängig vom Urheberrecht. Wenn man das ausschließen möchte, zahlt man auch wieder Geld.
Wenn wir jetzt bei dem Beispiel bleiben, dass ChatGPT mir Gute-Nacht-Geschichten für meine Kinder schreiben soll, darf ich das Ergebnis nutzen und sogar verkaufen, wenn die AGB das zulassen und ich die entsprechenden Rechte im Zweifel eingekauft habe.
Das Problem ist nur, KI-generierte Inhalte sind erst mal nicht urheberrechtlich geschützt. Das heißt, die meisten KI genierten Inhalte sind aktuell gemeinfrei. Gemeinfreiheit bedeutet, ich muss keine Quellen angeben und keinen Urheber benennen. Der Text ist von jedermann auf der Welt frei nutzbar ohne Rückfrage und ohne irgendwen zu vergüten. Das heißt, wenn ich ein Buch mit ChatGPT generiere, kann ich das verkaufen, aber jeder andere Verlag kann das genauso machen. Es bestehen keinerlei Rechte.
Wie wäre es, wenn ich mehr Arbeit aufwenden würde, also mehr prompten und überarbeiten würde?
Gehen wir davon aus, ich lasse eine Gute-Nacht-Geschichte von einer KI genieren und sage der KI, das gefällt mir noch nicht, wodurch Textteile umgeschrieben werden. Ich nehme weitere Anpassungen vor, sagen wir in einem Prozess, der hundert Überarbeitungsaufforderungen beinhaltet. Und dann redigiere ich jenen Text aus redaktioneller, künstlerischer oder journalistischer Sicht. In diesem Fall ist das Ergebnis eventuell ein urheberrechtlich relevantes Werk. Dadurch, dass ich meine Gedanken eingebracht habe und es am Ende kaum noch möglich sein wird, nachzuvollziehen, welche Textteile eindeutig von der KI stammen und welche eindeutig von mir. Jenes Werk könnte ich verkaufen und ich müsste als Urheber genannt werden.
Nach Artikel 50 müsste ich dann jedoch möglicherweise offenlegen, dass Inhalte künstlich erzeugt oder manipuliert wurden.
AGB lesen ist ein guter Hinweis für die eigene Praxis. Wie verhält es sich, wenn ich in meinem Kinderbuch Bilder abdrucken möchte, die von einer KI generiert wurden: Darf ich diese Bilder nutzen oder hängt das auch wieder mit den AGB zusammen?
Das bestimmen auch hauptsächlich die AGB. Davon abgesehen ist es ähnlich wie bei Texten. Wenn eine KI Bilder generiert, habe ich in den meisten Fällen keine Rechte daran. Die Hürde, den Schaffungsprozess oder den Output beeinflussen zu können, ist noch höher als im Textbereich, jedenfalls aus technischer Sicht her. Deshalb ist an Bildern – Stand jetzt – fast kein Urheberrecht zu begründen. Das heißt, das einzige Recht, was besteht, ist das des Unternehmens, das die KI bereitstellt. Ich muss also wieder die Bestimmungen der AGB berücksichtigen.
Wie ich die Bilder nutzen kann, hängt häufig wieder davon ab, wie viel Geld ich den Unternehmen zahle. Die setzten dann fest, ob ich z.B. Wasserzeichen einbinden muss und ob ich die Bilder kommerziell nutzen darf.
Davon ab muss ich wieder an meine Offenlegungspflichten denken, d.h. KI generierte Inhalte entsprechend labeln.
Die New York Times hat gegen OpenAI geklagt, da urheberrechtlich geschützte Werke für Trainingsdatensätze genutzt worden sind. Wie sieht es aktuell mit dem Recht von Autor:innen aus, deren Werke ungefragt für Trainingszwecke genutzt werden – also mit dem Input?
Aus urheberrechtlicher Seite gesprochen sieht es leider sehr schlecht aus. Wir haben im deutschen Gesetz aus urheberrechtlicher Sicht einen eher nachteiligen Paragrafen. Das ist der, der Text- und Datamining, also das Herausziehen von Text und Daten aus dem Internet, erlaubt. Auf diesen Paragrafen berufen sich die KI-Unternehmen hauptsächlich. Die einzige Möglichkeit, um sich davor zu schützen, ist einen Rechtsvorbehalt auf der Webseite oder auf dem Text „maschinenlesbar“ zu platzieren. Der besagt dann, dass diese Inhalte nicht von KI nicht als Trainingsdatum genutzt werden dürfen.
Auch hier argumentieren wir aber aus einer eurozentrischen Sicht: Interessiert das ein Unternehmen in Asien? Wir können nicht wirklich kontrollieren, ob sich Unternehmen an die Regelung halten. Es gibt auch im Urheberrecht vom Bundesgerichtshof unerfreuliche Entscheidungen zur Google Bildersuche. Platt ausgedrückt: Wenn ich etwas ins Internet stelle, dann muss ich davon ausgehen, dass andere Unternehmen diese Inhalte für wirtschaftliche Zwecke nutzen und auch ausnutzen. So suchte Google bekanntermaßen alle Webseiten ab, um Bilder dann in ihrer Bildersuche als Thumbnail abzubilden. Für den Bundesgerichtshof war das völlig legal ist. Ähnlich argumentieren nun die KI-Unternehmen: Wenn kein Nutzungsvorbehalt eindeutig erkennbar ist, kann alles, was im Internet zu finden ist, von Unternehmen genutzt werden. Das wird nicht einmal hinter vorgehaltener Hand, sondern frei heraus ausgesprochen. So bspw. hat Microsofts KI-Chef Internet-Inhalte als „Freeware“ betitelt und damit mehr oder weniger für Freiwild erklärt.
Wie wird begründet, dass Stilimitationen legitim sind und z. B. die Bildsprache kanonisierter Künstler:innen übernommen werden darf?
KI-Unternehmen argumentieren, dass es keinen Unterschied mache, ob ein Mensch z. B. ein Bild ins Internet hochlädt, eine KI jenes Bild liest und ein Bild generiert, das jenem Bild ähnelt – oder ob ich dies als Mensch analog mache. Damit meine ich: Wenn ich z. B. den Schimmelreiter lese und mich davon inspirieren lasse, einen Text in ähnlichem Stil oder auch mit Worten daraus zu schreiben, generiere ich dennoch ein eigenes Produkt, das urheberrechtlich geschützt ist. KI-Unternehmen setzen diesen Schaffensprozess mit dem von KI gleich und argumentieren, dass folglich keine Rechte und keine Rechtsvorbehalte geltend gemacht werden können und keine Urheberrechtsverletzung vorliege.
Aus deutscher Sicht sehen wir das ein bisschen anders, insbesondere wenn ein Nutzungsvorbehalt gesetzt wurde und diese Daten tatsächlich gescrapt und analysiert werden. Scraping in dem Sinne, dass ein Bild oder ein Text auf einen anderen Server kopiert wird, um dort von einer KI analysiert zu werden. Das ist dann eine Nutzungshandlung, eine Vervielfältigung im urheberrechtlichen Sinne, die vergütet werden müsste. Hier versuchen Unternehmen aus deutscher und teilweise amerikanischer Perspektive einzuhaken und auf Grundlage dieser Vervielfältigungshandlung, die wahrscheinlich illegal ist, Kapital zu schlagen.
Wie sähe es denn aus, wenn ich selbst einen Text schreibe und diesen von einer KI auf Rechtschreibfehler hin überprüfen lasse: Verliere ich dann mein Urheberrecht an dem Text?
Das hängt auch mit den AGB zusammen, außerdem mit der Version der KI. Bei GPT 3.5 ließen die AGB beispielsweise vermuten, dass alles, was Sie eingegeben haben, ChatGPT selber nutzen darf. Es ist nicht unbedingt gemeinfrei geworden, aber es durfte für die eigenen Trainingsdaten genutzt werden. Daher gilt: Informieren Sie sich gut und lesen sie gründlich die AGB.
Herzlichen Dank an Florian Wagenknecht für seine Zeit und das Beantworten der Fragen!
Einzelnachweise
1 Börsenblatt: VS in ver.di fordert Abschaltung von KI. In: Börsenblatt (2023). https://www.boersenblatt.net/news/literaturszene/vs-verdi-fordert-abschaltung-von-ki-283071 (29.02.2024).
2 Ralf Krauter u. Piotr Heller, Piotr: Raubt KI mir das Recht an meinen Texten und Bildern? In: Deutschlandfunk (2023). www.deutschlandfunk.de/ki-und-urheberrecht-raubt-ki-mir-das-recht-an-meinen-texten-und-bildern-dlf-3ede98e1-100.html (29.02.2024).
3 Eric Voigt: Schriftsteller und Drehbuchautoren verklagen OpenAI. In: Zeit online (2023). www.zeit.de/digital/2023-09/openai-kuenstliche-intelligenz-klage-schriftsteller (29.02.2024).
Autor:innen
Interview: Jenifer Becker & Florian Wagenknecht.
Text: Juliane Schlimme. Lektorat: Jonas Galm, Jenifer Becker.
Zitation: Juliane Schlimme u. Jenifer Becker: Von Künstlicher Intelligenz, Urheberrecht und kreativem Schaffen – Ein Interview mit Florian Wagenknecht. In: AI-Labkit (2024). https://ai-labkit.de/blog/?post=von-k%C3%BCnstlicher-intelligenz-urheberrecht-und-kreativem-schaffen-ein-interview-mit-florian-wagenknecht