KI in der Medienbranche: Was bringt die Zukunft?
von Katja Schwengler, 14. März 2023
Künstliche Intelligenz ist auf dem Vormarsch – auch in der Medienbranche. Unumstritten haben sich vor allem Bilder in den vergangenen Jahrzehnten zu einer der wichtigsten Medienformen entwickelt. Intelligente Bildgenerierungs-Tools wie Dall-E oder Stable Diffusion bieten dabei einen schier unendlichen Material-Pool, sind aber auch eine Herausforderung für aktuelles Medienrecht – und für Berufsfelder wie Illustration oder Fotografie. Bei unserem Media Insights gaben Expert:innen Einblick in ihren Arbeitsalltag mit KI-Tools, inklusive Nutzen und Not.
Gleich zu Beginn des digitalen Events nahm Jim Sengl vom MedienNetzwerk Bayern mit auf die Entstehungsreise eines spontan mithilfe von Stable Diffusion erstellten Bildes. Die inhaltlichen Vorschläge kamen aus dem Publikum. Das Funktionsprinzip des KI-Bildgenerators ist simpel. Man beschreibt mit wenigen Begriffen, was auf dem Bild zu sehen sein soll. Darauf basierend erstellt Stable Diffusion das Bild. Die Eingabe basiert auf einem Programm, das sich auf Text-zu-Bild-Konversion spezialisiert hat. Die KI-Bildgeneratoren bezeichnet man als „Prompt“.
Pina Merkert, Redakteurin beim Computermagazin c’t, erklärte, was dabei aus technischer Sicht im Hintergrund abläuft: Vereinfacht gesagt basieren die meisten KI-Modelle auf mehreren unterschiedlichen Datenbanken und verwenden sogenannte „neuronale Netze“. Diese wurden mit einer gigantischen Menge an bestehenden Bildern trainiert, die zuvor in das Computersystem eingegeben wurden. Anhand der Eingaben lernt die KI die exakte Nachahmung. Viele der eingespeisten Bilder, mit denen die neuronalen Netze lernen, stammen aus dem Internet. Firmen wie OpenAI suchen gezielt nach Bildern und dazugehörigen Textbeschreibungen, mit denen die Maschinen selbstständig lernen.
Doch wie kam es so schnell zu diesen Innovationen, die gefühlt von einem auf den anderen Tag Einzug halten ins private und vor allem berufliche Umfeld? Laut Pina Merkert sind dafür die „Transformer“ verantwortlich, eine ganz bestimmte Architektur für neuronale Netze. Diese leistungsstarken Transformer können nun größer werden und sinnvolle Daten aus Sprache extrahieren.
KI-Bilder sind nur so gut wie die Prompts dahinter
Christian Schiffers Weg zur KI-Bildgenerierung begann mit einem „Fail“: Als der Journalist und Radiomoderator beim BR seinen Podcast rund um das Thema mit einem geeigneten Visual versehen wollte, stellte er fest, dass die Auswahl an geeignetem Material in der BR-Bilddatenbanken seinen Vorstellungen nicht entsprach. Da zu dieser Zeit KI-Bildgeneratoren wie Dall-E oder Stable Diffusion bereits zugänglich waren, wagte er einen Versuch, der ihn überzeugte – die juristische Direktion seines Arbeitgebers jedoch vor Herausforderungen stellte: Wer hat nun die Rechte an diesem Bild? Eine weitere Feststellung, die sich auch durch das Experiment zu Beginn der Veranstaltung belegen ließ: Das KI-generierte Bild ist nur so gut, wie die Eingabe, also das Prompting. Schiffer verdeutlichte das außerdem durch den Versuch, ChatGPT beim bayerischen Abitur antreten zu lassen. Die Ergebnisse? Durchwachsen
KI als sinnvolle Unterstützung im Medien-Arbeitsalltag
Jim Sengl machte in dem Zuge die Erfahrung, dass ChatGPT nicht rechnet, also auch keine Mathematik-Probleme lösen kann, sondern als Statistikprogramm lediglich Vorhersagen trifft, basierend auf Wahrscheinlichkeiten. Und diese können eben auch daneben liegen, wie Pina Merkert anhand der Theorie von „schnellem und langsamen Denken“ des Psychologen Daniel Kahneman näher beschreibt. Auch deshalb ist sie sich sicher, dass KI anstatt Jobs überflüssig zu machen, vielmehr unterstützen kann und neue Berufsprofile schafft. So etwa beim Schreiben: Wenn die eigenen Stärken im Redigieren liegen und nicht beim Befüllen eines noch leeren Blattes: ChatGPT kann einen Impuls setzen und den Start vereinfachen; Fakten jedoch müssen nach wie vor geprüft und verifiziert werden.
Einbußen im Dienstleister Bereich
Christian Schiffer bestätigte diese Annahme: KI werde in Zukunft zwar viel verändern, jedoch weniger in Bezug auf journalistische Textarbeit als vor allem in der Produktion. Beim Hörfunk bedeutet das eine Entlastung bei Transkriptionen von O-Tönen, die er nun weder selbst erledigen noch an Schreibbüros herausgeben muss. Das hat natürlich zur Folge, dass „handwerkliche“ Dienstleistungen wie ebenjene Schreibbüros mit enormen Verlusten rechnen müssen. Auch im Bereich der Tontechnik sorgt KI für Zeitersparnis, wenn die Audiobearbeitung der intelligenten Maschine überlassen werden kann.
Prompting muss man beherrschen: Je besser die Eingabe, umso besser die Ergebnisse, also die generierten Bilder.
Christian Schiffer, Journalist und Radiomoderator beim BR
Im Bereich Grafik und Webdesign kann KI künftig ebenfalls eine große Rolle spielen. So nutzt Pina Merkert für ihre Artikel bereits Bildgeneratoren, nachdem das Magazin c’t bisher auf Fotostudios und Illustrator:innen zurückgriff. Dies hat zur Folge, dass Budgets für Illustrationen gekürzt, jedoch nicht komplett eingestellt wurden. Denn um eine einheitliche Bildsprache, die sich durch das gesamte Magazin zieht, zu gewährleisten, braucht es nach wie vor menschliches Gespür und Talent.
Was des einen Leid ist – die Rede ist von Grafiker:innen und Illustrator:innen – kann des anderen Freud sein: Redakteur:innen entdecken nun die Möglichkeit, Wortspiele in ihrer journalistischen Arbeit durch künstliche Intelligenz zu konkretisieren.
Welche rechtlichen Aspekte gelten derzeit bei der KI-Bildgenerierung?
Bei all den Zukunftsaussichten muss jedoch die Frage gestellt werden, welche rechtlichen Aspekte bei der Nutzung von KI-Bildgeneratoren beziehungsweise den Ergebnissen gelten. Aktuell gibt es in Deutschland zwar noch keine gesetzlichen Regelungen zur Verwendung von KI-Bildgeneratoren. Allerdings gelten gesetzliche urheberrechtliche Bestimmungen für diese Technologie. Das Urheberrecht an Bildern steht grundsätzlich demjenigen zu, der sie erstellt hat. Im Rahmen der KI kämen theoretisch gleich mehrere Berechtigte in Frage: Die KI selbst, Entwickler:innen des KI-Bildgenerators oder die Nutzer:innen, die den Input geben.
In Deutschland gilt das Urheberrecht nach dem Gesetz für Werke der Literatur, Wissenschaft und Kunst (UrhG) als schutzwürdig. Danach ist jede „geistige Schöpfung“ urheberrechtlich geschützt, sobald sie fixiert wurde. Dazu können auch Bilder gehören, die mit Hilfe eines KI-Bildgenerators erstellt wurden. Ob ein solches Bild jedoch als „geistige Schöpfung“ im Sinne des UrhG anzusehen ist, diskutierten die Expert:innen mit Jim Sengel und Teilnehmenden, denn das Urheberrecht besagt, dass die geistige Schöpfung durch einen Menschen hervorgebracht werden muss.
Eine Grauzone mit Handlungsbedarf
Darüber hinaus ist zu berücksichtigt, wie die Technologien „gefüttert“ wurden. Hier kann es zu urheberrechtlichen Problemen kommen. Denn Forschende trainieren die Algorithmen der KI-Unternehmen unter anderem mit urheberrechtlich geschützten Bildern aus dem Internet. So wurde Dall-E auf Basis vieler hundert Millionen Bilder und Textbeschreibungen trainiert. Als Ausnahme hat Stable Diffusion das KI-Modell vollständig offengelegt. Die Lizenz erlaubt den Einsatz von Stable Diffusion für kommerzielle Produkte.
Auch die Weiterbearbeitung eines durch KI-generierten Bildes kann nicht rechtlich einwandfrei gesehen werden. Zu dürftig ist die gesetzliche Lage in Bezug auf Rechte an dem Material, das die KI verwendet, an den Rechten des Dienstebetreibers und der Personen, die abgebildet sind.
Eine Orientierung gibt derzeit ein Verordnungsvorschlag der EU-Kommission, der den Einsatz von KI in der EU regeln soll und den Unternehmen bei der Anwendung von KI-gestützten Systemen Pflichten auferlegt.
Da es jedoch noch keine Gesetze gibt, bleibt die Verwendung von KI-generierten Bildern bislang eine rechtliche Grauzone – die bereits jetzt für Furore sorgt und an der in Zukunft in der Medienbranche kein Weg mehr vorbeiführt.
Media Insights: Mitschnitt
Link-Tipps:
- 5 Learnings von Greg Brockman, Gründer OpenAI, bei der SXSW 2023
- Netzwerkwissen ChatGPT
- Netzwerkwissen Fact Checking
- Midjourney: KI, die in der Lage ist, KI-Kunst zu erschaffen.
- Lexika: Wissensportal rund um Urteile und Recht.