KI-Bildtools wie Midjourney im Agenturalltag nutzen

Written by
Deniz Knopp
Junior Consultant
Michaela Harfst
Senior Consultant

Was denken Sie, wenn Sie dieses Bild sehen? (Abgesehen davon, dass es ziemlich niedlich ist). Wenn Sie sagen: „Da hat doch eine KI ihre algorithmische Hand im Spiel!“, liegen Sie goldrichtig. KI-Bildgeneratoren wie Midjourney boomen schon seit einiger Zeit und sind in der öffentlichen Wahrnehmung mittlerweile recht präsent. Den Wenigsten ist dabei bewusst, dass die Idee der automatischen Generierung von Bildern nicht erst in den letzten Jahren aufkam. In welchem Jahr denken Sie ist das erste KI-generierte Bild entstanden?

Midjourney image: Squirrel
(C) Deniz Knopp – erstellt mit Midjourney

Der englische Künstler Harold Cohen, der anfing sich in der Londoner Kunstszene zunehmend zu langweilen, begann sich schon Ende der 1960er Jahre mit neuartigen Wegen des künstlerischen Schaffens in Form von Computertechnologie zu beschäftigen. Die ersten Zeichnungen des von ihm entwickelten KI-Systems AARON entstanden in den frühen Siebzigerjahren. Dabei entwickelten sich die Bilder schnell von anfangs noch abstrakten Gebilden über Steine und Blumen zu Personen.

Wie man unschwer an neueren Bildern erkennen kann, hat sich bei der KI-Generierung von Bildern inzwischen einiges getan. Die gesteigerte Leistungsfähigkeit von Computern macht mittlerweile, besonders unter Zuhilfenahme von Machine Learning Algorithmen, verblüffend realistische Ergebnisse möglich. Und das bei für den Nutzer verhältnismäßig geringem Aufwand.

Ein aktuell beliebtes Tool zur Bildgenerierung ist die KI Midjourney des gleichnamigen Forschungsinstitutes in San Francisco unter der Leitung des Ex-NASA Mitarbeiters David Holz. Das anfangs gezeigte Bild habe ich vor wenigen Monaten von Midjourney mit dem Satz „a cool squirrel playing the saxophone“ generieren lassen.

Der User bedient besagtes Tool über die beliebte online Chat-, Sprach- und Videokonferenzplattform Discord: Nutzer*innen schreiben einen Satz, einen sogenannten Prompt, und die KI visualisiert diesen. So weit, so simpel. Gleichermaßen herrscht, wie bei anderen mächtigen und neuartigen KI-Anwendungen, wie z.B. auch ChatGPT, einiges an Unsicherheit und bisweilen auch Unwissenheit. Ist es urheberrechtlich geregelt, wem die generierten Bilder gehören? Warum sind die von Anderen im Netz präsentierten Bilder so atemberaubend, die eigenen aber selten wie gewünscht? Was kann das Tool eigentlich genau bieten und was nicht? Und wie kann ein Unternehmen solch ein Tool potenziell nutzen?

Dazu haben wir der Social Media Marketing-Expertin und bekennenden Midjourney-Enthusiastin Samira Marke von marketing rocks ein paar Fragen gestellt.

Archetype: KI Bildtools sind aktuell sehr beliebt. Welche sind deine Favoriten?

Samira Marke: Ich bin absoluter Fan von Midjourney. Ehrlich gesagt habe ich noch nicht viele andere Tools ausprobiert bzw. habe nach kurzer Zeit das Interesse wieder verloren und bin zurück zu Midjourney.

Archetype: Seit wann arbeitest du mit Midjourney – und warum gerade dieses Tool? Setzt du KI Bildtools auch in deiner Social Media Arbeit für Kund*innen ein?

Samira Marke: Ich arbeite seit Ende Januar 2023 mit Midjourney und dass ich da gelandet bin, war purer Zufall. ChatGPT kam gerade auf und das habe ich zusammen mit den Teilnehmenden meines Social Media Kurses zusammen angeschaut. Irgendjemand fragte mich, ob es das nicht auch für Bilder gäbe und gute Dozentin die ich bin, habe ich das noch am selben Abend recherchiert. Als ich gesehen habe, was mit dem Tool alles möglich ist, war ich ziemlich von den Socken, weil es besonders for Social-Media-Manager wie mich, die mit sehr wenig Budget arbeiten, eine wirkliche Arbeitserleichterung ist. Ich kann ohne Probleme schnell festlegen, wie bestimmte Bilder aussehen sollen und immer bei CI treu bleiben und muss nicht ewig Stockbilder suchen. Für Unternehmen im Allgemeinen ist es halt die Möglichkeit, schnell und einfach kreative Visuals zu erstellen ohne viele Ressourcen zu brauchen.

Archetype: Was muss man bei KI Bildtools wie Midjourney beachten: Wer ist Urheber*in, du oder die KI? Und denkst du, dass in Zukunft eine Kennzeichnungspflicht für KI generierte oder veränderte Bilder sinnvoll wäre bzw. zu erwarten ist?

Samira Marke: Niemand ist wirklich Urheber und es gilt auch nicht das Urheberrecht, da das Ergebnis auf dem Zufallsprinzip beruht. Bedeutet im Umkehrschluss auch, dass ich selbst nicht das Urheberrecht an meinen Kreationen oder meinen Prompts habe. Natürlich wird es etwas komplizierter, wenn ich selbst noch Änderungen dran vorgenommen habe. Aber in der Regel habe ich kein Urherberrechtsanspruch. Was die Kennzeichnungspflicht angeht, denke ich, dass sie auf jeden Fall weiter diskutiert wird. Was letztendlich dabei rauskommen wird, kann ich zu diesem Zeitpunkt nicht einschätzen. Ich persönlich würde es begrüßen, damit die Personen zur Rechenschaft gezogen werden, die absichtlich falsche Informationen verbreiten.

Archetype: Wo siehst du aktuell die größten Probleme der KI Bildtools – und das größte Potential?

Samira Marke: Sie sind wirklich schwer zu bedienen und brauchen schon eine gewisse Expertise, wenn man konsistente Ergebnisse erzielen möchte. Hier und da mal eine Grafik ist einfach, aber ein wirklich verwertbares Ergebnis braucht Skills. Das größte Potenzial liegt darin, per Knopfdruck unglaubliche Fantasiewelten zu erstellen.

Archetype: Kann man dem vielfach diskutierten bias von KI Bildtools mit den richtigen prompts entgegenwirken?

Samira Marke: Man kann und sollte auf jeden Fall dem Bias entgegenwirken, indem man sehr spezifisch in seinen Prompts Alter, Geschlecht und Nationalität angibt. Natürlich braucht es aber auch eine Sensibilität, wann die KI ein vorurteilsbehaftetes Bild kreiert hat. Die KI gibt die Welt so wieder, wie wir sie sehen, schließlich hat sie durch unsere Daten gelernt und gibt sie in verstärkter Form wieder.

Archetype: Welche neue Funktion wünscht du dir, um deinen Arbeitsalltag zu erleichtern?

Samira Marke: Als Funktion würde ich mir wünschen, dass ich eine Art Markenkern irgendwo festlegen könnte, in dem Farben, Lichtverhältnisse, Personen etc. abgespeichert werden würden, sodass ich es nicht immer wieder neu eingeben müsste oder die Basis durch das Weiterentwickeln des Prompts wieder überschrieben wird.

Archetype: Und zu guter Letzt: Teilst du dein absolutes Midjourney-Fail mit uns?

Samira Marke: Von den Fails habe ich eine ganze Bibliothek. Aber das ist mein liebstes: Ich wollte ein Vintage-Photo von einem Schützenfest kreieren, nur um dann festzustellen, dass Midjourney nur eine sehr rudimentäre Ahnung davon hat, was Schützenfest sein könnte. Es scheint irgendwas in Deutschland zu sein und ein Volksfest. Und dann hat es sich etwas ausgedacht. Ich habe Tränen gelacht als ich die Ergebnisse gesehen habe, weil es ja doch irgendwie so aussieht als könnte das so irgendwo in Deutschland ein Volksfest sein.

KI Kunst kreiert mit Midjourney: Clowns in einer Parade, die ein deutsches "Volksfest" symbolisieren sollen
(C) Samira Marke – erstellt mit Midjourney
KI Kunst mit Midjourney erstellt: Personen mit Masken und Kreuz in einer Parade vor einer Kirche
(C) Samira Marke – erstellt mit Midjourney
KI Kunst mit Midjourney erstellt: Familienfoto in Retro Pastellfarben vor einem Holzpfahl mit Formen und Figuren aus Holz
(C) Samira Marke – erstellt mit Midjourney

 

Written by
Deniz Knopp
Junior Consultant
Written by
Michaela Harfst
Senior Consultant