Arbeitsprobe

.

10

.

2024

KI macht's möglich

KI hilft dabei, Bildideen zum Leben zu erwecken, die früher nie umsetzbar gewesen wären. Wie sich Bildgenerierung mit KI gut nutzen lässt, haben wir in der Titelstory der aktuellen „Wie is?“ ausprobiert.

von

Mirjam Sieger

Arbeitsprobe

24

.

10

.

2024

KI macht's möglich

KI hilft dabei, Bildideen zum Leben zu erwecken, die früher nie umsetzbar gewesen wären. Wie sich Bildgenerierung mit KI gut nutzen lässt, haben wir in der Titelstory der aktuellen „Wie is?“ ausprobiert.

von

Mirjam Sieger

Jedes Magazincover, jedes Content-Layout, jedes Aufmacherfoto beginnt mit der Bildidee im Kopf. Das Brainstorming ist frei, der Kreativität keine Grenzen gesetzt. Der Traum eines jeden Gestalters und einer jeden Gestalterin. Doch dann folgt der Realitätscheck: Lässt sich die Idee überhaupt umsetzen? Und wenn ja, reichen Budget und Ressourcen?

‍
Künstliche Intelligenz (KI) verspricht, diesen Check überflüssig zu machen. Für die Titelstory des Gesundheitsmagazins „Wie is?“ der Universitätsmedizin Essen haben wir unsere Bildideen mithilfe des KI-Programms Midjourney zum Leben erweckt. Wie wir dabei vorgegangen sind und worauf es ankam, erklären wir hier.

‍
Welche Bildidee soll die KI umsetzen?‍

Hysterie, Adipositas, Gaming-Sucht – wie entstehen neue Krankheiten und was sagen sie über eine Gesellschaft aus? Dieser Frage widmen wir uns in der aktuellen Ausgabe der „Wie is?“. Unter einer Krankheit versteht man dabei die Abweichung von Normen.

‍
Die antiken Römer und Griechen meißelten ihre Vorstellung vom normschönen und gesunden Menschen in Marmor. Noch heute stehen diese Statuen für ein Ideal des menschlichen Körpers. Was wäre, wenn wir moderne, neue Krankheiten an diesen Idealbildern darstellen könnten? Fertig war die Bildidee.

‍
Wie formuliert man den richtigen Basis-Prompt?‍

Auf Basis der Bildidee haben wir für jedes Bild unserer Serie einen sogenannten Prompt, ein KI-Briefing, formuliert. Wie ChatGPT basiert auch Midjourney auf einem Large Language Model und funktioniert daher wie ein Chatbot. In einem Textfeld fordert man die KI über den Befehl „/imagine“ auf, sich ein Bild vorzustellen.

‍
Den Prompt formuliert man dementsprechend am besten wie eine sehr detaillierte Bildbeschreibung des gewünschten Bildes. Die Vorstellung der KI bekommt man anschließend in einem Antwort-Post als Bilddatei angezeigt. Folgende Informationen enthielt unser Prompt:

‍
· Die Bildart (z.B. Fotografie, Illustration, 3D-Illustration)
· Die W-Fragen (Was? Wo? Wer? Wobei? Wann?)
· Ein Beispielfoto, das einen Stil vorgibt (lässt sich als URL/Bilddatei in den Prompt einfügen)

‍
Für ein Bild entstand daraus zum Beispiel folgender Basis-Prompt:

‍

*/imagine antique greek statue uniform yellow background child with gaming controller black*

‍

Wie bekommt man von der KI das Bild, was man wirklich haben will?

‍Mit einem Prompt war es aber nicht getan – und das ist auch die Regel. Für das gewünschte Ergebnis mussten wir den Prompt immer weiter verfeinern. Dazu haben wir den Basis-Prompt kopiert und an einzelnen Stellen umformuliert oder ergänzt, zum Beispiel mit weiteren Adjektiven.

‍

*/imagine antique greek white statue uniform yellow background child with gaming controller looking aggressive and angry*

‍

Um Details anzupassen, können in Midjourney schließlich einzelne Bereiche markiert und neu generiert werden, ohne dass das restliche Bild verändert wird. So lassen sich nach und nach Kleinigkeiten verändern, um das gewünschte Gesamtmotiv zu erhalten.

‍
Allerdings versteht die KI nicht immer, was man von ihr will, oder sie hat eine ganz andere Vorstellung als man selbst. Und auch Fehler schleichen sich noch schnell und häufig ein. Eine Statue hatte sechs Finger (mit Händen tut sich die KI wohl allgemein sehr schwer), eine andere hielt das Smartphone in ihren Händen falschherum. Um zum gewünschten Ergebnis zu kommen, muss man sich also in der Regel in vielen kleinen Schritten herantasten.

‍

Bildfehler: Gern vertut sich die KI bei der Anzahl der Finger.

‍

Welche Grenzen hat die Bildgenerierung mit KI? ‍

Aktuell ist KI also eher noch „Kolleg:in“ fürs Grobe. Mit Feinheiten tut Midjourney sich schwer. Daher brauchte es am Ende doch noch den Feinschliff bei Photoshop. Kontraste und Helligkeiten mussten wir zum Beispiel anpassen. Da wir am Ende zudem eine ganze Bilderserie im ähnlichen Stil haben wollten, bedurfte es noch ein paar manueller Handgriffe, um die Bilder stilistisch aneinander anzugleichen.

‍
Und schließlich stießen wir bei der Gestaltung doch noch an die ein oder andere Grenze. Zum einen waren es schlicht technische Grenzen. So ließ sich der KI bei einer Statue partout nicht vermitteln, dass die Augen offen und nicht geschlossen sein sollten.

‍

Detailarbeit: Die Augenpartie mussten wir bei Photoshop nachbearbeiten.

‍

Zum anderen waren es aber auch Grenzen, die die Entwickler:innen von Midjourney bewusst gesetzt hatten. Das Programm soll verhindern, dass es zur Darstellung diskriminierender, sexualisierter oder gewaltverherrlichender Inhalte genutzt wird. Eine gute Sache, nur sind die Grenzen dabei sehr eng gesetzt. Ein Bild einer antiken Statue mit Adipositas war für Midjourney schon tabu.

‍

Anti-Diskriminierungs-Policy: Das Bild einer adipösen Statue zu erstellen, verbietet Midjourney.

‍

Fazit: Worauf kommt es bei der Bildgenerierung mit KI an?

Am Ende waren wir mit den KI-generierten Bildern mehr als zufrieden. Das war das Ergebnis:

‍

‍

Drei Learnings haben wir zum Schluss nochmal zusammengefasst:

‍
· Präzise Prompten: Je detaillierter die Beschreibung, desto besser das Bild.
· Genau hinschauen: Die KI baut immer noch häufig Fehler ein.
· Geduldig sein: Gute KI-Bilder brauchen viele Prompts und daher auch viel Zeit.

Über die Autorin

Über den Autor

Geschrieben von

Geschrieben von Zimmermann Editorial

Mirjam Sieger

Kreative Grenzgängerin zwischen Kinderlachen, Hundeleine und Altbausanierung. Schöpferin unseres neuen Corporate Designs und stolze Besitzerin eines privaten Magazin-Archivs, das Liebhaberherzen höher schlagen lässt.

Ob Hunde, Pflanzen oder Urbanismus – Mirjam kennt zu jedem Thema das passende Nischenmedium. Als Sammlerin guter Magazine lässt sie sich von Indie-Neuheiten genauso inspirieren wie von Flohmarktfunden. Dabei entstehen dann auch schon mal neue Bildkonzepte und Grafikideen, die sie in ihre Arbeit bei BZ miteinfließen lässt.

‍

Alle Beiträge

KI macht's möglich

KI macht's möglich

AUS UNSEREM MAGAZIN

AUS UNSEREM
MAGAZIN