Wie früher Stockfotos, nur schlimmer? Reality-Check für KI-generierten Visual Content

7. November 2025 von Stephanie Kowalski

In dieser Kolumne macht Stephanie Kowalski den Reality-Check für KI-Bilder: Sie erklärt, warum so viele Bilder im Feed gleich aussehen und wie du das vermeiden kannst. Sie zeigt, warum Klarheit in Ziel und Botschaft wichtiger ist als schnelle Prompts und wie einfache Regeln dabei helfen, wiedererkennbare und starke Visuals zu erstellen.

(Illustration: © LustreArt, depositphotos.com)

Inhaltsverzeichnis

Zusammenfassung

Zuerst die Idee: Ein klares Ziel macht jedes Bild stärker. Ohne Botschaft wird KI nur zur Abkürzung ins Mittelmaß.
Warum alles gleich aussieht: Vorlagen, Standard-Einstellungen und Zeitdruck führen schnell zum Einheitslook.
Nicht alles, was schön ist, ist auch passend: Einzelbilder wirken, aber ohne durchgehenden Stil fehlt die Wiedererkennbarkeit.
Kleine Fehler können große Auswirkungen haben: Unstimmige Hände, falsche Details oder Stereotype können das Vertrauen kosten. Ein kurzer Check spart Ärger.
Profil statt Masse: Mit einfachen Regeln, wiederkehrenden Stilelementen und einer klaren Dokumentation wird aus einer schnellen Produktion ein klarer Markenauftritt.

Kennst du uns schon? Auf den Punkt gebracht: Wenn Content Marketing, dann UPLOAD Magazin! Das große deutsche Portal für alle Fragen rund um erfolgreiche Inhalte. Vieles kannst du vollkommen kostenlos lesen und jeden Montag kommt ein Artikel wie dieser hinzu. Bleib am Ball mit dem „Update am Montag“ …

KI-generierte Bilder: Wie Stockfotos nur im Erstellungs-Turbo

Stockfotos waren lange der Workaround, wenn Material oder Zeit knapp waren. KI ist die neue Abkürzung und noch direkter in deinem Prozess. Ein Prompt ersetzt die Suche in Bilddatenbanken. Das spart möglicherweise Zeit, ersetzt aber nicht die eigentliche Idee.

Wenn die Botschaft unklar bleibt, spuckt die KI Bilder aus, die „irgendwie passen”. Das ist zwar bequem, aber selten treffend.

Shutterstock bietet beispielsweise KI-generierte Stockfotos an.

Auffällig ist, wie stark Voreinstellungen den Look prägen. Viele Modelle starten mit ähnlichen Einstellungen bei Aspekten wie Licht, Brennweite oder Farbstimmung. Wer hier nicht bewusst anpasst, landet automatisch im Mainstream.

Hinzu kommen typische Probleme bei der Generierung:

Hände mit zu vielen oder zu wenigen Fingern.
Eine Typo in einem Text im Bildhintergrund, der erst auf den zweiten Blick auffällt.
Objekte oder Menschen, die minimal, aber eben sichtbar, über dem Boden schweben.

Solche Details werden im Entwurf schnell übersehen, sind in der Anwendung jedoch sichtbar und kosten Vertrauen.

Das eigentliche Versprechen der KI, gute und individuelle Bilder zu erstellen, erfüllt sich erst, wenn du sie strukturiert nutzt und die Reihenfolge änderst:

Erst klärst du Ziel und Aussage,
dann wählst du das Motiv,
erst dann formulierst du den Prompt.

Mit dieser Reihenfolge erreichst du Geschwindigkeit ohne Qualitätsverlust. Ohne den richtigen Ablauf beschleunigst du vor allem die Produktion langweiliger KI-Bilder.

Warum sieht unser Feed plötzlich gleich aus?

Sie sehen gerade einen Platzhalterinhalt von YouTube. Um auf den eigentlichen Inhalt zuzugreifen, klicken Sie auf die Schaltfläche unten. Bitte beachten Sie, dass dabei Daten an Drittanbieter weitergegeben werden.

Mehr Informationen

Inhalt entsperren Erforderlichen Service akzeptieren und Inhalte entsperren

Das Video „I fell into an AI slop rabbit hole” von tunnel_vision erklärt, warum wir so viele KI-Bilder in unseren Feeds sehen.

Mehrere Faktoren wirken zusammen:

Da ist zunächst das Prompt-Recycling: Vorlagen, die „bei anderen funktioniert haben”, werden kopiert, minimal angepasst und erneut genutzt. Gleiche Schlüsselwörter erzeugen ähnliche Kompositionen und schon sehen fünf Marken aus wie eine.
Hinzu kommt das durchschnittliche Training: Generative Modelle erzeugen, was sie statistisch gut gelernt haben, also das, was in ihren Trainingsdaten oft vorkommt. Wenn du keine Impulse in Form eigener Referenzen, klarer Stilvorgaben oder Negativ-Prompts setzt, verstärkt sich der Einheitslook. KI ist dann nicht Quelle für Neues, sondern Verstärker des Vorhandenen.
Plattform-Mechanismen setzen (falsche) Anreize: Algorithmen belohnen Muster, die sich bereits bewährt haben. Teams optimieren unter Zeitdruck auf „lief schon“, nicht auf „steht für uns“. Das spart zwar Abstimmung, dünnt aber das Profil aus.
Qualität leider unter Ressourcen-Knappheit: Deadlines sind eng, Budgets schrumpfen. Als Erstes fällt die Explorationsphase hinten runter, Styleguides sind oft zu grob oder existieren gar nicht für den KI-Einsatz. Was bleibt, ist Effizienz. Das meist in Form eines Mastermotivs, das in Serie gekachelt wird. Effizient, ja. Markant, selten. Und vor allem austauschbar.
Die Folgen sind absehbar: Die Aufmerksamkeit bricht eher ab, die Wiedererkennung sinkt und die Marke wirkt generisch. Das liegt nicht daran, dass KI „schlecht“ wäre, sondern daran, dass die Vorarbeit fehlt. Du brauchst Leitplanken, die den Tool-Defaults etwas entgegensetzen.

Lesenswertes zum Thema:

„AI Slop“ – Ruiniert KI die sozialen Medien? – KI Podcast
What is AI slop? – TheConversation

Was KI-Visuals heute können und wo sie scheitern

KI hat das Einzelbild im Griff. Mit einem starken Prompt erhältst du innerhalb weniger Minuten ein Motiv, für das früher ein Shooting, ein 3D-Setup oder langes Stöbern nötig war. Lichtstimmungen, Oberflächen, Perspektiven: Das funktioniert erstaunlich zuverlässig, solange es um ein einziges Bild geht.

Spätestens bei einer Bilderserie zeigt sich jedoch die Grenze: Figuren verändern Details von Bild zu Bild, Farben kippen leicht und Proportionen wandern. Für Kampagnen, Tutorials, Produktstrecken oder Social-Media-Serien brauchst du aber Wiederholbarkeit.

Hier wird der Unterschied von einem Qualitäts-Fokus (sieht gut aus) zu einer Konsistenz-Priorisierung (bleibt gleich gut) sichtbar.

Sie sehen gerade einen Platzhalterinhalt von YouTube. Um auf den eigentlichen Inhalt zuzugreifen, klicken Sie auf die Schaltfläche unten. Bitte beachten Sie, dass dabei Daten an Drittanbieter weitergegeben werden.

Mehr Informationen

Inhalt entsperren Erforderlichen Service akzeptieren und Inhalte entsperren

Im TED-Talk „How to Spot Fake AI Photos” erklärt Hany Farid, wie wir KI-Bilder besser erkennen können.

Qualität versus Konsistenz: beeindruckend, aber austauschbar

KI liefert Breite: viele Varianten, viele Stile. Was sie nicht automatisch liefert, ist Tiefe, also ein roter Faden, der sich durch Motivreihen zieht.

So wirkt ein Hoodie im nächsten Bild wie aus einem anderen Stoff, ein Produkt spiegelt plötzlich anders und ein Hautton springt. Das ist kein Drama, aber es macht die Serienarbeit zäh, wenn du erst im Layout merkst, dass Bild 3 nicht mehr zu Bild 1 passt.

Konsistenz bekommst du nicht durch noch mehr Varianten, sondern durch klare Leitplanken:

definierte Referenzen,
feste Stilbausteine,
wiederkehrende Kameraeinstellungen,
dokumentierte Seeds/Versionen
und Negativ-Anweisungen, die den Einheitslook bremsen.

Dann ergibt die Geschwindigkeit der KI plötzlich Sinn, weil du nicht jedes Mal bei null startest.

Typische Fallstricke: Logikfehler, Hände, Text, Stereotype

Viele Probleme sind zwar klein, aber dennoch sichtbar genug, um Vertrauen zu kosten. Logikfehler erkennst du beispielsweise an Schatten, die nicht zur Lichtquelle passen, an Gegenständen, die durch andere hindurchlaufen, oder an anatomischen Unstimmigkeiten.

Hände sind besser geworden, aber sie sind und bleiben der Klassiker: die Fingeranzahl, die Gelenke, die Interaktion mit Objekten.

Text im Bild sieht oft wie eine Fremdsprache aus: Die einzelnen Buchstaben stimmen, aber zusammen ergeben sie Unsinn. Für Thumbnails oder Plakate ist das eine klare Schwäche.

Stereotype schleichen sich ein, wenn du unpräzise bist. Der Begriff „Business person“ liefert dir in vielen Fällen die immer gleichen Rollenbilder. Wenn du Diversität willst, musst du sie adressieren: Nenne Altersspanne, Körperformen, Hilfsmittel und Kleidung abseits der Klischees.

Tipp: Wenn der Prompt offen bleibt, mischen viele Modelle Epochen und Orte. Das sieht zwar hübsch aus, wirkt aber schnell unplausibel, etwa bei Technik-, Medizin- oder politischen Themen, die Genauigkeit erfordern.

Ein Kurzcheck vor dem Abspeichern ist empfehlenswert:

Stimmt die Physik?
Passen Hände, Ohren und Übergänge?
Ist der Text lesbar oder sollte er besser ganz entfernt werden?
Sind die abgebildeten Personen und Situationen frei von Klischees, die deiner Botschaft schaden könnten?

Je früher du diese Fragen stellst, desto weniger Korrekturen sind in der Postproduktion nötig.

Lizenzen, Persönlichkeits- und Markenrechte im Kurzüberblick

Eines der bekanntesten KI-Bild-Fakes: Der verstorbene Papst Franziskus in einer Daunenjacke. (Quelle: X)

Diese restlichen KI-Grundlagen solltest du kennen und bei deiner Arbeit berücksichtigen (Achtung: Ersetzt keine vollumfängliche Rechtsberatung!):

Lizenzen: Lies die Nutzungsbedingungen des Tools, das du verwendest. Darfst du es kommerziell nutzen? Gibt es Einschränkungen je nach Output-Typ? Brauchst du einen Pro-Plan für Werbung oder große Reichweite? Dokumentiere Prompt, Datum und Tool/Version, um nachweisen zu können, was du erzeugt hast.
Beachte die Persönlichkeitsrechte: Vermeide „Lookalikes“ realer Personen, wenn du keine Einwilligung hast. Auch bei generischen Gesichtern gilt: Keine herabwürdigenden Kontexte, keine sensiblen Zuschreibungen. Wenn du reale Menschen kombinierst (z. B. Compositing), brauchst du entsprechende Einverständniserklärungen.
Marken und Designs: Logos, geschützte Formen und charakteristische Produkte. Lass besser die Finger davon, wenn du sie nicht nutzen darfst. Auch „veränderte“ Markenzeichen sind heikel. Erkennbares Interieur (Museen, Messen) kann Nutzungsregeln unterliegen, die du respektieren solltest.
Transparenz: Eine Kennzeichnung ist kein Selbstzweck. Nutze sie, wenn die Einordnung wichtig ist, zum Beispiel bei redaktionellen Themen oder erklärenden Produktbildern. In der Praxis reicht oft ein knapper Hinweis im Alt-Text, in der Bildunterschrift oder im Begleittext. Wenn du Herkunftsdaten (z. B. Content Credentials) mit speichern kannst, solltest du das tun, denn das macht spätere Klärungen einfacher.

Lesenswertes zum Thema:

AI Image Generation – The Good, The Bad, The Ugly – Let’s Talk Social
Nano Banana: Nie wieder wissen, was echt und was künstlich ist – Der Standard
AI in Photography – Professional Phot

KI-Bilder: So vermeidest du Einheitsbrei

Du bemerkst den einheitlichen Look nicht sofort auf einem Bild, sondern erst, wenn nach zehn Posts alles verschwimmt. Die Ursache ist selten böser Wille. Es ist eine Mischung aus Vorlagen, durchschnittlichem Training und knappen Zeitvorgaben. Das Ergebnis: „Funktioniert schon“ verdrängt „Steht für uns“.

Prompt-Vorlagen, Model-Bias und der Einheitsbrei

Bias ist bei KI immer ein kritischer Faktor. Offene Rollen („Businessperson“, „Leader“, „Engineer“) kippen schnell in Klischees. Auch Orte und Epochen werden glattgezogen: Eine „European city street“ ohne weitere Angaben ergibt eine austauschbare Kulisse, die überall und nirgends sein könnte. Das ist praktisch, wenn es nur um Stimmung geht. Für Markenarbeit ist es jedoch nicht ausreichend.

Ein eigener Stil entsteht nicht durch mehr Adjektive im Prompt, sondern durch wiederholbare Entscheidungen: Dazu gehören beispielsweise die Farbwelt, die Körnung, die Kamerahöhe, die Tiefenschärfe, die Kontraste und die Typo-Logik im Compositing. Sobald diese Konstanten fehlen, übernimmt das Modell mit seinen Standards und Biases.

Du kannst das bewusst regulieren, ohne die Produktion zu verlangsamen:

Formuliere zuerst, was nicht passieren soll (z. B. „keine Pastellgradienten, keine isometrische Darstellung, kein Rim-Light, keine glänzenden Reflexionen“).
Fixiere zwei bis drei Stilanker (z. B. matte Oberflächen, leichte Unschärfe im Hintergrund, neutraler Weißpunkt.
Arbeite mit Seeds/Versionen, damit Figuren, Texturen und Licht wiederholbar bleiben.

So verlagerst du die Kreativität von „neuer Look pro Bild“ zu „klarer Look über viele Bilder“.

Der ChatGPT-Ghibli-Trend sorgte für viel Einheitsbrei in unseren Feeds. (Quelle: X)

Warum „gut genug“ im Feed untergeht

Das Motiv passt zur Aussage und die Bildqualität stimmt. Es gibt nichts, was stören würde. Im isolierten Check ist das in Ordnung. Im Feed jedoch nicht. Die Konkurrenzsituation ist simpel: Nutzer*innen scannen schnell, vergleichen unbewusst und bleiben an dem hängen, was anders und klar ist. „Gut genug“ bietet beides selten.

Das Bild erklärt etwas, aber es erzählt nicht deine Geschichte. Nach zwei oder drei Posts ist die Wiedererkennung dahin und du verlierst die Aufmerksamkeit der Nutzer*innen. Nicht, weil das Bild schlecht wäre, sondern weil es austauschbar ist.

Auch Metriken verstärken dieses Verhalten. Wenn ein visuelles Rezept einmal funktioniert hat, wird es wieder eingesetzt. Das ist kurzfristig stabil, langfristig ermüdet die Serie jedoch. Die Klicks werden unberechenbarer, die Saves gehen zurück und die Kommentare werden generischer.

Das ist kein Drama, aber ein Signal: Der Feed hat das Muster erkannt und bewertet es als „schon gesehen“. Hier hilft keine zusätzliche Variante, sondern ein kleiner, bewusster Bruch innerhalb deines Rahmens: ein veränderter Bildausschnitt, ein markantes Detailobjekt oder ein wiederkehrendes Format-Element, zum Beispiel eine feine Körnung, eine spezifische Schattenkante oder konsistenter Weißraum.

Wichtig ist, dass der Bruch kontrolliert passiert und das als Teil deines Systems, nicht als Ausflug in den Zufall.

Wenn du ganz pragmatisch vorgehst, prüfst du vor der Produktion drei Dinge:

Ob die visuelle Idee ohne Logo noch als „dein Werk“ erkennbar bleibt.
Ob sie sich in Serie umsetzen lässt, ohne dass die Idee zerfasert.
Ob der Prompt wirklich deinem Vokabular entspricht oder nur geliehene Schlagworte enthält.

Sobald diese Fragen sauber beantwortet sind, verliert der Generic-Content-Effekt seinen Biss. Du nutzt KI dann zügig und behältst dennoch dein Profil.

Lesenswertes zum Thema:

AI is homogenizing our thoughts – The New Yorker
5 Pitfalls of AI-Generated Content: How To Use AI Effectively – Omniscient
AI from AI: a Future of Generic and Biased Online Content? – UCLA Anderson Review

Differenzierung statt Deko: Visuals mit Haltung

Wir haben über den Einheitslook gesprochen. Jetzt drehen wir das um. Wie bekommst du Bilder, die deine Position klarmachen? Nicht als Deko, sondern als Teil eurer Aussage? Haltung zeigt sich nicht in großen Worten, sondern in wiederholbaren Entscheidungen. Genau darum geht es hier.

Instagram Account von Samira Marke. Ihre Herangehensweise zeigt, dass es auch gute und individuelle KI-Bilder gibt. (Quelle: Instagram)

Marken-DNA sichtbar machen: Styleguides für KI

Ein Styleguide für KI funktioniert wie ein normaler Styleguide, nur dass er näher an der Produktion und dem Prompt ist. Du übersetzt eure Markenwerte in anwendbare Bildregeln:

Beginne mit wenigen Konstanten, die sich durch alle Motive ziehen. Dazu gehören beispielsweise das Farbklima, die Lichtlogik, die typische Perspektive, die Körnung/Materialität und die Kompositionsregeln (z. B. viel Negativraum links, ruhiger Hintergrund, klare Struktur im Vordergrund).
Schreibe diese Konstanten als kurze Sätze und nicht als Liste von Adjektiven. „Matte Oberflächen, weiches Seitenlicht, Kamerahöhe auf Brust, ruhige Tiefe“ lässt sich reproduzieren, „modern, innovativ, menschlich“ hingegen nicht.
Übertrage die Regeln in Prompt-Bausteine. Lege für jede Konstante eine Formulierung und ihr Gegenstück als Negativ fest, zum Beispiel: „soft side light“ und „no rim light“ oder „matte surface“ und „no glossy reflections“.
Halte außerdem Seeds, Seitenverhältnisse, Modellversionen und Upscale-Einstellungen fest. Das ist zwar langweilig, sorgt aber dafür, dass Bild 5 noch zu Bild 1 passt.
Dokumentiere Beispiele. Nicht nur „so soll es aussehen“, sondern auch „so nicht“. Jeweils mit einer kurzen Begründung. Zwei bis drei Vergleichspaare reichen aus, sofern sie gut gewählt sind. Ergänze technische Mindeststandards (Farbprofil, Auflösung, Exportoptionen) und schreibe dazu, wann und warum du davon abweichst. Dann weiß das Team, was fix ist und wo Experimente erlaubt sind.

Wichtig: Der Styleguide ist kein PDF für die Ablage, sondern ein lebendiges Dokument. Baue eine schlanke Routine ein: einmal im Monat 30 Minuten für Updates inklusive zwei neuer Positiv-/Negativbeispiele und einen Blick auf „Fehler, die uns zuletzt passiert sind“. Aus diesen Fehlern werden Regeln. So wächst die Richtlinie mit der Praxis, nicht nebenher.

„Make versus Take“: Wann selbst erzeugen, wann einkaufen

Nicht jedes Bild muss neu entstehen. Entscheidend sind die Kontrolle, die du benötigst, und die Verwendung des Visuals.

Für abstrakte Metaphern, visuelle Systeme, Keyvisuals und alles, was euren Stil prägt, lohnt sich „Make“: Du erhältst Wiederholbarkeit, kannst Motive als Serie planen und baust ein Archiv auf, auf das du in Kampagnen zurückgreifen kannst. Auch bei sensiblen Themen wie Produktneuheiten oder unveröffentlichten Features ist „Make“ meist der sichere Weg.

„Take“, also Stock-Material oder bestehende Assets, hat Vorteile, wenn Realitätsnähe, Tempo oder Beleg-Charakter zählen, zum Beispiel bei realen Orten, dokumentarischen Situationen oder Menschen in authentischen Umgebungen. Hier verbringst du oft weniger Zeit, wenn du sauber kuratierst und das Material in euren Look überführst (Farbangleichung, Körnung, konsistente Typografie).

Verwende „Take“ auch für Nebenschauplätze: Headerbilder für interne Seiten, Newsletter-Teaser oder Platzhalter im Prototyp.

Wichtig ist die Anschlussfähigkeit: Wie gut lässt sich das Asset in euer System integrieren, ohne dass die Herkunft erkennbar ist?

Eigene Referenzen, Moodboards, Stilbibliotheken

Du kannst auch lizenzierte Elemente (z. B. Hand, Gerät, Textur) mit KI-generierten oder 3D-Inhalten kombinieren, um Kontrolle und Glaubwürdigkeit zu vereinen.

Achte darauf, dass die heiklen Teile aus sicherer Quelle stammen (z. B. reale Displays, echte Produktdetails), während die KI für die Umgebung, das Licht und die Metaphern zuständig ist. So hältst du Risiko und Aufwand im Rahmen.

Rechne nicht nur das Budget, sondern auch die Folgekosten

Wie oft brauchst du Varianten?
Wie lange muss das Visual halten?
Wie hoch ist das Risiko für Nachbesserungen (z. B. wenn eine Region andere Anforderungen hat)?

„Günstig heute” kann schnell teuer werden, wenn du in drei Wochen doch alles neu erstellen musst.

So legst du deine eigene Stilbibliothek an

Damit der Stil nicht nur in den Köpfen bleibt, legst du eine Stilbibliothek an. Das klingt vielleicht nicht so spannend, ist aber eine gute Idee: ein klar strukturierter Ordner oder oder ein anderes System mit drei Ebenen:

Referenzen: Bilder, die Aspekte eures Looks zeigen, beispielsweise Licht, Farbe, Komposition oder Material. Idealerweise stammt vieles aus eigener Produktion oder ist klar lizenziert. Externe Beispiele müssen mit Quelle und einer kurzen Notiz, warum sie hier stehen, versehen werden („Shadow edge als Stilanker“, „Ton-in-Ton bei Haut und Stoff“).
Beispielfälle: Fertige Motive aus euren Projekten, jeweils mit Prompt-Notizen, Seed/Version und Export-Parametern. Das ist euer Startpunkt für Konsistenz.
No-Gos: Hierzu gehören beispielsweise Motive, die formal „okay“ sind, aber eure Haltung nicht abbilden. Schreibt dazu jeweils einen Satz, was genau nicht zur Haltung und Marke passt (z. B. „zu viel Gloss, wirkt techy statt ruhig“).

Moodboards sind kein Sammelbecken. Kuratiere sie wie einen Pitch: maximal neun Kacheln, von denen jede eine bestimmte Aufgabe hat. Eine Kachel darf die Kategorien „Textur“, „Licht“ oder „Komposition“ repräsentieren. Hänge Prompt-Schnipsel statt Schlagworte dazu: „soft side light, matte surface, neutral white“ ist brauchbar, „modern & clean“ hingegen nicht.

Wenn du mit Teams arbeitest, ergänze am Rand eine Mini-Checkliste: Was ist fix, was ist variabel, was ist verboten? Das hilft, die Linie zu halten, ohne die Kreativität zu ersticken.

Pflege außerdem eine kleine Liste mit Begriffen: Liste Wörter auf, die in eurem Kontext funktionieren (und solche, die euch in einen Einheitslook treiben).

Beispiel:

„dusty colours” statt „pastel gradient”,
„low contrast background” statt „bokeh city lights”.

Dieses Wörterbuch beschleunigt die Produktion und führt Prompts weg von Allgemeinplätzen.

Zum Schluss noch das Rechte-Einmaleins für die Bibliothek: Quellen sauber notieren, Lizenz-Rahmen festhalten und sensible Elemente kennzeichnen. Wenn du KI-Ergebnisse aufnimmst, speichere den Prompt, das Datum, das Tool/die Version und den Seed. Nicht aus Formalismus, sondern damit du später Varianten rekonstruieren kannst, ohne wieder bei Null zu starten.

Lesenswertes zum Thema:

Die neue Rolle des Fotografen – Bilder aus Strom
Ethische KI-Bilder? Warum KI-Bilder problematisch sind – Clara Vath
Ethik-Label für KI – Universität Stuttgart

Workflow: Von Briefing zu KI-Bild

Jetzt geht es darum, das zuverlässig in Bilder umzusetzen: ohne Zettelschlacht und ohne Tool-Overkill. Der folgende Ablauf ist bewusst knapp gehalten, damit du ihn täglich nutzen kannst. Er beginnt nicht beim Prompt, sondern bei der Aussage. Alles andere folgt daraus.

Ziel und Botschaft sind wichtiger als Motivwahl

Bevor du das erste Motiv skizzierst, schreibe in zwei Sätzen auf, was die Grafik leisten soll und für wen sie gedacht ist. „Pilot-Feature erklärt, Vertrauen schaffen, LinkedIn-Feed, Mobile First“ ist beispielsweise konkreter als „Feature-Visual“. Aus diesen Sätzen leitest du drei Dinge ab: den Kernbegriff (z. B. „Einführung” vs. „Vergleich”), die gewünschte Stimmung (ruhig, sachlich, nahbar) und den Handlungsimpuls (lesen, klicken, speichern). Erst dann suchst du Motive. Wenn du umgekehrt startest, entscheidet das Bild über die Botschaft und nicht du.

Eine kleine Probe kann hilfreich sein: Lies deinen Zweizeiler jemandem vor und frage, welches Motiv diese Person erwarten würde. Wenn die Antwort stark von deiner Idee abweicht, ist dein Briefing zu vage. Nachschärfen, dann erst generieren.

Prompting mit System (Kontext, Constraints, Negatives)

Ein Prompt ist keine Wunschliste, sondern eine Anweisung. Struktur hilft dir, wiederholbar zu werden. Ich arbeite mit vier Blöcken:

Kontext: Ziel, Zielgruppe, Tonalität, Einsatzort. Kurz und im Präsens.
Motivkern: Was ist im Bild zu sehen? Welche Relation? Welche Aktion?
Stilanker: Eure Konstanten (Licht, Oberfläche, Perspektive, Farbklima).
Constraints/Negatives: Was auf keinen Fall passieren darf (Einheitslook-Bremsen, verbotene Elemente, unpassende Epochen/Orte).

Ausgeschrieben klingt das so:

„Erklärt das neue Dashboard-Feature für das Produktteam, sachlich und vertrauenswürdig, für LinkedIn Mobile. Nahaufnahme der Hände am Laptop, Fokus auf die Klarheit der Charts, ruhiger Hintergrund. Matte Oberflächen, weiches Seitenlicht, Kamerahöhe Brust, neutraler Weißpunkt. Kein Bokeh-Stadtlicht, keine Pastell-Verläufe, keine Glasreflexe, keine isometrischen Render.“

Wichtig sind wiederholbare Parameter:

Seed/Randomness, Seitenverhältnis,
Modell-/Checkpoint-Version,
Auflösung/Upscale.

Notiere sie im Prompt oder in deinem Asset-Namen. So wird aus Glück Konsistenz.

Varianten, Auswahl und A/B-Tests

Du brauchst Varianten, aber nicht zehn auf einmal. Erstelle zunächst vier Varianten, die sich in Komposition, Distanz und Blickrichtung deutlich unterscheiden. Wähle anschließend eine Richtung aus und verfeinere sie mit kleinen Schritten: Blick leicht heben, Kontrast minimal anziehen, Schattenkante definieren. So vermeidest du die „Kartenhaus“-Auswahl, bei der alles ähnlich wirkt und niemand weiß, warum Bild B besser ist als Bild A.

Für A/B-Tests genügen kleine Unterschiede, die deine Hypothese abbilden: mehr Negativraum vs. dichter Schnitt, ruhige Fläche vs. Detail im Vordergrund oder warme vs. neutrale Lichttemperatur. Teste dort, wo du verlässliche Zahlen erhältst (Website-Banner, Newsletter-Header oder ein organischer Post mit ähnlicher Reichweite).

Dokumentiere je Test eine Erkenntnis. Ein Satz reicht: „Mehr Negativraum steigert die CTR um X % im Mobile-Feed.“ Diese Sätze fließen in den Styleguide zurück.

Postproduktion, Compositing & Versionierung

KI liefert das Rohmaterial. Den Markeneindruck erzeugst du in der Nachbearbeitung. Halte dabei eine kurze Kette ein: Grundkorrektur (Weißpunkt, Kontrast), Stilangleich (Körnung, minimale Farbverschiebung zu eurer Palette), Kantenpflege (Schatten weicher/härter, je nach eurer Logik) und Typo-Anschluss (falls Text ins Bild kommt: Platz, optische Achsen, Lesbarkeit).

Beim Compositing achtest du auf drei Dinge:

eine einheitliche Lichtquelle,
eine gemeinsame Schärfentiefe
und konsistente Spiegelungen.

Wenn eines davon kippt, wirkt das Bild künstlich, selbst wenn alles „realistisch” gerendert ist.

Versionierung ist dein Sicherheitsnetz. Nutze eine eindeutige Benennung wie „projekt_motiv_kurzname_2025-09-01_v03_seed1234_1080x1350”. Packe Prompt, Seed und Tool/Version in die Metadaten oder in eine kleine Readme im Asset-Ordner. Für Teams genügt ein simples Kanban: Entwurf → Auswahl → Final → Veröffentlicht.

Alles, was publiziert wurde, bleibt unangetastet, und Änderungen erzeugen eine neue Version. So kannst du später nachvollziehen, was gut lief und warum.

Barrierefreiheit mitdenken: Alt-Texte und Kontraste

Barrierefreiheit sollte nicht erst am Ende, sondern bereits im Briefing berücksichtigt werden. Plane Motive so, dass sie auch ohne Text funktionieren. Wenn Text nötig ist, halte die Flächen ruhig und die Kontraste klar.

Orientiere dich an gängigen AA-Werten, ohne dich in Normtabellen zu verlieren. Alt-Texte beschreiben den Zweck statt die Pixel: „Visual erklärt X anhand Y, Fokus auf Z“ ist hilfreicher als „Ein Bild zeigt …“. Lass Füllwörter weg und beschreibe relevante Details („linksbündiger Chart, dunkler Hintergrund, helle Balken, Status ‚Beta‘“).

Bei Kultur-Cues geht es um Plausibilität und Respekt. Gesten, Farben und Symbole können je nach Region eine andere Bedeutung haben. Wenn du international publizierst, vermeide Insider-Referenzen oder mache sie erklärbar. Uniformen, Behördenzeichen und religiöse Symbole sollten nur mit Grund und Kontext verwendet werden.

Und denke an die Sprache im Motiv: Zahlen- und Datumsformate, die Links-zu-Rechts-Logik und Dezimaltrennzeichen sind kleine Dinge, die das Vertrauen stärken.

Lesenswertes zum Thema:

The 4 Stages of AI Image Generation: An Experience Map – Nielsen Norman Group
KI-Bilder erstellen: Prompts und Tools für jedes Budget – Wortliga
Understanding AI Image Generation: Models, Tools, and Techniques – DigitalOcean

Auffallen in der Flut: Formate & Tricks, die wirken

Nach dem Qualitätscheck kommt die Frage: Wie bringst du deine Visuals so in den Feed, dass sie nicht nach einer Stunde vergessen sind? Nicht mit „lauter“, sondern mit Struktur. Formate helfen dir, Wiedererkennbarkeit mit Abwechslung zu verbinden und sie entlasten das Team, weil Entscheidungen schon getroffen sind.

Serien und wiedererkennbare Motive

Serien sind dein Fundament. Ein wiederkehrendes Motiv, eine feste Perspektive und ein klarer Bildausschnitt helfen dem Publikum, dich ohne Logo zu erkennen. Denk das wie eine Miniserie mit Episoden: gleiches Set, neue Handlung.

Du wählst zwei bis drei Stilanker aus, die immer gleich bleiben (zum Beispiel Licht, Körnung oder Kamerahöhe), und lässt den Rest variieren (zum Beispiel Objekte, Gesten oder Detailgrad). So entsteht ein roter Faden, der nicht langweilt.

Plane Serien nicht „pro Bild“, sondern in Blöcken. Ein Themenbogen über vier bis sechs Motive reicht aus, um einen Anfang, eine Mitte und einen Abschluss zu schaffen. Lege zu Beginn fest, welche Informationen in welcher „Episode” enthalten sind.

So verhinderst du, dass Bild drei plötzlich eine andere Sprache spricht. Wenn du unsicher bist, lege dir ein Raster an: erster Slot Hook, zweiter Slot Erklärung, dritter Slot Anwendung, vierter Slot Transfer. Das ist unspektakulär, aber im Alltag Gold wert.

Behind the Scenes (BTS) und Prompt-Transparenz als Vertrauensbonus

Menschen reagieren gut auf Einblicke in Prozesse, solange diese für sie von Nutzen sind. Zeige nicht „wir haben geklickt“, sondern erkläre, warum du dich für eine Variante entschieden hast.

Ein Vorher/Nachher mit einer kurzen Begründung („mehr Negativraum, klarere Hierarchie“) wirkt oft stärker als das finale Bild allein. Prompt-Transparenz funktioniert in Maßen: Zeige einen Ausschnitt mit den Stilankern und die Negatives, die den Einheitslook bremsen. So schaffst du Vertrauen, ohne deine ganze Bibliothek offenzulegen.

Hinter den Kulissen eignen sich drei Formate: ein stilles GIF/Video mit wenigen Frames („Entwurf → Korrektur → Final“), eine Split-View-Grafik mit markierten Änderungen und ein kurzer Thread, der Schritt für Schritt erklärt.

Wenn du diese Fragen beantwortest, ist „BTS“ keine Selbstbespiegelung, sondern ein Service.

Mikro-Narrative: Carousel, Sequenzen, Short-Loop-Video

Die meisten Plattformen belohnen kurze Geschichten. Baue sie knapp und klar. Ein Carousel funktioniert wie eine Mini-Präsentation: Die erste Folie dient als Hook und stellt die Kernfrage, die nächsten zwei bis drei Folien erklären den Inhalt und auf der letzten Folie folgt die Anwendung oder das Fazit.

Jede Folie muss für sich allein lesbar sein. Wiederhole leise die Stilanker, damit der Fluss erhalten bleibt. Sequenzen im Einzelbild erreichst du über wiederkehrende Elemente, die sich minimal verändern, zum Beispiel eine Handbewegung, ein wachsendes Detail oder eine sich schließende Linie. Das Auge folgt ihnen, ohne dass du viel Text brauchst.

Short-Loop-Videos wirken, wenn sie unauffällig endlos laufen. Denke in zwei Sekunden: Eine Bewegung, die logisch wieder am Startpunkt endet (Schwenk, Aufblende, kleiner Parallax-Effekt).

Es ist kein Schnitt-Feuerwerk nötig und auch kein Ton. Wenn Text im Loop vorkommt, plane die Lesedauer ein: Ein Satz, der in Ruhe gelesen werden kann, reicht aus. Loops sind keine „Bonusinhalte“, sondern eine andere Verpackung derselben Aussage. Sie greifen, wenn statische Motive in der Umgebung untergehen.

Transparenz ganz ohne erhobenen Zeigefinger

Wir haben Formate entwickelt und die Qualität gesichert. Die Frage ist: Wie gehst du offen mit KI um, ohne den Zeigefinger zu heben oder die Story zu bremsen? Transparenz ist Teil deines Handwerks: kurz, sachlich und an den richtigen Stellen. Es geht nicht um Bekenntnisse, sondern um Einordnung.

Wie und wann kennzeichnen?

Es lohnt sich immer dann, etwas zu kennzeichnen, wenn Leser aus dem Bild mehr ableiten könnten, als tatsächlich „echt“ ist. Also überall dort, wo ein dokumentarischer Eindruck entsteht. Ein abstraktes Pattern-Visual benötigt in der Regel keinen Hinweis. Ein fotorealistisches „Vor-Ort“-Motiv, ein vermeintliches Produktfoto oder eine Szene mit Menschen hingegen schon.

Die Kennzeichnung sollte in die Bildunterschrift oder den Begleittext aufgenommen werden, nicht als Störer ins Motiv. Ein knapper, neutraler Satz reicht: „Bild mithilfe von KI erzeugt“, „Foto mit KI-Elementen komponiert“ oder „Mockup, Darstellung symbolisch“. In Videos reicht eine kurz eingeblendete Grafik zu Beginn oder am Ende, es muss aber keine dauerhafte Einblendung sein.

Konsistenz ist hierbei hilfreich. Definiere zwei bis drei Formulierungen und nutze sie überall gleich. Ergänze, wenn verfügbar, die Herkunftsdaten im Asset selbst (z. B. Content-Credentials/C2PA). Diese Daten liest zwar kaum jemand aktiv, sie schaffen aber Nachvollziehbarkeit für spätere Fragen. In Social-Posts eignet sich der Alt-Text als diskreter Ort für den Hinweis, denn dort gehört ohnehin die Funktionsbeschreibung des Bildes hin.

Wichtig ist die Reihenfolge: erst der Nutzen, dann die Herkunft. Der Hinweis ersetzt nicht die Bildaussage.

Fairness gegenüber Kreativen & Trainingsdaten

Sie beginnt damit, wie du beschreibst, was du willst. Anstatt Namen lebender Künstler*innen oder Fotograf*innen zu kopieren, brichst du deren Stil in Eigenschaften herunter: Lichtführung, Materialität, Rhythmus, Farbklima, Komposition. Das ist präziser und respektvoller.

Wenn du mit realen Arbeiten als Referenz arbeitest, notiere die Quelle und begründe, warum sie als Beispiel dient („Schattenkante“, „Ton-in-Ton“, „Blickhöhe“), anstatt zu sagen: „Wir wollen das exakt so.“ Das schützt vor ungewollter Nähe.

Bei vorhandenen Assets gilt: Lizenz klären, auch intern. Stockfotos, eigene Fotos, Zukäufe: alles, was in ein Compositing wandert, braucht einen sauberen Status. Für Teams ist eine knappe Dokumentation im Asset-Ordner hilfreich: Quelle, Lizenz, Einschränkungen, Kontakt. Das klingt trocken, spart dir aber später Diskussionen. Und noch ein Punkt, der oft vergessen wird: Wenn ihr mit freien Ressourcen arbeitet (Schriften, 3D-Modelle, Texturen), haltet die Lizenzbedingungen parat und plant Alternativen für den Fall, dass etwas wegfällt oder sich die Nutzungsbedingungen ändern. Fairness ist hier auch Risikomanagement.

Transparenz bedeutet nicht, jede Prompt-Zeile zu veröffentlichen. Teile stattdessen aussagekräftige Ausschnitte, wie Stilanker, Negatives, besondere Entscheidungen, und zeige, was andere daraus lernen können. Das ist hilfreicher als ein kompletter „Rezept-Drop“ und respektiert gleichzeitig die Arbeit anderer.

Adobe kommuniziert klar, welche Quellen für die Trainingsdaten von Adobe Firefly genutzt wurden. (Quelle: helpx.adobe.com)

Grenzen ziehen: Deepfakes, Irreführung, Sensibles

Es gibt rote Linien, die nichts mit „Technikfeindlichkeit“ zu tun haben. Fotorealistische Darstellungen realer Menschen ohne deren Einwilligung sind heikel, insbesondere in sensiblen Kontexten wie Gesundheit, Politik, Kriminalität oder Sexualität.

Gleiches gilt für vermeintliche „Beweisfotos“ von Ereignissen, die so nicht stattgefunden haben. Wenn du eine Person oder ein Produkt glaubwürdig darstellen möchtest, solltest du mit echten Quellen arbeiten (Release, Screenshot, Foto) und KI nur dort einsetzen, wo sie keine Fakten behauptet.

Wo Verwechselungsgefahr besteht, hilft Gestaltung: eine leichte stilistische Brechung statt 1:1-Fotorealismus und ein klarer Symbolcharakter statt einer Pseudo-Reportage. Wenn Kinder, marginalisierte Gruppen oder sensible Orte im Spiel sind, stelle dir die einfache Frage: „Braucht es dieses Bild, um die Aussage zu tragen?” Wenn nicht, lass es. Wenn ja, schaffe Kontext im Text und verzichte auf Effekte, die Nähe simulieren, wo keine ist.

Ein praktischer Stop-Test vor der Veröffentlichung:

Würde ich mich über dieses Bild ärgern, wenn ich die betroffene Person wäre?
Würde ich mich getäuscht fühlen, wenn ich den Kontext nicht kenne?
Könnte das Motiv in einem anderen Umfeld missverständlich wirken (z. B. als Thumbnail ohne Begleittext)?

Wenn eine dieser Fragen mit „wahrscheinlich” beantwortet wird, suche eine alternative Darstellung oder kennzeichne deutlicher.

Lesenswertes zum Thema:

Leitfaden zur Kennzeichnung von KI-generierten Texten und Bildern – Mittelstand-Digital Berlin Zentrum
Möglichkeiten der KI-Kennzeichnung – Uni Graz

Toolkasten & Taktiken

Jetzt richten wir die Werkbank so ein, dass du schnell arbeitest, nichts suchst und später nachvollziehen kannst, wie ein Bild entstanden ist. Vier Bausteine reichen für den Alltag.

Asset-Management und Dateibenennung

Hier ist Ordnung kein Selbstzweck, sondern dient der Zeitersparnis:

Leg eine schlanke Struktur an, die jedes Projekt gleich nutzt: 01_Briefing, 02_Working, 03_Final, 04_Published, 90_Archive. In „02_working” liegen Rohdaten, Entwürfe und Compositings, in „03_final” nur freigegebene Motive, die sauber exportiert wurden, und in „04_published” genau das, was live ist, unverändert. Die Dateinamen tragen die wichtigsten Informationen, sodass du ohne Öffnen weißt, womit du es zu tun hast. Bewährt hat sich ein Muster wie projekt_motiv_channel_2025-09-01_v03_seed1234_1080x1350_sRGB.jpg.
Wenn Rechte eine Rolle spielen, ergänze einen kurzen Code: E für redaktionell, C für kommerziell und R für regional eingeschränkt, z. B. _C-RDE. Für Compositings hilft ein Sidecar (Markdown oder TXT) mit drei Zeilen: Quelle/Lizenz, kurzer Bearbeitungsweg, Verantwortliche*r. Das ist keine Bürokratie: So findest du später schneller, was du brauchst, und kannst Varianten reproduzieren.
Nutze Metadaten: IPTC-Felder für Copyright, Kontakt, Alt-Text und XMP für Notizen. Viele Tools übernehmen diese Angaben beim Export. Wenn ein Kanal sie streicht, bleibt deine interne Version trotzdem vollständig.

Prompt-Notizen: Seeds, Versionen, Learnings

Ein Prompt-Notebook ist wie ein Gedächtnis. Es kann sich dabei um eine einfache Markdown-Datei, ein Notion-Board oder eine Tabelle handeln. Hauptsache, es befindet sich im Projektordner und wird genutzt.

Für jeden finalen Visual-Strang notierst du kurz: Ziel, endgültiger Prompt (inklusive Negatives), Seed/Randomness, Modell/Version, Seitenverhältnis/Upscale, zwei Thumbnails (Entwurf/final) und eine Erkenntnis, zum Beispiel: „Mehr Negativraum erhöht die Lesbarkeit auf Mobilgeräten.“ Mehr braucht es nicht.

Wichtig ist die Vergleichbarkeit: Wenn du eine Variante verbesserst, dokumentiere nur die Änderung, zum Beispiel „Kontrast +5 %“, „Schattenkante weicher“ oder „No-go: Isometric entfernt“. So entsteht über Projekte hinweg ein kleines Handbuch eurer Entscheidungen, ohne dass du seitenlange Dokumentationen pflegen musst.

Meistere KI für deine kreative Arbeit – kostenlos

Der Smart Content Report liefert dir alle 14 Tage:

eine praktische Anleitung mit Tipps aus der Praxis
aktuelle News rund um neue Tools, Angebote und Entwicklungen

Kein Spam! 100% nützlich. Schon knapp 300 Leser:innen sind dabei.

Hier eintragen …

Style-Wörterbücher und wiederverwendbare Bausteine

Überführt eure Stilanker in direkt einsetzbare Bausteine. Denk an Design Tokens, aber nur für Bilder.

Beispiele:

Licht: „soft side light“, „no rim light“, „shadows medium“.
Oberfläche: „matte materials“, „no glossy reflections“.
Kamera: „Chest-Level, 50 mm“, „Shallow Depth of Field, mild“.
Farbe: eine definierte Palette mit Hex-Werten plus eine kurze Beschreibung („Hintergrund immer 1 – 2 Stufen heller als Motiv“).

Diese Bausteine landen als kurze Prompt-Snippets in deinem Notebook und als Presets in deinen Tools. Farblooks/Grain in Photoshop, Light-Rigs in 3D und Export-Presets im Generator. Ergänze zwei bis drei Compositing-Vorlagen (z. B. PSD mit Ebenen für Schatten, Körnung und Typo-Raster) sowie ein generisches Mockup für Displays oder Plakate mit echten Einpasshilfen (Perspektive und Glanz auf eigener Ebene).

Das Ziel besteht darin, dass jede*r im Team innerhalb von fünf Minuten ein visuell „richtiges“ Setup hat.

Content-Credentials als Zukunftsbaukasten

Die Herkunft von Bildern wird immer wichtiger, auch wenn noch nicht jeder Kanal sie sauber darstellt. Baue dir deshalb jetzt den Pfad: Embedde beim Export wenn möglich Content Credentials/C2PA (Ersteller*in, Tool/Version, Hinweis „KI-Anteil vorhanden“, Datum). Speichere parallel die Rohinfos intern mit: Prompt, Seed, Modell, Compositing-Quellen. Da viele Plattformen Metadaten entfernen, bleibt deine interne Version als Beleg erhalten und erleichtert spätere Klärungen.

Wenn dein Stack das Einbetten noch nicht unterstützt, nutze einen pragmatischen Zwischenschritt: Erstelle eine kleine JSON- oder TXT-Datei pro finales Motiv mit der Endung .cred.json und füge die gleichen Angaben sowie einen Hash der Bilddatei hinzu.

Das ist unscheinbar, aber robust. Sobald deine Tools Credentials nativ schreiben können, hängst du sie an den Export-Job. Der Vorteil dabei ist, dass du deinen Workflow nicht umstürzen musst und ihr vorbereitet seid, wenn Kund*innen oder Redaktionen Herkunftsnachweise verlangen.

Unternehmen wie Adobe, Leica und Microsoft unterstützen die Content Credentials Initiative, damit der Ursprung eines KI-Bilds leichter nachverfolgt werden kann.

Schluss: Ein Plädoyer für Haltung und KI-Handwerk

KI macht Tempo, Haltung macht den Unterschied. Wenn Ziel, Stilanker und Leitplanken klar sind, wird aus „gut genug” wieder „steht für uns”. Dreh die Reihenfolge um: Erst die Aussage, dann das Motiv, dann der Prompt und dokumentiere Seeds, Versionen und Learnings. Bremse Defaults mit Negatives, halte eine kleine Stilbibliothek aktuell und prüfe vor dem Veröffentlichen deine sechs Fragen. So gewinnst du Wiedererkennbarkeit ohne Reibungsverlust und KI wird vom Effekt zur Handschrift.

Dieser Artikel gehört zu: UPLOAD Magazin 122

Schon gewusst? Mit einem Zugang zu UPLOAD Magazin Plus oder zur Content Academy lädst du Ausgaben als PDF und E-Book herunter und hast viele weitere Vorteile!

Stephanie Kowalski

Stephanie Kowalski arbeitet als selbstständige Content-Managerin und Content-Creatorin. Sie unterstützt kleine und mittelständische Unternehmen bei ihrer digitalen und visuellen Kommunikation. In ihrer mehrjährigen Tätigkeit für verschiedene Agenturen und deren Kunden hat Sie zahlreiche Projekte in den Bereichen Content-Marketing, Content-Management und Content-Strategie begleitet.

stephanieakowalski.de

Schreibe einen Kommentar Antwort abbrechen

Du musst angemeldet sein, um einen Kommentar abzugeben.