Bilder und Illustrationen maschinell generieren: Wie gut funktioniert das?

Künstliche Intelligenzen können heute schon Texte generieren und kommen zunehmend für Bilder und Illustrationen zum Einsatz. Jan Tißler zeigt in diesem Artikel auf, was damit derzeit möglich ist und wohin die Reise in den nächsten Jahren wahrscheinlich gehen wird.

Zwei Interprationen der App Wombo Dream zur Vorgabe „Robot Painter“.

Hintergrund: Die rasante Entwicklung im KI-Bereich

Künstliche Intelligenzen haben in den letzten Jahren teils erstaunliche Fortschritte erzielt. Viele davon sind mithilfe eines massiven Datenschatzes trainiert worden. 

Dieser Ansatz funktioniert heute vor allem aus zwei Gründen so gut:

  1. Die verfügbare Rechenkraft selbst auf mobilen Geräten hat sich enorm gesteigert. Das gilt erst recht für professionell eingesetzte und spezialisierte Computer.
  2. Daten wie Bilder und Texte, um solche KI-Systeme zu trainieren, haben sich sogar noch mehr vervielfacht – Internet und Digitalisierung sei dank.

Wir haben nun Sprachmodelle wie GPT-3, die sicher nicht perfekt sind, aber eben doch gute Ergebnisse erzielen oder zumindest die Kreativität anregen können. In Windeseile lassen sich damit Ideen, Gliederungen oder auch ganze Texte erstellen. Das kreative Potenzial der KI ist enorm. Dieses Potenzial kann jedoch nur dann voll ausgeschöpft werden, wenn KI mit menschlicher Intelligenz kombiniert wird. KI und Mensch ergänzen sich perfekt. KI kann große Datenmengen verarbeiten und Muster viel schneller erkennen als Menschen. Der Mensch hingegen hat den Vorteil, Kontexte verstehen zu können und Bedeutung aus Daten abzuleiten.

Hast du etwas gemerkt? Der vorherige Absatz stammt aus Neuraltext. Ich habe den fett gedruckten Teil vorgegeben, der Rest kommt aus dem Tool. Inzwischen gibt es etliche Anbieter, die GPT-3 in der einen oder anderen Form eingebunden haben. Ich würde nicht behaupten, dass der maschinell generierte Text meine eigene Arbeit ersetzen kann. Aber ich finde schon, dass das Ergebnis erstaunlich brauchbar ist.

Der nächste Schritt in diesem Bereich sind nun Bilder und Illustrationen, generiert von einer Künstlichen Intelligenz. Kann das funktionieren?

Kennst du schon die UPLOAD Content Academy? Hier lernst du Content-Marketing aktuell, praxisnah und umfassend. Du bekommst Lektionen in Text-, Audio- und Videoformaten sowie viele weitere nützliche Inhalte. Alles auf dem neuesten Stand, gemacht von Content-Profis. Klingt interessant? Mehr erfahren …

Was können KI-Bildgeneratoren heute?

Wenn du das enorme Potenzial einmal selbst erleben möchtest, schau dir diesen Artikel an. Die Beispiele darin kannst du anpassen. Dieses „Dall-E“ genannte Tool von OpenAI liefert aus meiner Sicht erstaunlich gute Ergebnisse. Sie sehen in gewissen Grenzen sogar realistisch aus.

Die KI „Dall-E“ liefert Ergebnisse zur Vorgabe: Ein Sessel in Form einer Avocado.

Seltsame Effekte und Artefakte gibt es natürlich weiterhin. Aber zum einen ist zu erwarten, dass die mit der Zeit immer geringer werden. Und zum anderen sehe ich sie sogar als Stilmittel an: Je nach Thema und Anwendung kann es durchaus passend sein, dass man den Bildern ihre maschinelle Herkunft ansieht.

Wie im oben verlinkten Beitrag erwähnt, gibt es Tipps und Tricks, die Ergebnisse zu verbessern. So erhöht es in diesem Fall die Qualität, wenn wichtige Begriffe wiederholt werden.

Ein anderes, eher verspieltes Beispiel ist die App „Wombo Dream“. Du kannst sie kostenlos für Android- oder Apple-Geräte herunterladen oder auch direkt im Browser ausprobieren. Du gibst ein Wort oder einen ganzen Satz vor, wählst einen Stil und klickst den Button. Schon generiert dir die KI ein Bild. Gefällt es dir nicht, klickst du den Button noch einmal.

Bemerkenswert finde ich hier, welche Ergebnisse sich mit abstrakten Vorgaben erzielen lassen.

Die Vorgabe an Wombo Dream war: „It was a bright day when the ship entered the harbor“

Natürlich sieht man zugleich bei vielen Ergebnissen, dass die KI nicht versteht, was sie dort generiert und wie beispielsweise ein Gemälde eigentlich aufgebaut ist. Die erstellten Bilder haben eine Tendenz zum Surrealen und Phantastischen. Passt das zu deinem Thema, ist es ein Volltreffer.

Ein letztes, schon älteres Beispiel sind generierte Porträtfotos. Damit kannst du allerlei Gesichter generieren, die es so nicht gibt. Manche davon haben absurde Artefakte. Viele aber wirken zumindest oberflächlich betrachtet natürlich.

2,6 Millionen Portraitfotos von Menschen, die es nicht gibt – fein granuliert durchsuchbar.

Und wenn du noch mehr ausprobieren möchtest, findest du auf dieser Seite allerlei weitere Spielereien in Text und Bild. Die sind nicht alle so ernst zu nehmen, können aber trotzdem ganz interessant sein.

Wofür lassen sich KI-Bilder und -Illustrationen einsetzen?

Wir stehen weiterhin am Anfang einer Entwicklung. Genauso wie Textgeneratoren deutlich besser geworden sind, wird es auch für Bilder und Illustrationen Systeme und Methoden geben, die sichtbar besser funktionieren als die heutigen. Dall-E zeigt aus meiner Sicht schon erhebliche Fortschritte gegenüber den anderen hier genannten Beispielen.

Faszinierend finde ich diese Entwicklung vor allem, da ich immer wieder illustrierende Bilder und Grafiken für Beiträge benötige. Heute nutze ich dazu einen Service wie Depositphotos. Die Werke stammen hier von Menschen und sind mit Titel, Beschreibung und Schlagworten versehen. Ich kann meinen Suchbegriff eingeben und die Ergebnisse über Filter eingrenzen. Das funktioniert in vielen Fällen recht gut.

Eine Seite wie Pexels ist wiederum nützlich, wenn ich bereits eine konkrete Bildidee habe. Dann lässt sich hier nach passenden Fotos suchen.

Im Idealfall hätten wir bei UPLOAD eine Fachperson, die unsere Illustrationen und Bilder passgenau erstellt. Dann könnten wir Inhalt und Stil individuell bestimmen. Das Budget dafür ist allerdings nicht vorhanden. Und ich denke, dass es vielen Selbstständigen, Startups und kleinen Unternehmen ähnlich geht.

Ich verstehe, dass Grafiker und Fotografen ebenfalls überleben wollen. Mir als Contentmensch geht es da nicht anders. Aber ich weiß zugleich, dass sich längst nicht jede:r meine Dienste leisten kann. Alternativ greift man dann auf Texterplattformen zurück oder engagiert jemanden mit weniger Berufserfahrung und niedrigeren Preisen.

Diese Schreiberlinge sind es allerdings, die sich um ihre Zukunft Gedanken machen sollten, denn sie werden meiner Meinung nach in den nächsten Jahren zunehmend durch Maschinen ersetzt. Man denke nur an Beschreibungstexte in Onlineshops: Es ist eine Herkulesaufgabe, das für tausende Produkte umsetzen zu wollen. Sicherlich braucht man in vielen Fällen hochwertige Texte und selbst in einigen Jahren wird eine Maschine nicht die Kreativität entfalten, die ein Mensch bieten kann. Aber selbst wenn ein Maschinentext nicht so sprühend wie ein menschlicher ist, ist er immer noch besser als kein Text.

Gefällt dir dieser Artikel?

Dann trage dich jetzt ein ins „Update am Montag“ und du bekommst einmal wöchentlich:

  • Die neuesten UPLOAD-Inhalte
  • Ausgewählte Lesetipps auf anderen Seiten
  • … und mehr!

Kein Spam! Bereits über 2.000 Leser:innen sind dabei.

Hier eintragen …

Und ehrlich gesagt bin ich gar nicht so überzeugt, dass Maschinentexte in einigen Jahren nicht sogar für bestimmte Anwendungsfelder besser sein werden: Schließlich kann ich hier als Auftraggeber:in dann wahrscheinlich fein granuliert einstellen, welche Tonalität ich möchte, zugleich werden Grammatik und Rechtschreibung automatisch kontrolliert und gefällt mir ein Text nicht so gut, drücke ich auf einen Knopf und erstelle eine neue Variante. 

Ähnlich sehe ich den Fall bei Bildern und Illustrationen: Eine maschinengenerierte Variante wird vielleicht nicht dieselbe Kreativität und Kraft haben wie die menschliche (wobei ich mir auch hier nicht sicher bin, ob Maschinen nicht eine ganz eigene Form von Kreativität und Stil entwickeln können). Aber sie wird dennoch hilfreich und nützlich sein, um eine zusätzliche Option zu geben.

Vor allem illustrative Grafiken und Schmuckbilder sind ein Bereich, den ich mir gut für diese Werkzeuge vorstellen kann.

Eine weitere mögliche Anwendung ist die Ideenfindung: Eine Designerin kann damit in einfachen Worten eine Idee beschreiben und sich erste Entwürfe generieren lassen. Die nimmt sie dann als Ausgangspunkt für die eigene Arbeit, für den Austausch mit Kolleg:innen oder eventuell für Kundengespräche.

Schlusswort

Ich glaube nicht, dass KIs die Arbeit kreativer Menschen ersetzen werden. Ich sehe sie stattdessen als Ergänzung und als Werkzeug. Zudem können Sie Aufgaben übernehmen, die eine Person gar nicht erledigen könnte.

Wer in diesem Bereich arbeitet, sollte die Entwicklungen im Bereich Künstlicher Intelligenz auf jeden Fall aufmerksam verfolgen.


Dieser Artikel gehört zu: UPLOAD Magazin 100

100 Ausgaben UPLOAD Magazin sind ein guter Anlass nach vorn zu schauen: Wohin geht die Reise in den nächsten 10 Jahren? Dazu haben 12 Personen in ihre Glaskugeln geschaut. Die Ergebnisse findest du in dieser Ausgabe. Außerdem erklären wir, was es mit dem Schlagwort „Web3“ auf sich hat, was du heute über das „Metaverse“ wissen musst und wie gut KI-Bildgeneratoren funktionieren.

Schon gewusst? Mit einem Zugang zu UPLOAD Magazin Plus oder zur Content Academy lädst du Ausgaben als PDF und E-Book herunter und hast viele weitere Vorteile!

Lerne Content-Marketing – aktuell und umfassend

Illustration zeigt Personen beim Lernen online
(Illustration: © AlisaRut, depositphotos.com)

Lerne in der Content Academy von erfahrenen Profis, was erfolgreiches Content-Marketing ausmacht. Mehr erfahren ...

 

Schreibe einen Kommentar