„Google mag keinen KI-Content!“ Mythos oder Wahrheit?

23. Februar 202418. Februar 2024 von Olaf Kopp

Spätestens seit der KI-Revolution angefacht durch die Evolution der Large Language Models (LLMs) und generativen Anwendungen wie ChatGPT stellen sich immer mehr SEOs und Unternehmen die Frage, ob per KI erstellte Inhalte bei Google gefunden werden können oder für das Ranking abgewertet werden. Die Meinungen sind gespalten: Viele bekannte SEOs gehen davon aus, dass Google mit den aktuellen Updates pro-aktiv gegen KI erstellte Inhalte vorgeht. Doch hat Google wirklich ein Interesse daran? Bei vielen dieser Meinungen schwingen ideologische Ansichten und Ängste was den eigenen Job angeht mit.

(Illustration erstellt mit Dall-E 3)

Was sagt Google zu KI-Content?

Google äußerte sich in den letzten 12 Monaten sehr unterschiedlich zum Umgang mit KI-erstellten Inhalten, was das Ranking und Richtlinien angeht.

Im Februar 2023 etwa passte Google die Richtlinien hinsichtlich AI-Content an und Statements von z.B. Danny Sullivan zeigten sich versöhnlich:

“Our focus on the quality of content, rather than how content is produced, is a useful guide that has helped us deliver reliable, high quality results to users for years.“
Danny Sullivan and Chris Nelson of the Google Search Quality team

Im April 2023 bezeichnete John Müller KI-Content als Spam.

Aktuell scheint Google die kritische Haltung zu KI generierten Inhalten abgelegt zu haben.

Screenshot zeigt eine offizielle Erklärung von Google zu KI-Inhalten, die solchen Content nicht generell ausschließt oder gar verbietet.

In puncto Ranking bzw. die Auslieferung von KI-Inhalten in der Suche scheint Google also aktuell keine Bedenken zu haben.

Warum sollten sie auch? Viele der nach SEO-Zielen erstellten Inhalte werden seit jeher aus kuratierten Informationen aus den Top Rankings in Suchmaschinen erstellt. Also aus den Inhalten, die in vielen Fällen auch für das Trainieren der Sprachmodelle genutzt werden.

Der Qualitätsunterschied der meisten bisherigen „SEO-Texte“ zu den mit KI-erstellten Inhalten ist schon heute nicht mehr sonderlich groß.

A N Z E I G E

KI-Schulungen für Unternehmen

Zudem müsste Google für eine Unterscheidung zwischen per KI-erstellten Inhalten und durch Menschen erstellten Inhalten in der Lage sein, diesen Unterschied tatsächlich algorithmisch zu erkennen.

Hier spricht Google nebulös von Spambrain als mögliches System zur Erkennung von KI-Content.

Screenhot einer offiziellen Erklärung von Google: “Wir haven verschiedene Systeme, darunter SpamBrain, die Muster und Signale analysieren, um Spaminhalte zu erkennen, egal wie sie erstellt wurden.

Die meisten Data Scientists und Researcher sind zugleich skeptisch, dass man Systeme entwickeln kann, die über alle Sprachmodelle hinweg KI-Content identifizieren können.

Auch Tests mit verschiedenen KI-Detektoren am Markt liefern eher ernüchternde Ergebnisse mit hoher Fehlerquote.

Ich glaube nicht, dass Google viel Energie in die Identifikation von KI-Content investiert, denn es wäre ein Kampf gegen Windmühlen bei der aktuellen Evolutionsgeschwindigkeit der Sprachmodelle.

Googles eigentlich große Herausforderung: Crawling und Indexierung

Durch KI wird die Content-Produktion vor allem mit Blick auf Geschwindigkeit und Menge revolutioniert. Inhalte mit ausreichender Qualität lassen sich immer schneller und in größerer Menge produzieren und veröffentlichen. Dadurch wird die Zahl der Online-Inhalte und URLs in den nächsten Jahren exponentiell anwachsen.

Die größte Herausforderung ist für Google die Bereitstellung der Ressourcen, um diese Menge an Content zu crawlen und zu indexieren.

Als Hintergrund dazu: Bei der Erfolgsmessung von Information-Retrieval-Systemen wird zwischen Precision und Recall unterschieden.

Die Precision ist die Wahrscheinlichkeit, mit der ein gefundenes Ergebnis relevant ist. Diese ergibt sich aus dem Anteil der relevanten Objekte am gesamten Ergebnis.
Der Recall ergibt sich aus dem Anteil relevanter Treffer an der Gesamtanzahl aller relevanten Ergebnisse. Der Recall beschreibt somit die Vollständigkeit eines Suchergebnisses. Je größer die verwendete Datensammlung ist, desto schwieriger ist es, die Gesamtanzahl aller relevanten Objekte zu bestimmen.

Daraus wird schnell klar, dass die Qualität der Suchergebnisse erheblich durch die exponentiell steigende Menge an KI-Inhalten beeinflusst wird.

Da KI schon heute in der Lage ist, objektiv relevante Inhalte in großer Menge zu erzeugen, wird die objektive Relevanz von Content z.B. aufgrund der Termfrequenz oder Nutzung von Keywords im Titel oder Überschriften eine immer geringere Rolle beim Ranking spielen. Es wird durch KI einfach zu viele objektiv relevante Inhalte geben.

Google hat alternativ folgende weitere Möglichkeiten das Ranking zu bestimmen:

Inhaltspezifisches Reranking basierend auf dem Nutzerverhalten. Suchergebnisse werden nach dem Erstranking über klassische Relevanz-Signale neu gerankt aufgrund von Nutzersignalen wie Klickrate in den Suchergebnissen (SERP-CTR), Bounce-Back-to-SERP-Rate, Verweildauer …
Thematische Qualitäts-Klassifizierung nach E-E-A-T (Experience- Expertise-Authoritativeness-Trust) von Urhebern und Domains.

Aufgrund der schieren Menge an zukünftigen Inhalten ist es aus Ressourcensicht wichtig, vor dem Ranking-Prozess zu entscheiden, welche der Inhalte überhaupt gecrawlt und indexiert werden sollen. Hierfür muss es Klassifikatoren geben, die Inhalte aussortieren, um Ressourcen einzusparen. In dem Moment können Klassifikatoren ähnlich oder gleich E-E-A-T eine Rolle spielen.

Aus den genannten Gründen wird für die Indexierung nicht entscheidend sein wie Content erstellt wurde, sondern wie viel Vertrauen Google in die veröffentlichende Quelle hat.

Können KI-Inhalte bei Google ranken?

Kommen wir zurück zur Praxis. Bei Aufgesang führen wir seit Sommer 2022 eine Langzeit-Studie zur Rankability von 50+ via KI erstellten Inhalten durch.

Wir betreiben zwei Testreihen auf zwei unterschiedlichen Domains. Beide Domains haben eine mehrjährige Historie und bereits etablierte Rankings.

Testreihe 1:

Domain A
Beginn: Sommer 2022
30+ Inhalte in großen Teilen mittels KI erstellt
LLMs: GPT-2 /Jasper.ai bis Dezember 2022 / GPT-3 + GPT 4 bis heute

Testreihe 2:

Domain B2
Beginn Sommer 2023
20+ Inhalte in großen Teilen mittels KI erstellt
LLMs: GPT 4 bis heute

Bei der Testreihe 2 wurde ein komplettes Verzeichnis nur mit KI-Content aufgebaut. Am Sichtbarkeitsverlauf dieses Verzeichnisses erkennt man, dass der KI-Content indexiert und in vielen Fällen auch gerankt wurde.

Grafik zeigt einen deutlichen Anstieg der Sichtbarkeit von Anfang September 2023 an.

Hier ein paar Beispiel-Keywords in der Ranking-Entwicklung:

Aktuell sieht das Gesamtergebnis der beiden Testreihen zusammen wie folgt aus: Von den über 50 fokussierten Hauptkeywords haben …

100 Prozent aktuelle Platzierungen in den Top 100.
64 Prozent aktuelle Platzierungen in den Top 20.
29 Prozent aktuelle Platzierungen in den Top 10.

KI-Content kann mittel- bis langfristig Top-Rankings bei Suchmaschinen gewinnen und auch organischen Traffic erzeugen. Das zeigen unsere Testreihen ziemlich deutlich.

Wir konnten sogar im Longtail Featured-Snippet-Auslieferungen erhalten.

Tools, Tipps, News zu KI für Kreative

Der kostenlose Smart Content Report liefert dir alle 14 Tage:

eine Anleitung mit Tipps aus der Praxis
aktuelle News rund um neue Angebote und Entwicklungen
Links auf lesenswerte Artikel

Kein Spam! 100% nützlich. Schon knapp 200 Leser:innen sind dabei.

Hier eintragen …

Fazit

Ich kann verstehen, wenn man sich gegen den Gedanken sträubt, dass „mal eben schnell erstellter“ KI-Content ranken kann, aber aktuell muss man sich mit dieser Tatsache anfreunden. In der Hoffnung, dass Google dagegen vorgeht, steckt nach meiner Meinung mehr Hoffnung als Zuversicht.

Auch wenn Google es mit den eigenen Systemen könnte, bleibt die Frage, warum sie es sollten bzw. ob es aus Nutzersicht Sinn machen würde.

Die Sprachmodelle werden immer besser darin, relevanten Content zu erstellen. Egal ob Text, Bild, Audio oder Video.

Deswegen wird es umso wichtiger, den Content so zu erstellen, dass Nutzer:innen positive Engagement-Signale liefern und die Vertrauenswürdigkeit der Quelle zu verbessern oder zu erhalten (E-E-A-T).

Mer Insights aus zu unserer Testreihe findest du in unserer Webinar-Aufzeichnung:

YouTube

Dieser Artikel gehört zu: UPLOAD Magazin 112

Schon gewusst? Mit einem Zugang zu UPLOAD Magazin Plus oder zur Content Academy lädst du Ausgaben als PDF und E-Book herunter und hast viele weitere Vorteile!

Olaf Kopp ist Co-Founder, Chief Business Development Officer (CBDO) und Head of SEO bei der Online Marketing Agentur Aufgesang GmbH. Er ist Autor, Podcaster und anerkannter Branchenexperte für semantische SEO, E-A-T, Online- und Content-Marketing-Strategien entlang der Customer Journey und digitale Markenbildung. Olaf Kopp ist Mitgründer und Moderator des Content-Marketing-Podcasts Content-Kompass, Autor des Buches “Content-Marketing entlang der Customer Journey” und Mitorganisator des SEAcamp.

A N Z E I G E

Schreibe einen Kommentar Antworten abbrechen

Du musst angemeldet sein, um einen Kommentar abzugeben.