☞ UPLOAD Magazin 113 „Newsletter“ Ansehen …

Kookkurrenzen erklärt: Wie Google Suggest für Ihre eigenen Texte

„Kookkurrenzen“ ist erst ein ungewohnter Begriff, hinter dem zugleich eine praktische Erkenntnis steckt: Wenn Keyword A in einem Text vorkommt, kommen normalerweise auch B, C und D vor. Dieses Wissen kann Ihnen u.a. dabei helfen, ein geplantes Thema tatsächlich umfassend zu behandeln und dabei die Wörter zu nutzen und Themen zu erklären, die benötigt und erwartet werden. René Schröter zeigt Ihnen in diesem Beitrag, was dahintersteckt und worauf Sie achten sollten.

Einführung

Wenn Sie eine Suchanfrage bei Google eintippen, werden Ihre Angaben automatisch vervollständigt und durch häufige Suchen anderer Nutzer ergänzt. „Google Suggest“ nennt sich diese Funktion, bei der die Suchmaschine zu erraten versucht, worum es Ihnen geht. Das funktioniert unter anderem deshalb, weil Google relativ genau weiß, welche Begriffe häufig miteinander vorkommen. Und das ist als „Kookkurrenz“ bekannt.

Wenn Sie diesen Zusammenhang besser verstehen, können Sie ihn selbst für Ihre Inhalte nutzen. Und dabei geht es nicht allein um die Suchmaschinen-Optimierung: Ihr Blick auf Inhalte wird sich verändern und Sie werden relevantere Beiträge publizieren.

In diesem Artikel zeige ich Ihnen, wie Sie dieses Wissen zur Verbesserung der eigenen Texte verwenden können.

A N Z E I G E

neuroflash

 

Kookkurrenzen bestimmen das Verständnis Ihrer Texte

Mussten Sie beim ersten Lesen dieses komplizierte Wort „Kookurrenzen“ zunächst in seine Silben zerlegen und vor sich hinmurmeln? Dann ist Ihnen wahrscheinlich aufgefallen, dass es sich bei der „Kookkurrenz“ nicht um das abgeleitete Phänomen eines „kook“ handelt, wie man im Amerikanischen umgangssprachlich einen „Spinner“ bezeichnet …

Der Duden definiert die Ko|ok|kur|renz als „das Miteinandervorkommen sprachlicher Einheiten in derselben Umgebung (beispielsweise im Satz)“. 

Der Begriffsursprung liegt im Neulateinischen und leitet sich ab von: con-, co- = zusammen und occurrere = begegnen.

Die Kookkurrenz wird hauptsächlich in der Korpuslinguistik verwendet. Diese beschäftigt sich mit der empirischen Analyse von Sprache und sprachlichen Phänomenen auf Grundlage vorhandener Sprachdaten.

Was müssen Sie beim Bestimmen von Kookkurrenzen beachten?

Dabei gilt das Folgende: In einer höheren sprachlichen Einheit, wie in einem Satz, einem Abschnitt oder einem Text, treten in einer Kookkurrenz zwei niedrigere sprachliche Einheiten, beispielsweise zwei Wörter, ungewöhnlich häufig nebeneinander auf. Dieses Auftreten ist somit nicht durch bloßen Zufall oder die Erwartbarkeit erklärbar.

Je nach Anwendungskontext müssen Sie dabei die sprachlichen Einheiten, oft textuelle Einheiten oder Token genannt, ihr gemeinsames Auftreten sowie die Häufigkeit des Auftretens in der Analyse individuell betrachten. Entscheidend ist dabei, was das Ziel der Analyse ist, also was herausgefunden werden soll und in welchem Kontext.

Die Analyse kann:

  • verschiedene Wortformen betrachten, eliminieren oder reduzieren 
-> beispielsweise das Ausfiltern von Funktionswörtern, die Reduzierung auf den Wortstamm
  • das „Miteinander-Auftreten“ unterschiedlich definieren 
-> beispielsweise gemeinsames Auftreten in einem Satz (= Satz-Kookkurrenz), in einem Absatz (= Absatz-Kookkurrenz), innerhalb von x Elementen oder ausschließlich nacheinander, nebeneinander, links voneinander, rechts voneinander (= Nachbarschaftskookkurrenz)
  • eine unterschiedliche Menge an Texten zur Grundlage haben, wodurch die Signifikanz der Häufigkeit beurteilt wird 
-> beispielsweise können ausschließlich Texte aus ein- und demselben Fachbereich oder ein einziger umfangreicher Text verwendet werden

Wie unterscheidet sich eine Kookkurrenz von einer Kollokation?

Erneut ein kompliziertes Wort. Der Begriff „Kollokation“ wird mal als Synonym, mal als Antonym zur Kookkurrenz genannt. Genau genommen ist – Überraschung! – beides falsch. Nur bestimmte Kookkurrenzen, nämlich die sinnvollen unter ihnen, sind Kollokationen.

Außerdem enthalten Kollokationen stets voneinander abhängige Elemente. Das heißt, dass sie aus Wortgefügen bestehen, die keinen oder einen anderen Sinn ergeben, wenn die einzelnen Worte ausgetauscht werden. 

Der Unterschied zwischen Kookkurrenz und Kollokation lässt sich am besten anhand eines Beispiels erklären:

Im Schweizerischen Zivilgesetzbuch treten unter anderen die Tripel „Beteiligung am Vorschlag“, „Massnahme zum Schutz“ und „Haftung gegenüber Dritten“ überdurchschnittlich häufig gemeinsam auf. Sie stimmen mir sicher zu, dass diese Phrasen im Rahmen des Fachjargons sinnvoll sind. Es handelt sich schließlich um juristische Konzepte. Darüber hinaus sind die Elemente voneinander abhängig. Ersetze ich beispielsweise „Schutz“ durch „Erfolg“ oder lasse diesen Teil der Wortgruppe komplett weg, verändert dies den Inhalt und die Bedeutung der Phrase. Diese Kookkurrenzen sind deshalb aufgrund ihrer Sinnhaftigkeit auch Kollokationen.

Dagegen stiften die ebenfalls ausgefilterten Drei-Wort-Ausdrücke „zwei Jahre seit“ und „jedem Fall aber“ nur Verwirrung. Sie bilden keine sinnvollen Einheiten und treten lediglich zufällig überdurchschnittlich oft gemeinsam im Zivilgesetzbuch auf. Diese Kookkurrenzen sind keine Kollokationen. (vgl. Hess 2005: 15f.)

Da über die Abgrenzung der beiden Begriffe allerdings keine hundertprozentige Einigkeit herrscht, ist es ratsam, den Begriff der Kollokation zu umgehen und schlicht von einer Kookkurrenz zu sprechen.

Ausflug: N-Gramme – Wortkombinationen

Die Begrifflichkeit der Keywords ist Ihnen sicherlich bekannt. Nach einer Keyword-Recherche wissen Sie, zu welchen Begriffen der zukünftige Artikel gefunden werden soll. Diese Begriffe sollten zum besseren Verständnis im Text vorhanden sein. Keywords können dabei aus Einzelbegriffen oder Phrasen bestehen.

Damit Google eine Analyse Ihres Textes vornehmen kann, zerlegt ihn die Suchmaschine zunächst in einzelne Fragmente. Eine N-Gramm-Analyse funktioniert in jeder Sprache, wodurch auch Google in seinem Korpus zur Web-Indexierung auf diese Systematik setzt.

Aus semantischer Sicht werden 2-Gramme, 3-Gramme und N-Gramme gebildet. Das sind Wortkombinationen, die häufig zusammen mit anderen Wörtern auftreten, Keywords, die nicht ohne ihren Partner leben können.

Im gezeigten Artikel beispielsweise wird „Keywords“ 143 mal erwähnt, Website noch immer 60 mal, Google taucht 53 mal auf, Keyword-Recherche 27 mal und Ads wird 26 mal erwähnt.

Betrachten Sie häufige Wortkombination, dann sehen Sie, dass „Ads“ immer in Zusammensetzung mit „Google“ erscheint. Gemeint ist der Service Google Ads. 3-Wort-Kombinationen sind seltener und dennoch befinden sich im Artikel je dreimal „Liste von Keywords“, „Liste der Keywords“ und „Gruppen verwandter Keywords“. Allein über diesen Sinnzusammenhang können Sie bereits Rückschlüsse auf den Inhalt ziehen.

Eine Kookkurrenz ist nicht auf eine bestimmte Anzahl an Wörtern begrenzt. Es können 1-Wort-Kookurrenzen, 2-Wort-Kookurrenzen, … , N-Wort-Kookkurrenzen unterschieden werden.

Wo nützt Ihnen dieses Wissen?

Sprachen erlernen

Kollokationen helfen dabei, systematisch sprachliche Strukturen zu erkennen. Besonders häufig begegnet sind Ihnen Kollokationen, und damit auch Kookkurrenzen, wahrscheinlich beim Erlernen einer Sprache in der Schule. Erinnern Sie sich daran, wie Ihnen immer wieder eingebläut wurde, dass es „interested in“ und „thinking about“ heißt?

Es ist allein durch das Erkennen von Kollokationen möglich, einen Text zu analysieren und sinnvolle Zusammenhänge herauszufiltern. So können Sie beispielsweise die Reihenfolge von Adjektiv und Substantiv in einer Fremdsprache oder Redewendungen erkennen, da diese immer dem gleichen Aufbau folgen.

Assoziationen erkennen und schaffen

Das häufige gemeinsame Auftreten von textuellen Einheiten erlaubt die Erstellung von Kookkurrenz-Profilen oder Bedeutungslisten und die Bestimmung sogenannter „Beinahe-Synonyme“. Beinahe-Synonyme sind eng verwandte, jedoch nicht synonym verwendbare Begriffe.

Außerdem können Kookkurrenz-Profile Rückschlüsse auf die Erfahrungen des Autors oder der Autorin zulassen. Ein häufiges Auftreten von „lernen“ mit „autodidaktisch“ lässt beispielsweise auf andere Erfahrungen schließen als von „lernen“ mit „Schule“. Ebenso wird der Unterschied zwischen „lächeln“ und „grinsen“ erst durch verwandte Attribute wie „liebenswürdig“ und „milde“ oder „boshaft“ und „diabolisch“ deutlich.

Informationsmanagement betreiben

Das Filtern von Kookkurrenzen zeigt eng verwandte Wörter auf und gibt damit Hinweise auf die inhaltliche Bedeutung der Texte. Dadurch wird das Clustern und Kategorisieren von Dokumenten vereinfacht, beispielsweise für Kataloge von Bibliotheken. 

Es lässt sich zum Beispiel ausschließen, dass das gemeinsame Auftreten der Wörter „Bank“, „Kredit“, „Geldinstitut“ und „Zinsen“ aus einem Text über die Anschaffung neuer Bänke für den Stadtpark stammt, wie es bei „Bank“, „sitzen“, „ausruhen“, „Park“ und „Natur“ der Fall sein könnte. Dem mehrdeutigen Wort „Bank“ (= Geldinstitut oder Sitzgelegenheit) werden eindeutige Begriffe aus der Bedeutungsliste zugeordnet, die seine inhaltliche Ausrichtung festlegen.

Algorithmen sowie das Sammeln und Verarbeiten von Daten optimieren

Alle vorangegangenen Punkte münden in diesen letzten. Durch das Erkennen von Mustern, Assoziationen und Kategorisierungen lässt sich das Sammeln von Daten optimieren. Software und Analyse-Tools können Kerninformationen und Keywords zuverlässiger und schneller erkennen, wenn durch das häufige gemeinsame Auftreten bestimmter textueller Einheiten Klarheit über die Bedeutung des Inhalts herrscht.

Relevant für die Suchmaschinenoptimierung

Ein „WDF*IDF Tool“ nutzt ebenfalls Kookurrenzen, um Ihnen ausgehend von einem Keyword weitere Begriffe vorzuschlagen. Je nach Vergleichswebseite wird es zur Suchphrase „Bank“ nun allerdings das Fehlen von „Krediten“ oder von „sitzen“ bemängeln. Ob die Wörter inhaltlich passen, ist dem Tool an dieser Stelle gleichgültig. Als Bewertungsgrundlage dient zumeist das Themencluster einer Suchmaschine, welche die Kategorisierung mittels Erwartungswahrscheinlichkeit berechnet. In der Sprache von Marketing-Menschen: Welche Suchintention verbirgt sich hinter der Anfrage?

Ein Tool weiß erst einmal nicht, ob Sie mit einer Bank nun das Geldinstitut oder die Sitzgelegenheit meinen.

Nutzer, die strikt nach den „Empfehlungen“ des Tools handeln, würden der Bank raten, den Text um Sitzgelegenheiten im Foyer zu erweitern. Dem Onlineshop würde eine Erklärung zur Finanzierung angeraten werden. Beide Inhalte würde sich einander angleichen.

Bei dieser Analyse wird somit das Themenumfeld – beispielswiese die Art der Textgattung – weitgehend ignoriert. Zudem stehen sich konträre Ansätze gegenüber: Ein Inhalt soll das fragliche Thema möglichst umfassend abdecken oder die Intention der Nutzer soll möglichst passgenau begriffen werden. Um den jeweils besten Ansatz für sich herauszufinden, hilft das Wissen zu Kookkurrenzen. 

Gelingt Ihnen eine logische Kombination von Begriffen, kann Ihr Text zu einem Thema gefunden werden, obwohl – oder weil – der Inhalt den fraglichen Begriff nicht enthält. Die Suchmaschine setzt dies aufgrund der häufigen Kookkurrenz einfach voraus.

Tipp: Lesestoff für Content-Profis (und solche, die es werden wollen)

Das UPLOAD Content Briefing liefert dir alle 14 Tage:

  • eine nützliche und interessante Anregung für deine Content-Arbeit
  • Links auf lesenswerte Beiträge und nützliche Tools
  • Hinweise auf neue UPLOAD-Angebote für dich und woran wir gerade arbeiten

Kein Spam! 100% nützlich. Schon über 300 Leser:innen sind dabei.

Hier eintragen …

Wie Sie eine Kookkurrenz-Matrix erstellen

Das Leibnitz-Institut für Deutsche Sprache in Mannheim bietet ein Online-Tool zur Recherche von Kookkurrenzprofilen innerhalb einer erstellten Datenbank zu ca. 220.000 verschiedenen Stichwörtern an. Dafür wurde ein Korpus geschriebener Gegenwartssprache von ca. 2,2 Milliarden laufenden Textwörtern herangezogen. Mehr zu den Hintergründen in diesem PDF.

Am Beispiel „Sonne“ wird deutlich, dass der Begriff in den unterschiedlichsten Kontexten auftritt. Das Kookkurrenzprofil enthält Assoziationen zum Wetter, beispielsweise „scheint draußen“ und „Wolken Mix BERLIN“, sowie zum Laternenumzug, zum Beispiel: „Mond Sterne Laterne“. Ebenso taucht die Sonne häufig im Zusammenhang mit der Energiegewinnung auf, zum Beispiel „Wind, Biomasse, Energien, erneuerbar“. Dagegen hat „sonnig“ nichts mit der Solarenergie zu tun. Dafür steht das Wort in engem Zusammenhang mit dem guten Wetter, dem Urlaub im Süden und dem positiven Gemüt.

Gesprochene und geschriebene Sprache befinden sich stets im Wandel. Daher ist es denkbar, dass sich zur Kookkurrenz-Matrix „sonnig“ in Zukunft häufiger Begriffe wie „Klimawandel“ oder „Hitzewelle“ gesellen werden.

Über semantisch verwandte Wörter und Wortgruppen können Leser und Maschinen Kontext und Bedeutung von Entitäten identifizieren.

Vereinfacht ausgedrückt: Um das Verständnis Ihres Textes zu erhöhen, ist es sinnvoll, wenn Sie Ihren Artikel mit diesen Wortkombinationen anreichern.

Zusammenfassung

Das Erstellen einer Keyword-Liste ist ein hervorragender Ausgangspunkt zum Erstellen neuer Inhalte. Damit der geschriebene Artikel selbst auch hervorragend wird, sollten Sie sich sprachlich mit dem Text auseinandersetzen.

Hierfür eignet sich die Metrik der Kookkurrenzen. Diese zeigen Ihnen Wörter, die häufig in der Nähe des eigenen Keywords stehen und somit eine wichtige Bedeutung besitzen. 


Dieser Artikel gehört zu: UPLOAD Magazin 86

Vertrauen ist wertvoll und bekanntlich muss man es sich erst verdienen. Das gilt für eine Website gegenüber den Besuchern, aber auch für den Chef gegenüber seinen Mitarbeitenden. In sechs Artikel beleuchten wir dieses Thema im Schwerpunkt dieser Ausgabe. Sie erfahren, wie Sie Markenbotschafter richtig einsetzen. Wie Ihr Corporate Blog gerade im B2B-Bereich helfen kann. Wie gute Feedbackkultur funktioniert. Warum New Work und Remote Teams (noch) mehr Vertrauen brauchen. Wie Ihre Internetseite vertrauenswürdig aussieht und wie Personalisierung dabei unterstützt. Bonus-Artikel: Was hat es mit „Kookkurrenzen“ auf sich und wie helfen sie mir, bessere Beiträge zu schreiben?

Schon gewusst? Mit einem Zugang zu UPLOAD Magazin Plus oder zur Content Academy lädst du Ausgaben als PDF und E-Book herunter und hast viele weitere Vorteile!