Sternebewertungen sind zu einem zentralen Ankerpunkt für die Reputation von Produkten, Dienstleistern und Unternehmen im Web geworden. Alles soll auf einer Skala von 1 bis 5 abgebildet werden. Das scheint einerseits hilfreich, ist aber andererseits sehr problematisch. „Reputation Inflation“ ist nur eines von mehreren Phänomenen, die zeigen: Wir verlassen uns auf ein System, das nur sehr bedingt funktioniert.
„Effektive Reputations-Systeme zu entwerfen und ihre Auswirkungen auf Online-Marktplätze zu verstehen, ist eine der wichtigsten Fragestellungen in der digitalen Wirtschaft“ – aus: „Reputation Inflation“ von Apostolos Filippas, John J. Horton und Joseph M. Golden, März 2018
Als ich vor einigen Wochen über Amazon einen Stifte- und Zettelhalter für meinen Schreibtisch bestellt habe, kam der ohne die kleinen Gummifüße an, die eigentlich versprochen waren. Aus meiner Sicht keine große Sache, aber ein wenig enttäuscht war ich schon. Zumal ich meinen Schreibtisch ungern zerkratzen möchte. Also schrieb ich eine kurze E-Mail an den Verkäufer und fragte, ob ich eventuell diese Gummifüße zugeschickt bekommen könnte oder ob er sonst einen Tipp hätte. Der Verkäufer reagierte sofort, entschuldigte sich und schickte mir in Windeseile einen zweiten Halter – kostenlos. Den ersten könne ich behalten oder „entsorgen“ ließ er mich wissen.
Dieser gute Service hat einen guten Grund: die Angst vor schlechten Bewertungen und die Hoffnung auf möglichst viele gute. Denn nur so hat man eine Chance im umkämpften Amazon-Marktplatz – vor allem hier in den USA.
Inhaltsverzeichnis
Daumen hoch für Sterne-Alternativen
Es gibt nur wenige Seiten, die bei ihrem Bewertungssystem nicht auf die bekannten fünf Sterne setzen. Prominenteste Beispiele für alternative Systeme sind YouTube und Netflix, die sich irgendwann für eine simplere Variante entschieden haben: Daumen hoch oder Daumen runter. Es gibt also keine Skala, nur die Frage: War’s gut oder nicht? Wer sich nicht entscheiden kann, gibt gar keine Stimme ab.
Perfekt ist so ein binäres System natürlich ebenfalls nicht. Man denke hier nur an die immer wieder aufflammende Diskussion rund um Filmbewertungen auf der Website Rotten Tomatoes. Sie fasst nicht nur den Grundtenor von Filmkritiken zusammen, sondern gibt deren Autoren auch die Möglichkeit zu sagen, ob der Film denn nun insgesamt „gut“ oder „schlecht“ war. Vor allem mittelmäßige Streifen können so bisweilen eine gut scheinende Gesamtbewertung einfahren: Zwar war keiner der Kritiker begeistert, aber letztlich haben sie sich für „eher gut“ entschieden und diese Differenzierung gibt es hier eben nicht. Was gerade so okay ist, bekommt so gesehen die gleiche Wertung wie etwas, was Welt-aus-den-Angeln-hebend gut ist. So manches Filmstudio hat Filme allein schon deshalb Rezensenten nicht vorab gezeigt, damit ein schlechter Rotten-Tomatoes-Score das wichtige Eröffnungs-Wochenende nicht gefährdet. Manche andere sind in den Verdacht geraten, stattdessen die Publikumsbewertungen auf Rotten Tomatoes zu manipulieren.
Ansonsten aber gilt fast überall im Netz: Egal, ob man ein Restaurant auf Yelp bewertet, ein Produkt auf Amazon, einen Kurs auf Udemy, ein Plugin auf WordPress.org oder eine Unterkunft auf AirBnB: Überall ist man mit einer Skala von 1 bis 5 Sternen konfrontiert. Manchmal lassen sich halbe Sterne vergeben. Oftmals aber sind es fünf Stufen.
Was ist „gut“ auf einer Skala von 1 bis 5?
Problematisch ist dieses System aber alleine schon deshalb, weil nicht alle Menschen in der Welt dieselbe Idee davon haben, wofür diese Skala eigentlich steht. So könnte man beispielsweise zu recht argumentieren, dass 2,5 Sterne wiedergibt, dass alles ganz prima und wie erwartet gewesen ist. Schließlich ist dieser Wert genau in der Mitte der Skala. Wir wissen allerdings alle, dass 2,5 Sterne im Netz der Todesstoß für so ziemlich jedes Produkt oder Angebot ist. Andere Nutzer sind vielleicht etwas großzüger und sehen 3,5 oder 4 Sterne als das Normalmaß an und behalten sich die 5 Sterne für besondere Anlässe vor. Schließlich sollten 5 volle Sterne doch nur für ganz besonders gute Erlebnisse gelten – oder etwa nicht?
In der Praxis zeigt sich: Die Plattformen selbst sehen 5 Sterne als den Ausgangspunkt an, sozusagen als den Normalwert, wenn alles in Ordnung war. Von den 5 Sternen ausgehend, kann man als Kunde etwas abziehen, wenn etwas nicht gestimmt hat. Wer weniger als 5 Sterne bekommt, kann deshalb empfindlich an Umsatz verlieren. Und wer sich gar mehrere 1-Sterne-Bewertungen einfängt, kann manchmal gleich einpacken. Denn zum einen ist der Konkurrenzdruck auf Plattformen wie Amazon enorm. Und zum anderen sind einige Plattformen enorm streng. Als „Uber“-Fahrer darf man bei den Bewertungen beispielsweise nicht unter 4,6 rutschen, ansonsten könnte man seinen Job verlieren.
Schriftliche Notwehr eines Lyft-Fahrers
Ein Fahrer für den Uber-Konkurrenten Lyft wurde deshalb dafür bekannt, dass er seine Fahrgäste darüber aufklärte, wie das System funktioniert und was die Sterne wirklich bedeuten. Seine Erklärung übersetzt:
- 5 Sterne: „Die Fahrt war gut, großartig, legendär, mittelmäßig, durchschnittlich, in Ordnung, okay, eventuell hat er einen Wink nicht verstanden oder einen schlechten Witz gemacht, aber immerhin hat er mich dorthin gebracht, wo ich hinwollte und natürlich kann er noch besser werden!“
- 4 Sterne: „Dieser Fahrer ist schlecht, feuern Sie ihn langsam. Es bedeutet nicht durchschnittlich oder überdurchschnittlich. Zu viele solcher Bewertungen und ich könnte obdachlos werden.“
- 3 Sterne: „Dieser Fahrer ist so schlecht, dass ich ihn nie wieder sehen will. Es bedeutet nicht durchschnittlich.“
- 2 Sterne: „Ernsthafter Verstoß, eventuell war das Auto in einem gefährlichen Zustand oder er fuhr mit 120 durch eine 40er Zone.“
- 1 Stern: „Fürchterlich, schlimmste Fahrt aller Zeiten. Bedrohungen oder tätliche Übergriffe, möglicherweise nahm er keine Rücksicht auf seine eigene Sicherheit.“
Und er ergänzte am Ende den Hinweis:
„Wenn ich etwas tue oder sage, das du nicht magst oder irgendetwas nicht stimmt mit meinem Auto, dann lass es mich bitte mündlich wissen und ich kann das Problem beheben. Wir sind alle Freunde, so lasst uns offen und ehrlich sein!“
Ein anderer Uber- und Lyft-Fahrer erläuterte das System wie folgt: „5 Sterne = Die Fahrt war akzeptabel oder besser. 4 Sterne oder weniger = Dieser Fahrer sollte entlassen werden.“
Und schon sind wir wieder bei einem binären Bewertungssystem…
Fakes und andere Manipulationen
Diese Bewertungssysteme haben auch noch ein anderes wesentliches Problem: Sie lassen sich vergleichsweise leicht manipulieren. Dabei gilt laut einer Untersuchung in den USA: 80% schauen sich Bewertungen und Rezensionen vor einem Kauf an. Fast 50% aber finden, dass deren Glaubwürdigkeit schwer zu beurteilen ist.
Und das zu recht: Rezensionen für Amazon E-Books werden zum Beispiel weiterhin fleißig eingekauft. Entsprechende Anfragen finden sich auf Plattformen wie machdudas.de. Zwar lassen sich diese gekauften Bewertungen mit geschultem Auge oftmals erkennen. So gibt es immer wieder E-Books, die kurz nach Erscheinen eine Welle von begeisterten 5-Sterne-Bewertungen bekommen und danach fast nur noch 1-Sterne-Bewertungen. Aber wer hat schon Zeit, sich das alles anzuschauen, durchzulesen und auf die Profile der Rezensenten zu schauen? Und natürlich versucht Amazon, diese Machenschaften zu erkennen. Aber im großen Stil scheint das nicht zu gelingen, andernfalls wäre das nicht weiterhin ein so florierendes Geschäftsfeld.
Umgekehrt geht es natürlich auch: Mit schlechten Bewertungen lässt sich die Konkurrenz aus dem Weg räumen. Auch das passiert auf Amazon. So erlebte Amazon-Verkäufer David Damavandi, das jemand anderes sein Bestseller-Produkt kopierte und dann mit allerlei Tricks und Betrügereien für schlechte Bewertungen sorgte, um ihn ins Aus zu befördern. Er war dagegen vollkommen machtlos. Dabei hatte er über sieben lange Jahre sein Geschäft auf Amazon aufgebaut und konnte auf 10 Millionen US-Dollar Jahresumsatz verweisen.
Phänomen „Reputation Inflation“
Ein weiteres Phänomen, das bereits wissenschaftlich untersucht wurde, nennt sich „Reputation Inflation“. Das meint, dass die durschnittlichen Bewertungen auf einem Portal mit der Zeit immer höher werden. Apostolos Filippas, John J. Horton und Joseph M. Golden haben das in ihrem Papier vom März 2018 genauer untersucht.
Der Median für Verkäuferbewertungen auf eBay lag demnach beispielsweise bei 100% positivem Feedback. Eine andere Untersuchung zeigte: 90% aller Fahrten mit UberX in Chicago Anfang 2017 hatten eine perfekte 5-Sterne-Bewertung.
Das kann letztlich zwei Dinge bedeuten: Entweder sind die Kunden enorm zufrieden oder ihre Bewertungsstandards sind nicht sehr streng.
Wenn die Bewertungen aber mit der Zeit einfach immer weiter ansteigen, bedeutet das auch, dass sie immer weniger aussagekräftig werden und irgendwann ihren Sinn verlieren.
Für ihre Untersuchung hat sich das Team die Bewertungen auf einem ungenannten Freelancer-Portal angesehen. Und was sich anhand der Zahlen zeigte: Innerhalb von sechs Jahren stieg der Anteil der 5-Sterne-Bewertungen von 33% auf 85%. Zahlen anderer Portale zeigten eine ähnliche Tendenz.
Natürlich könnte es sein, dass die Kunden dieser Portale tatsächlich immer zufriedener wurden. Möglich wäre das zum Beispiel, weil die schlechten Anbieter mit der Zeit keine Chance mehr hatten und aufgegeben haben und nur noch die wirklich guten übrig geblieben sind. Oder die Plattform hat ihre Mechanismen verbessert und bringt nun passendere Kandidaten hervor.
Um dem auf die Spur zu kommen, haben sie die schriftlichen Rezensionen parallel zu den Sterne-Bewertungen ausgewertet. Hier zeigte sich: Die Zufriedenheit in den Texten hat zwar zugenommen, aber bei weitem nicht so sehr wie die Bewertungen nahelegen. Die Forscher gehen davon aus, dass die schriftlichen Kommentare weniger dem Inflations-Phänomen unterliegen. Zum einen, weil man sich schwerer über einen negativen Ton in einem Text beschweren kann als über schlechte Sternebewertungen. Zum anderen, weil der Tenor der schriftlichen Bewertungen nicht in eine Gesamtnote einfließen und so der soziale Druck geringer ist – mehr dazu weiter unten.
Gefällt dir dieser Artikel?
Dann trage dich jetzt ein ins „Update am Montag“ und bleibe über neue Inhalte auf dem Laufenden. Kein Spam! Bereits knapp 2.000 Leser:innen sind dabei.
Eine andere Methode war es, die Nutzer des Portals ergänzend zur öffentlichen Bewertung zu einer „privaten“ Bewertung aufzufordern, die nicht auf der Seite angezeigt wurde. Hier kam heraus: Die privaten Bewertungen verschlechterten sich, während die öffentlichen Bewertungen immer besser wurden.
Wie aber kommt es, dass die Nutzer immer bessere Bewertungen abgeben haben, während sie vielleicht sogar unzufriedener wurden? Das Team sieht dafür in seinem Papier verschiedene Gründe. Einer ist, dass schlechte öffentliche Bewertungen auch Auswirkungen auf einen selbst haben könnten. Wer beispielsweise auf einem Freelancer-Marktplatz laufend schlechte Bewertungen vergibt, erarbeitet sich den Ruf eines problematischen Arbeitgebers, den man vermeiden sollte. Ein anderer Grund kann sein, dass man zwar unzufrieden ist, der Person deshalb aber nicht schaden will und eine Gefälligkeits-Bewertung abgibt. Das zeigte sich, als der untersuchte Freelancer-Marktplatz die „privaten“ Bewertungen in anonymisierter Form doch öffentlich machte. Obwohl weiterhin nicht sichtbar war, welcher Arbeitgeber welche Bewertung abgegeben hatten, stiegen diese nun nur noch teilweise privaten Bewertungen ebenfalls an.
Anzumerken ist hier noch, dass der Marktplatz Vorkehrungen getroffen hatte, damit es keine „Rache-Bewertungen“ geben konnte: Beide Seiten hatten einen bestimmten Zeitraum, um ihre Bewertungen abzugeben. Danach wurden sie gleichzeitig öffentlich gemacht. Gegen die Bewertungs-Inflation hat das allerdings nicht geholfen.
„Wir glauben, dass Reputations-Inflation ein weitverbreitetes Problem ist, da viele Online-Marktplätze dieselben Features einsetzen, die bei dem von uns untersuchten Anbieter zur Inflation geführt haben.“ – aus: „Reputation Inflation“ von Apostolos Filippas, John J. Horton und Joseph M. Golden, März 2018
Letztlich glauben die Autoren der Untersuchung aber, dass das Inflations-Phänomen vor allem bei solchen Marktplätzen stark ausgeprägt ist, wo sich Menschen gegenseitig bewerten und nicht etwa Produkte. Bei Bewertungssystemen für zum Beispiel Filme sehen sie keine Inflations-Gefahr.
Schlusswort
Eine Skala von 1 bis 5 Sternen scheint auf den ersten Blick ein gutes Mittel, um eine große Bandbreite möglicher Meinungen abzubilden. Auf den zweiten Blick zeigt sich, dass das System missverständlich ist, vielfach manipuliert wird und zudem mit der Zeit an Aussagekraft verliert: Es wird oftmals zu einem binären Bewertungssystem für „gut“ (5 Sterne) oder „schlecht“ (alles darunter).
Wer als Unternehmen selbst von solchen Bewertungen abhängig ist, wird zu guter Letzt eine Untersuchung von Davide Proserpio und Georgios Zervas interessant finden: Auf schlechte Bewertungen mit einem eigenen Kommentar zu reagieren, kann einen Einfluss haben. Die Zahl der negativen Rezensionen nimmt demnach in der Folge leicht ab. Allerdings muss man dann damit rechnen, dass das verbleibende schlechte Feedback im Gegenzug ausführlicher wird…
Dieser Artikel gehört zu: UPLOAD Magazin 62
Ihre Reputation im Netz wird immer wichtiger und ist zugleich gefährdeter denn je. Sie kann darüber entscheiden, ob Sie neue Kunden gewinnen und genug Umsatz machen. Sie spielt eine Rolle dabei, wie Suchmaschinen Sie beurteilen. Reputation ist nicht zuletzt ein wichtiges Thema im E-Mail-Marketing: Denn ohne sie kommen Ihre Nachrichten gar nicht erst beim Empfänger an. Das und mehr erfahren Sie in diesem Schwerpunkt. Plus: 10 Ideen für alternative Trafficquellen jenseits von Google.
- Weitere Artikel aus dieser Ausgabe kostenlos auf der Website lesen ...
- Bleib auf dem Laufenden über neue Inhalte mit dem „Update am Montag“ …
Schon gewusst? Mit einem Zugang zu UPLOAD Magazin Plus oder zur Content Academy lädst du Ausgaben als PDF und E-Book herunter und hast viele weitere Vorteile!
Jan hat mehr als 20 Jahre Berufserfahrung als Online-Journalist und Digitalpublizist. 2006 hat er das UPLOAD Magazin aus der Taufe gehoben. Seit 2015 hilft er als CONTENTMEISTER® Unternehmen, mit Inhalten die richtigen Kunden zu begeistern. Und gemeinsam mit Falk Hedemann bietet er bei UPLOAD Publishing Leistungen entlang der gesamten Content-Marketing-Prozesskette an. Der gebürtige Hamburger lebt in Santa Fe, New Mexico.