Alexa – Hokuspokus oder brauchbare Daten?

Die Daten von Alexa scheinen seit einiger Zeit wieder eine Renaissance zu erleben. Nachdem jahrelang ziemliche Ruhe um diese höchst umstrittenen Besucherzahlen war, sehe ich sie jetzt häufiger in Blogpostings und es soll sogar schon Leute gegeben haben, die sich an die Optimierung dieser Kenngröße gewagt haben – höchste Zeit also, mal zu gucken, was es damit auf sich hat. Was macht Alexa eigentlich? Alexa wurde bereit 1996 gegründet und gehört seit 1999 zu Amazon. Als Anbieter der Alexa-Browser-Toolbar werden Informationen zu Webseiten gesammelt, die User dieser Toolbar besuchen. Alexa errechnet daraus jetzt eine Rangfolge, den Alexa-Traffic-Rang. Dabei steht die Seite mit den meisten Besuchen auf Position eins, je weniger Besucher eine Seite hat, desto größer wird dieser Wert.

Wie genau sind die Daten?
Allerdings ist in der Vergangenheit immer wieder die Frage aufgekommen, wie zuverlässig diese Daten überhaupt sind. Peter Norvig hat beispielsweise die Alexa- sowie reale Besucherzahlen einiger Seiten, von denen er diese Daten hatte verglichen und ist zu dem Ergebnis gekommen, dass die Zahlen mit gebotener Vorsicht zu genießen sind. Die Idee, reale und Alexazahlen zu vergleichen ist gut und da einige größere Counterdienste dankenswerterweise öffentliche Toplisten führen, habe ich das für rund 1000, bunt gemischte deutsche Seiten gemacht. Im folgenden Diagramm wurde der durchschnittliche Alexa-Traffic-Rang für Intervalle von realen, als durch den Counterdienst gezählten, Besuchern aufgetragen.

imagenotfound
Wie man sieht, scheint der Traffic-Rang eher einer Zufallsfunktion als einer verlässlichen Grundlage zu entstammen und keine Beziehung zu den wirklichen Zahlen aufzuweisen – allenfalls bei sehr gut besuchten Seiten mit über 40.000 Visits pro Tag scheint die Tendenz des Traffic-Rangs in die richtige Richtung zu gehen.

Garbage in, Garbage out?
Das Problem von Alexa besteht im systematischen Fehler, der bereits bei der Sammlung der Daten gemacht wird. Jeder, der will, kann sich die Alexa-Toolbar installieren und damit zu den Alexadaten beitragen – dabei erfolgt keine Kontrolle, ob die zuliefernden Toolbars überhaupt ein realistisches Abbild der Internetteilnehmer darstellen. So hat sich in der Vergangenheit gezeigt, dass gerade SEOs und Webentwickler die Toolbar installiert haben und die Statistik somit stark verfälschen. Abakus wird derzeit etwa auf Position 1.250 geführt, dieses Blog bei rund 50.000. Beides Positionen, die die Realität nicht im Geringsten wiederspiegeln. Heißt das nun, dass man die Alexadaten komplett vergessen kann? Am einfachsten wäre es, leider bietet sonst kein kostenloser Dienst bessere Daten an. Wenn man jetzt um die Probleme bei der Datenerhebung weiß und sie bei der Auswertung entsprechend berücksichtigt, so kann man trotzdem häufig Aussagen aus den Alexazahlen ziehen. So ist der Graph hier rechts ein Vergleich von zwei Preisvergleichsportalen über das letzte Jahr. Beide dürften in etwa den gleichen Mix aus Besuchern haben und bleiben somit, zu mindestens grob, vergleichbar. Auch die Entwicklung der Besucher einzelner Seite kann sich häufig bei Alexa ablesen lassen.

Ähnliche Beiträge