Probleme der Backlink-Analyse

Backlinks, also eingehende Links sind bei allen aktuellen Suchmaschinen in der ein‘ oder anderen Form Hauptrelevanzkriterium für die Sortierung der Ergebnislisten. Verständlich also, dass ein großer Anteil der SEO-Arbeit üblicherweise ebenfalls auf diesen Bereich entfällt. Während man die Backlinks von eigenen Projekten relativ einfach und komplett über den CSV-Export der Google-Webmastetools oder Auswertung der Referrer-Informationen seiner Serverlogfiles erhält, ist dies bei Konkurrenzprojekten nicht möglich. Häufig wird dabei zu sogenannten „Backlink-Checkern“ gegriffen. Die Aufgabe dieser Tools ist es, mögliche Quellen für Backlink-Informationen abzufragen und die erhaltenen Daten aufzubereiten.

Da wir intern eine selber entwickelte Lösung zurückgreifen und eine Teilmenge davon vor ein paar Wochen auch öffentlich verfügbar gemacht haben, habe ich mir einige Gedanken zu solchen Tools gemacht. Ich glaube, dass auch reine Anwender um Möglichkeiten und Limitationen der Tools wissen sollten, um die Ergebnisse richtig zu deuten.

Das größte Problem aller Backlink-Checker ist die Beschaffung der zugrundeliegenden Daten. Der naheliegenste und auch am häufigsten beschrittene Weg zur Beschaffung dieser Daten ist es, Suchmaschinen abzufragen. Waren diese früher noch recht großzügig bei der Darstellung der Daten, hat sich das in den letzten Jahren deutlich geändert: Google zeigt, wenn überhaupt, eher unbrauchbare Links ans, MSN hat seine (ehemals exzellente) Backlink-Abfrage komplett abgeschaltet, bleibt von den drei Großen nur noch Yahoo übrig. Yahoo vermeldet zwar eindrucksvolle Zahlen (~340.000 Backlinks für sistrix.com), zeigt davon aber maximal 1.000 Backlinks an – gut möglich, dass die relevanten Backlinks, die für das Ranking der Domain verantwortlich sind, hierbei nicht zu sehen sind. Problematisch ist nun, dass alle folgenden Berechnungen von Domain- oder IP-Popularität, PageRank oder sonstiger Kennzahlen lediglich auf den Links aufbauen können, die das Tool auch wirklich kennt.

Um die Datenbasis etwas zu verbreitern gibt es unterschiedliche Herangehensweisen. Eine davon ist, zusätzlich zu den Yahoo-Daten noch weitere Suchmaschinen abzufragen und alle zurückbekommenen Links zusammenzuwerfen. Das Problem dabei ist, dass die Zahl der wirklich existierenden, unterschiedlichen Indizes doch deutlich geschrumpft ist. Es gibt zwar eine Vielzahl Frontends, dahinter steckt in den meisten Fällen dann allerdings doch wieder der Index von Google, Yahoo oder MSN. Wir haben uns deswegen und wegen der Vermutung, dass dies in Zukunft nicht besser wird dazu entschlossen, einen eigenen Backlink-Index für das deutschsprachige Internet aufzubauen. Ein eigener Crawler durchsucht (für uns relevante) Teile des Internets und bastelt draus eine Datenbank mit Verlinkungs-Informationen. Dieser Index ist zwar noch in seinen Anfängen, funktioniert aber größtenteils schon recht gut. Für gut verlinkte Seiten wie beispielsweise wikipedia.org bekommen wir so deutlich mehr Backlinks, als Yahoo oder andere Suchmaschinen liefern (wollen). Bei weniger gut verlinkten Seiten sieht es da zwar noch nicht ganz zu gut aus, ich denke aber, dass wir da in den nächsten Monaten deutlich Fortschritte sehen werden.

Ein weiteres Problem aller öffentlich verfügbaren Backlink-Checks ist die Skalierbarkeit. Mögen Suchmaschinen zehn oder zwanzig Linkabfragen noch ohne weiteres mitmachen, so sieht das bei einigen tausend oder gar zehntausenden, die ein beliebter Backlink-Check pro Tag macht, schon deutlich anders aus. Hier muss der Betreiber sich also Möglichkeiten überlegen, dies zu bewerkstelligen – in den meisten Fällen technisch und finanziell durchaus nicht ganz ohne. Noch deutlich schwieriger wird es, wenn man nicht nur Backlinks, sondern zu allen gefundenen Backlinks noch weitere Informationen externen Quellen wie beispielsweise den GooglePageRank oder den Alexa-Rank anzeigen möchte. Hier kann die Zahl der Abfragen für eine einzige Backlinklink-Abfrage schnell in die tausende gehen – Grund für uns, diese Erweiterungen nicht öffentlich und für jeden zugänglich anzubieten.

Ähnliche Beiträge