Kanonische Adressen

In der Theorie ist es ganz einfach: Jede Seite hat exakt eine URL, unter der sie erreichbar ist. In der Praxis sieht es leider häufig anders aus. So sind Startseite von Webprojekten meist sowohl unter http://example.org/ als auch http://example.org/index.html und häufig auch noch unter verschiedenen Hostnamen erreichbar. Suchmaschinen wie Google wissen natürlich um dieses Problem und versuchen, diese verschiedenen URLs möglichst gut zu einer zusammenzufassen.

Wieso erzählt der Onkel mir das jetzt, ist doch nichts Neues? Auch, wenn die Qualität der Produkte von Google überdurchschnittlich gut sind, so passieren auch dort ab und an Fehler. Und manchmal lassen die Fehler interessante Schlussfolgerungen zu. So ist bei den PageRank-Abwertungen, die vergangenen Oktober begannen, ja bereits häufig gemutmaßt worden, dass lediglich der angezeigte PageRank der Google-Toolbar herabgesetzt wurde, Google intern allerdings weiterhin mit dem „richtigen“ PageRank arbeite. Diese Überlegung wurde dadurch gestützt, dass es im Ranking und weiteren Hinweisen, die bei einem deutlichen Abfall des PageRanks eigentlich hätten leiden müssen, keine Veränderung gab. Ganz vorne mit dabei bei den abgewerten Seiten war das Blog von Robert Basic, erreichbar unter www.basicthinking.de/blog/. Die Server, die den PageRank für die Toolbar ausliefern zeigen hier nur noch einen PR3 statt des ursprünglichen PR6 an. Wenn man allerdings den letzten Slash in der URL weglässt und den PageRank für diese URL anzeigen lässt, sieht man noch immer den eigentlichen PageRank von 6. Das funktioniert übrigens auch beim von PR7 auf PR5 herabgesetzten Telepolis von Heise. Da scheint es noch Abstimmungsbedarf über den „korrekten“ PageRank zu geben …

Ähnliche Beiträge