Kanonische Adressen

Johannes Beus
Johannes Beus
27. Februar 2008
Johannes Beus
Johannes Beus
Johannes Beus ist Gründer und Geschäftsführer von SISTRIX.

In der Theorie ist es ganz einfach: Jede Seite hat exakt eine URL, unter der sie erreichbar ist. In der Praxis sieht es leider häufig anders aus. So sind Startseite von Webprojekten meist sowohl unter http://example.org/ als auch http://example.org/index.html und häufig auch noch unter verschiedenen Hostnamen erreichbar. Suchmaschinen wie Google wissen natürlich um dieses Problem und versuchen, diese verschiedenen URLs möglichst gut zu einer zusammenzufassen.

Wieso erzählt der Onkel mir das jetzt, ist doch nichts Neues? Auch, wenn die Qualität der Produkte von Google überdurchschnittlich gut sind, so passieren auch dort ab und an Fehler. Und manchmal lassen die Fehler interessante Schlussfolgerungen zu. So ist bei den PageRank-Abwertungen, die vergangenen Oktober begannen, ja bereits häufig gemutmaßt worden, dass lediglich der angezeigte PageRank der Google-Toolbar herabgesetzt wurde, Google intern allerdings weiterhin mit dem „richtigen“ PageRank arbeite. Diese Überlegung wurde dadurch gestützt, dass es im Ranking und weiteren Hinweisen, die bei einem deutlichen Abfall des PageRanks eigentlich hätten leiden müssen, keine Veränderung gab. Ganz vorne mit dabei bei den abgewerten Seiten war das Blog von Robert Basic, erreichbar unter www.basicthinking.de/blog/. Die Server, die den PageRank für die Toolbar ausliefern zeigen hier nur noch einen PR3 statt des ursprünglichen PR6 an. Wenn man allerdings den letzten Slash in der URL weglässt und den PageRank für diese URL anzeigen lässt, sieht man noch immer den eigentlichen PageRank von 6. Das funktioniert übrigens auch beim von PR7 auf PR5 herabgesetzten Telepolis von Heise. Da scheint es noch Abstimmungsbedarf über den „korrekten“ PageRank zu geben …

Ähnliche Beiträge
Kommentare
Markus   
27. Februar 2008, 14:08

Okay, du hast recht: Bei einigen Seiten funktioniert es wirklich. Bei einem bekannten System zum Usertracking stimmt dies nicht. Jetzt ist die Frage, ob die im Gegensatz zu Robert Basic etc. im Ranking Einbußen hinnehmen mussten.

Johannes   
27. Februar 2008, 14:11

Markus, meinst du Etracker? Wo hast du es da denn ausprobiert? Letztendlich funktioniert dieser „Trick“ ja nur, wenn die abgewertete Seite in einem Unterordner lag. Der Google PageRank-Alo verschafft der Version ohne Slash dann den gleichen PR wie der mit, bei der Anzeige des runtergsetzten PageRanks scheint man diesen Teil allerdings vergessen zu haben.

Emanuel   
27. Februar 2008, 16:51

Das verstehe ich jetzt nicht ganz!? Die Startseite ist doch eine Datei die im www-Verzeichnis steht und es lässt sich doch nunmal nicht verhindern, dass diese dann mit 2 URLs aufgerufen werden kann!?
Habe ich da was verpasst oder war das nur ein abstraktes Beispiel?

Olaf   
27. Februar 2008, 19:31

Ich würde mal sagen dass damit klar ist, dass es scheinbar einmal eine automatische Datenbank gibt mit den berechneten Pagerank-Werten und zusätzlich eine Form von Overlay-Datenbank, die für entsprechende Urls den berechneten Pagerank beeinflusst (z.B. -2) oder direkt überschreibt. Scheinbar matched diese zweite, manuelle Datenbank exakt auf die Url, wodurch bei http://www.heise.de/tp/ der Abwertungseintrag greift, bei http://www.heise.de/tp jedoch der berechnete Pagerank greift. Da /tp ein 301 auf /tp/ ist, spart man sich damit alle Urls quasi doppelt in der manuellen Datenbank aufzunehmen.

Stefan   
28. Februar 2008, 16:01

Emanuel,
es nicht primär darum, dass ein Inhalt mit verschiedenen URLs abrufbar ist, sondern vielmehr darum, dass die Website selbst auf beide Versionen verlinkt. Wenn du konsequent immer nur auf example.org verlinkst und nie auf example.org/index.html, wird Google letzteres auch nie aufnehmen – denn dann müsste Google raten, wie die Datei heißen könnte. index.html ist ja kein muss, es könnte ja auch default.aspx heißen. Und wenn wir gar an CMS und/oder mod_rewrite denken, ist sowieso alles nochmals ganz anders …

Ralph   
26. März 2008, 13:45

@Stefan: Danke für die Antwort auf die Frage von Emanuel. Ich habe die selbe Frage gehabt wie er und auf Grund Deiner Antwort habe ich den Unterschied verstanden.

Ich werde also in Zukunft genauer acht geben, wohin ich verlinke innerhalb einer Website 😉

Aus dem sonnigen Dresden grüssend

Ralph

Die Kommentarfunktion wird 30 Tage nach der Veröffentlichung des Beitrags deaktiviert.

Kostenlosen Testaccount jetzt aktivieren

Aktiviere jetzt deinen kostenlosen Testaccount für die SISTRIX Toolbox. Garantiert ohne Kosten und unverbindlich. Jetzt aktivieren!