Pagination als Gefahr für internen Duplicate Content

Johannes Beus

(Autor)

Veröffentlicht: 18.06.2007

Blog- und Content-Management-Systeme wie WordPress oder auch Ruby on Rails verteilen Content, der nicht auf eine Seite passt üblicherweise auf mehrere Seiten und bieten dann unten, am Ende der Seite eine Navigation über Seitenzahlen an. Was für den Benutzer praktisch und übersichtlich ist, kann für Suchmaschinen zum Problem werden. Würde ich beispielsweise ein WordPress-Blog einsetzen, so wäre dieser Text unter folgenden Seiten zu erreichen.

Wie zu sehen ist, wird der Orginalcontent auf einer große Anzahl weiterer Seiten veröffentlicht. Wenn man sich nur mal ansieht, wie viel WordPress-Blogs die genannte Seite „/page/2“ im Googleindex haben, so wird das Ausmaß des Problems schnell deutlich. Verschärfend kommt hinzu, dass – wie Gerald es so schön formuliert hat – der Googlebot zu keiner Zeit einen aktuellen Überblick über die ganze Webseite hat. Ein Artikel, der eben noch auf der Startseite war, kann kurz später bereits auf der zweiten Seite erscheinen und verwirrt den Suchmaschinencrawler so nur noch mehr.

Natürlich ist es so, dass Suchmaschinen, allen voran Google, mit dem Problem mittlerweile gut umgehen kann und die Erkennung der URL des Orginalcontents recht zuverlässig gelingt. Da es bei Suchmaschinenoptimierung – der Name verrät es bereits – aber nicht darum geht, irgendwie weiterzukommen, sondern möglichst die optimale Lösung zu finden, sollten Webseitenbetreiber, die sich mit dem Problem konfrontiert sehen, um eine Lösung bemühen. In diesem Blog ist es beispielsweise so gelöst, dass nur auf der Startseite des Blogs die jeweils 10 aktuellen Beiträge vorhanden sind, ansonsten ist der Content nur unter einer URL zu finden. Die Seiten des Archives oder der Tags verlinken lediglich die Überschrift auf die URL.

Johannes Beus

(Autor)

Veröffentlicht: 18.06.2007