Duplicate Content

Unter Duplicate Content versteht man doppelte Inhalte, die über mehrere URLs erreichbar sind. Dieser Duplicate Content sollte unbedingt vermieden werden. Der Inhalt einer Seite darf immer nur über eine eindeutige URL erreichbar sein. Duplicate Content stellt Google vor das Problem, welche URL in den Rankings angezeigt werden soll und welche positiven Rankingsignale welcher URL zugeordnet werden.

Was ist Duplicate Content?

Unter Duplicate Content (engl. für „doppelter Inhalt“), oft auch als „DC“ abgekürzt, ist das Vorhandensein von identischen Inhalten auf einer oder mehreren Websites zu verstehen. Man unterscheidet zwischen internem Duplicate Content und externem Duplicate Content.

Interner Duplicate Content kann schon alleine dadurch entstehen, dass identische Inhalte auf der eigenen Website unter mehreren URLs vorhanden ist – zum Beispiel durch die Parameter eines Filters, die in der URL stehen.

Externer Duplicate Content kann auftreten, wenn eine Website in mehreren Sprachversionen verfügbar ist, jedoch mit mehr als einer Sprachversion auf dem gleichen Suchmarkt (z. B. google.de) in den Suchergebnissen auftaucht.

Unterschied: Interner und externer Duplicate Content

Interner Duplicate Content beschränkt sich auf die eigene Domain / Hostnamen.

Externer Duplicate Content ist domainübergreifend, tritt also unter zwei oder mehreren Domains auf.

Beispiel internen Duplicate Contents

Häufig haben z. B. Onlineshops mit internem Duplicate Content zu kämpfen. Oft sind Produkt-Detailseiten auch ohne zugehörige Kategorie- und/oder Produktseite direkt aufrufbar:

  • http://www.onlineshop-domain.com/kategorie/produktseite/produktdetailseite
  • http://www.onlineshop-domain.com/produktdetailseite

Gerne werden diese Inhalte dann von Suchmaschinen indexiert, falls von extern auf beide URLs verlinkt wurde. Inkonsistente bzw. eine nicht einheitliche interne Verlinkung ist ebenfalls ein Grund dafür.

Beispiel externer Duplicate Content

Viele Websites sind über mehrere Domainnamen erreichbar. Daran ist auch nichts verkehrt, solang alle anderen Domainvarianten mittels einer 301-Weiterleitung auf die entsprechende Hauptdomain verweisen.

Ist dem nicht so, gibt es für Google unterschiedliche Domains, welche den gleichen Inhalt bieten. Das erschwert dem Google-Bot die Relevanzbestimmung der unterschiedlichen Seiten und kann für die Website zu Ranking-Problemen führen.

Sichtbarkeitsverläufe für 4 Domains, die alle den gleichen Inhalt bieten. Es gibt immer wieder Zeitpunkte an denen Google sich entscheidet eine andere der Domains in den Ergebnissen anzuzeigen. Drei Verläufe wechseln sich ab.
Sichtbarkeitsverläufe für 4 Domains, die alle den gleichen Inhalt bieten. Es gibt immer wieder Zeitpunkte an denen Google sich entscheidet eine andere der Domains in den Ergebnissen anzuzeigen. Drei Verläufe wechseln sich ab.

Augenscheinlich ist die Domain radio-sws.de die gewünschte Hauptdomain. Die Inhalte der Website radio-sws.de sind in identischer Form auf drei weiteren Domains zu finden. So entsteht externer Duplicate Content aufgrund mehrerer Domainnamen einer Website. Google ist sich nicht immer sicher, welche der vier Domains zu den Themen relevant ist und rankt abwechselnd die eine sowie die andere Seite.

Was Duplicate Content nicht ist

Liegt ein Inhalt in mehreren Sprachversionen vor, so wird dies nicht als Duplicate Content gewertet. Auch Zitate oder zitierte Textpassagen werden nicht als Ducplicate Content identifiziert.

Bei der Zitierung von Inhalten sollte jedoch auf die korrekte semantische Auszeichnung im Quelltext geachtet werden:

<blockquote>Hier steht der zitierte Text - <cite>Hier steht der Name des zitierten Autors oder der Quelle</cite></blockquote>

Ist Duplicate Content ein Problem?

Ja! Doppelte Inhalte sind nicht einzigartig und liefern Nutzern keinen Mehrwert. Aus Sicht von Google kann Duplicate Content in einigen wenigen Fällen sogar einem Betrugsversuch gleichkommen, wenn Texte von anderne Webseiten ohne Lizens abgeschrieben werden.

DC behindert Google in ihrem Bestreben, das bestmögliche Ergebnis für den User zu finden. Aus diesen Gründen sollte Duplicate Content von Webmastern ernst genommen werden.

Duplicate Content kann für Schwankungen in den SERPs (Suchergebnisseiten), also den Rankings einer Webseite, verantwortlich sein. Für Google ist nämlich nicht klar ersichtlich, welche Seite nun den relevantesten Inhalt für eine gestellte Suchanfrage bietet – so können die Ziel-URLs in den Suchergebinssen munter wechseln.

Google versucht Duplicate-Content-Probleme selbst zu lösen

Google versucht, Duplicate Content selbst zu identifizieren und entscheidet eigenständig, welcher Inhalt am relevantesten für die vom User gestellte Suchanfrage ist – und spielt dieses Ergebnis in den SERPs aus.

Bei der vorangegangenen Indiexierung der Inhalte versucht Google ebenfalls die bestmögliche Version (URL) der doppelten Inhalte zu identifizieren und indexiert nur diese – sofern möglich.

Sind die Rankings und der Traffic einer Website trotz eines bestehenden DC-Problems und schwankender indexierten Seitenzahlen konstant, ist das Duplicate-Content-Problem für die Performance der Website erst einmal nicht bedrohlich.

Die eigene Website auf Duplicate Content überprüfen

Der SISTRIX Optimizer bietet eine automatisierte OnPage-Analyse Deiner Websites und zeigt alle SEO-relevanten Fehler und Hinweise auf. Erläuterungen eines jeden Fehlertyp und konkrete Handlungsanweisungen komplettieren den Einstieg in die OnPage-Optimierung.

Inhalte, die doppelt vorhanden sind, legt der SISTRIX Optimizer detailliert für jede einzelne URL dar.

Fehler aus dem SISTRIX Optimizer, der automatisiert auf Duplicate Content hinweist.
Fehler aus dem SISTRIX Optimizer, der automatisiert auf Duplicate Content hinweist.

In der kostenlosen Testphase der SISTRIX Toolbox hast du Zugang zu allen Toolbox-Modulen – darunter auch zum Optimizer, der deine Webseite unter anderem auf Duplicate Content untersucht. Teste den SISTRIX Optimizer kostenlos in der zweiwöchigen Probephase – ganz ohne versteckte Kosten oder Abo.

Was sagt Google?

Google ist sehr darum bemüht, Seiten mit unterschiedlichen Informationen zu indizieren und anzuzeigen. (...) In den seltenen Fällen, in denen wir annehmen müssen, dass duplizierter Content mit der Absicht angezeigt wird, das Ranking zu manipulieren oder unsere Nutzer zu täuschen, nehmen wir die entsprechenden Korrekturen am Index und Ranking der betreffenden Websites vor. Infolgedessen werden diese Websites unter Umständen in den Suchergebnissen niedriger eingestuft oder sogar aus dem Google-Index entfernt und damit nicht mehr in den Suchergebnissen angezeigt.

Quelle: Google-Search-Console-Hilfe

Unser Google-Fazit

Aus Sicht von Google liefert Duplicate Content Nutzern keinen Mehrwert und kann sogar als Spam eingeordnet werden, wenn Texte einfach von anderen Seiten kopiert werden. Die Duplikate behindern Google im Bestreben, das bestmögliche Ergebnis für den User zu finden. Externer Duplicate Content führt zwar nicht immer und schon gar nicht sofort zu einer Abstrafung durch Google, jedoch kann ein andauerndes DC-Problem nachhaltig der Website schaden.

Video: Was ist Duplicate Content und warum sollte dieser vermieden werden?

Weitereführende Informationen zu diesem Thema

Google

SISTRIX

Steve Paine
29.02.2024