Das Web, Seiten auf Deutsch, Seiten aus Deutschland

Johannes Beus
Johannes Beus
20. Juli 2007
Johannes Beus
Johannes Beus
Johannes Beus ist Gründer und Geschäftsführer von SISTRIX.
[Die Bilder dieses Beitrags sind leider nicht mehr verfügbar.]

Thomas hat mich gefragt, ob ich eigentlich auch schon mal ausgewertet habe, wie sich die Herkunft der IP-Adresse oder die Top-Level-Domain auf das Ranking bei Google Deutschland auswirken. Hatte ich nicht, ist ein interessantes Thema – hier also die Ergebnisse. Ich habe die Tests jeweils mit den drei Suchmöglichkeiten „das Web“, „Seiten auf Deutsch“ und „Seiten aus Deutschland“ durchgeführt, an den Unterschieben kann man so ein paar interessante Beobachtungen machen.

Suche: Das Web

Zuerst die Auswertung nach Top-Level-Domain. Wie bei den weiteren, folgenden Tests, wurden auch hier 10.000 Keywords genommen und jeweils die ersten 100 Ergebnisse ausgewertet – pro Diagramm also rund 1 Mio. Punkte. Auch hier: Kein Anspruch auf Korrektheit der Daten und der daraus gezogenen Schlüsse erst recht nicht, jeder sollte sich eigene Gedanken machen. Zu sehen ist der Anteil der jeweiligen Top-Level-Domain an den Suchergebnissen auf der jeweiligen Position.

Schön zu sehen, dass der Anteil der Domains recht konstant ist, lediglich auf den ersten Plätzen bricht die DE-Domain ein und CNO (Com/Net/Org) legt deutlich zu. Wenn man dieses Diagramm nun mal so erstellte, dass alle Domains außer Wikipedia.org gewertet werden, sieht man auch warum: Die enorme Stärke von Wikipedia, die ich ja bereits vor ein paar Tagen mal angesprochen hatte, reicht aus, um sogar Auswertungen mit dieser doch recht breiten Datenbasis zu verfälschen. Weder Amazon.com noch ebay.de haben einen so starken Einfluss auf die SERPs wie Wikipedia. Für mögliche Schlüsse aus diesem Diagramm ist das aber ganz praktisch, da man ansonsten, bei dem steigenden Prozentsatz auf die Idee kommen könnte, dass De-Domains einen gewissen Vorteil in den SERPs genießen – Wikipedia.org widerlegt diese Überlegung. Der Vollständigkeit halber und für Statistikfreaks hier noch eine Übersicht über den SERPs-weiten Anteil verschiedener Domains.

Ein zweiter Test zielt auf die Herkunft der IP-Adresse ab. Wie ja vermutlich bekannt, hat jeder Host eine IP-Adresse und diese IP kann dem Land, in dem sie gehostet wird, zuordnet werden. Für den europäischen Raum kümmert sich die RIPE um diese Zuordnung, ich habe also deren Daten verwendet.

Zu International wurden alle die IP-Adressen gezählt, die nicht von der Ripe verwaltet werden. In diesem Fall waren das fast ausschließlich Adressen aus den USA. Auch, wenn auf dem kleinen Diagramm wegen der Skalierung nicht so gut zu sehen, so wird es spätestens beim großen Diagramm oder dem Blick in die Rohdaten deutlich, dass deutsche IP-Adressen häufiger in den vorderen SERP-Rängen vertreten sind, während US-IPs deutlich abfallen. Ob dies nun daran liegt, dass Betreiber von Webseiten mit deutschen IPs generell mehr oder „besseres“ SEO betreiben oder, ob die Herkunft der IP-Adresse im Algorithmus eine Rolle spielt, muss jeder für sich selber entscheiden.

Suche: Seiten auf Deutsch

Während bei der allgemeinen Websuche auch Dokumente gefunden werden können, die nicht in Deutsch verfasst sind, werden bei der Suche nach „Seiten auf Deutsch“ nur eben jene gefunden. Interessant in dem Zusammenhang ist, wie Google die Sprache der Seite feststellt und, ob man durch den Einsatz von Hinweisen auf die richtige Sprache eventuell Vorteile im Ranking erzielen kann. Überprüft wurden hier zum einen HTTP-Header, die auf die Sprache hinweisen („Content-Language“) und zum anderen Meta-Tags.

Zu sehen ist – nichts. Das Setzen der Sprache hat weder im HTTP-Header noch im Meta-Tag Einfluss auf die SERPs. Überraschen dürfte das die wenigsten aber wenn ich die Daten schon mal habe … wie eben wurde hier die Wikipedia übrigens aus der Wertung für die HTTP-Header rausgenomen, hätte die Ergebnisse sonst zu stark verfälscht. Setzen sollte man diese Hinweise allerdings trotzdem, denn hier wurde nur gemessen, ob durch das Setzen ein positiver Effekt auf das Ranking ausgeht. Wenn Google eine Seite gar nicht erst als Deutsch erkennt, weil beispielsweise zu wenig Worte oder zu viel englischer Text vorhanden ist, kommt sie gar nicht erst in diesen Index rein.

Suche: Seiten aus Deutschland

Während es bei dem Index, der hinter der Suche nach „Seiten auf Deutsch“ noch recht einfach ist, zu überlegen, wie man dort reinkommt, wird es bei der Suche nach „Seiten aus Deutschland“ schon schwieriger. Wenn man den Anteil der Seiten mit einer deutschen IP aus dem Index der „Seiten aus Deutschland“ mit dem Prozentsatz der allgemeinen Websuche vergleicht, so sieht man, dass dies anscheinend ein möglicher Faktor für die Aufnahme in diesen Index ist:

Gestützt wird diese Überlegung durch die Tatsache, dass die deutsche Wikipedia, die in den Niederlanden mit einer IP aus den Niederlanden gehostet wird, nicht in diesem Index geführt wird. Dass es noch weitere Faktoren geben muss, die über die Aufnahme in den Index deutscher Seiten entscheiden zeigt, dass eben nicht hundert Prozent der Seiten eine deutsche IP haben. Besonders bei „internationalen“ IP-Adressen wie denen aus den USA und einer De-Domain ist häufig zu beobachten, dass sie in den Index rutschen. Eine andere Überlegung geht in die Richtung, dass die Herkunft der Links, die auf die Seite zeigen, einen Einfluss hat. Nach Rücksprache mit dem Server, der diese Statistiksachen auswertet und einem Blick auf das Thermometer werden ich derzeit allerdings davon absehen, das auszuwerten – wären bei nur 100 untersuchten Backlinks pro Seite dann 100 Millionen Daten, nichts für 30°C.

Zusammenfassung

Wenig überraschend ist das Thema nicht so einfach und lässt sich nicht mit den beliebten Digg-Top-10-Listen lösen. Die Empfehlung, möglichst viele der Signale, die Google über die Herkunft der Seite unterrichten korrekt einzustellen ist wohl das Beste, was derzeit gemacht werden kann. Die Top-Level-Domain scheint dabei keine große Rolle zu spielen, die Sprache, HTTP- und Meta-Header auf Deutsch zu stellen, tut jedoch keinem weh und kann unterstützend wirken. Auch ist es anscheinend sinnvoll, einen Provider, der IP-Adressen aus dem jeweiligen Land zur Verfügung stellt, auszuwählen. Für die Zukunft wäre es interessant, die Auswirkung der Herkunft der Links einer Seite auf ihr Ranking zu untersuchen, allerdings fallen dabei nicht unerhebliche Datenmengen an.

Ähnliche Beiträge
Kommentare
Tristan Hahner   
21. Juli 2007, 17:18

Sehr interessant diese Auswertung!

Christian Schmidt   
21. Juli 2007, 20:45

Hast du dir ja mal wieder echt Mühe gemacht. Wobei mich die Ergebnisse nicht gerade überrascht haben.

Johannes   
21. Juli 2007, 22:58

Christian, umso besser. Dann musst du dir ja keine Arbeit machen und eventuell Dinge umstellen 🙂 Aber hast recht, das hat in etwas as bestätigt, was ich bislang auch vermutet habe, nur ab und an schön, sowas nochmal zu hinterfragen.

Andreas Schneider   
22. Juli 2007, 11:47

Sehr Interessant – die Frage ist jedoch, wieviel Prozent der Google-Nutzer überhaupt den Schalter von „web“ auf „Seiten auf Deutsch“ oder „Seiten aus Deutschland“ setzen – ich vermute mal, dass der recht gering ist. Ich selbst schalte praktisch nie um…..

Xel   
22. Juli 2007, 13:49

Wer den Schalter umsetzt, ist wirklich so ne Frage…

Die andere Frage ist die nach der „Standardeinstellung“ – also der Einstellung, die die User normalerweise verwenden.

Dazu währe es auch nützlich zu wissen, wie viele User die Googlesuchfelder ihres Browsers verwenden.

Mein Opera z.B. sucht per Standard nach „Seiten auf Deutsch“ was den Anteil an Suchen auf Deutsch durchaus in die Höhe treiben könnte (nicht wegen mir, aber es gibt ja noch ein paar mehr Opera Nutzer und möglicherweise gibts solche voreinstellungen ja auch bei anderen Browsern)

Gruß
Alex

uweselbst   
23. Juli 2007, 17:40

bei einer normalen Anfrage wird kaum ein User auf „Seiten aus Deutschland“ stellen … nur bei Keywords die selten und es deshalb wohl wenig Ergebnisse bringen … aber das wird bei umkämften Keywords nie passieren, deshalb braucht man da auch kein Auge drauf zu haben … mir fällt da spontan die PC Richtung ein, da nutze ich manchmal diese Funktion, wenn ich Treiber suche oder so …

mich würde echt mal interessieren, wie du diese Daten sammelst?

mfg

pinseeker   
25. Juli 2007, 11:14

Hi zusammen,

ehrlich gesagt würde mich die letzte Frage von „uweselbst“ ebenfalls interessieren, da ich häufig Keywordanalysen bei Google durchführen muss. Hierzu bin ich neben den freien Tools wie ranking-check auch auf händische Umsetzung angewiesen. Ist eine Analyse mit derartigem Umfang, wie sie hier durchgeführt worden ist mit freeware zu automatisieren oder werden dafür tatsaächlich kostenpflichtige SEO Tools eingesetzt? Wie genau sind die Daten? Also sind die Positionen wirklich tagesaktuell oder wie bei ranking-check manchmal abweichend? …

Mit besten Grüßen

Matty

uweselbst   
26. Juli 2007, 16:20

das passiert auf jeden fall automatisch, der aufwand per hand wäre ansonsten viel zu groß … ich tippe mal auf ein „kleines“ programm, einen eigenen kleinen googlebot, der selbstständig die serps absucht, die seiten besucht und sie auf gewisse merkmale hin untersucht …

pinseeker   
31. Juli 2007, 16:16

Letztendlich ist mir schon klar, dass dieser Vorgang automatisiert abläuft, aber mich würde weiterhin interessieren, wie man soetwas umsetzen kann. Wie aufwändig ist die Programmierung, gibt es sowas als Tool / Onlinetoole, etc.? Wer kann mir da weiter helfen?

VG

matty

Anonymous   
11. August 2007, 17:20

Uweselbst und Pinseeker, für diese Auswertungen setzte ich eigene Software ein. Da wir für Kunden sowieso häufig vielen an Daten erheben und auswertgen müssen, haben wir mittlerweile eine recht breite Basis an Software, Tools und Scripten. Die passe ich dann etwas der jeweiligen Anforderung an und fertig 🙂

Die Kommentarfunktion wird 30 Tage nach der Veröffentlichung des Beitrags deaktiviert.

Kostenlosen Testaccount jetzt aktivieren

Aktiviere jetzt deinen kostenlosen Testaccount für die SISTRIX Toolbox. Garantiert ohne Kosten und unverbindlich. Jetzt aktivieren!